KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
Introdução
O Grupo de Estudos e Pesquisas em Linguística Teórica e Experimental (GEPEX) foi
fundado na Universidade Federal Fluminense (UFF) no segundo semestre de 2009. Já no ano
seguinte, o grupo foi cadastrado junto ao Diretório dos Grupos de Pesquisa no Brasil (CNPq) e
vinculado à linha de Teoria e Análise e Linguística do Programa de Pós-Graduação em Estudos
de Linguagem, da UFF. Em 2015, O GEPEX vinculou-se também ao Programa de Pós-
Graduação em Letras e Linguística (PPLIN), da Faculdade de Formação de Professores da
Universidade do Estado do Rio de Janeiro (UERJ/FFP). Desde então, o grupo vem realizando
pesquisas conduzidas por seus professores membros efetivos e colaboradores, com
financiamento de diferentes órgãos de fomento, como CNPq, CAPES, FAPERJ e PROPPI (Pró-
reitora de Pesquisa, Pós-Graduação e Inovação, da UFF), bem como vem investindo fortemente
na formação de novos pesquisadores, desde a iniciação científica até os estágios de pós-
doutoramento, contemplando também alunos e alunas de mestrado e de doutorado.1
A principal metodologia de pesquisa adotada nos trabalhos conduzidos no GEPEX é a
experimentação. Trata-se de uma robusta abordagem metodológica que permite a formulação
e o teste empírico de previsões comportamentais decorrentes de alguma teoria ou de algum
modelo linguístico específico. É por isso que o GEPEX se interessa tanto por trabalhos teóricos,
mais abstratos e vinculados a diferentes questões da sintaxe e da semântica formais, quanto por
trabalhos empíricos, de natureza experimental e etnográfica, voltados para diversos tópicos de
pesquisa. O principal objetivo do grupo é, portanto, conjugar questões teóricas da linguística e
metodologias experimentais da psicologia cognitiva.
Todos os membros do GEPEX estão felizes com a oportunidade de fazer parte da
presente coletânea de textos. Aqui, em nosso capítulo, serão apresentadas noções necessárias e
suficientes para o delineamento básico de uma pesquisa experimental em linguística. Trata-se
de um material de iniciação à metodologia experimental, destinado, em especial. aos mais novos
estudantes do GEPEX e, em geral, àqueles que desejarem integrar-se a algum grupo brasileiro
de pesquisa experimental em linguagem. Uma versão menor e simplificada do presente texto
foi publicada em Kenedy (2015). A publicação atual, em sua versão completa, se presta a uma
(ainda tímida) tentativa de divulgação, em língua portuguesa, de conteúdo destinado à formação
de novos experimentalistas. Infelizmente, os principais manuais de pesquisa experimental na
área da linguagem nunca foram traduzidos para o português e permanecem acessíveis apenas a
alunos de Pós-graduação com boa leitura em inglês (ex. CARREIRAS & CLIFTON JR., 2004;
FERNANDEZ & CAIRNS, 2011; TRAXLER, 2012; entre outros). Iniciativas desta natureza
em terra brasilis, ainda que louváveis, como Maia & Finger (2005) e Maia (2015), são ainda
poucas e esparsas – fato que motiva esta publicação.
O capítulo está organizado em cinco seções. Na primeira, é apresentada a lógica de uma
pesquisa experimental, com a indicação das motivações teóricas que derivam certas previsões
comportamentais a serem levadas a teste num experimento qualquer. Na segunda seção, são
detalhadas as oito etapas fundamentais no delineamento de uma pesquisa experimental: seleção
da técnica de experimentação, definição da tarefa do experimento, delimitação das variáveis da
pesquisa, estabelecimento das condições experimentais, tratamento dos estímulos linguísticos,
distribuições dos participantes em condições experimentais, aplicação do experimento e análise
estatística dos resultados. Na seção três, descreve-se um exemplo prático dos conteúdos
expostos na seção anterior: dois experimentos conduzidos no GEPEX, durante a tese de
doutoramento de Dias (2015). Na quarta seção, são apresentadas as áreas atuais da linguística
que vêm empregando técnicas experimentais em seu desenvolvimento científico. A seção final,
1 Queria visitar www.gepex.org para uma descrição completa das publicações de seus professores e dos trabalhos
de IC, mestrado e doutorado desenvolvidos no grupo desde 2009.
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
de número cinco, apresenta ao leitor um conjunto de sugestões de leitura para aprofundamento
no tema pesquisa experimental em linguística.
1. A pesquisa experimental
Uma pesquisa experimental deve eleger como objeto de estudo um fenômeno linguístico
que possa ser contemplado, de alguma forma, em sua dimensão cognitiva. Como,
essencialmente, um paradigma experimental engendra dados empíricos de natureza
comportamental, assume-se que tais dados decorram da representação e do processamento
linguísticos existentes na mente dos participantes de uma tarefa experimental qualquer. Isso
quer dizer que a pesquisa experimental é capaz de investigar a realidade psicológica das
representações e dos processos linguísticos em uma língua natural. Na verdade, é provável que
um grande número de teorias linguísticas independentes se interesse pelo substrato cognitivo
da linguagem humana, afinal “se a estrutura linguística é um fenômeno eminentemente mental,
então realidade psicológica é condição sine qua non para uma teoria linguística assumir
qualquer valor” (DERWING & ALMEIDA, 2005: 404). Por essa razão, é possível que
gerativistas, funcionalistas, sociocognitivistas etc. realizem pesquisas experimentais, de acordo
com seus interesses teóricos particulares.
Com efeito, a pesquisa experimental não se limita à simples captura da realidade
psicológica de problema linguístico isolado. Muitas vezes, pode haver, nos estudos de uma
língua específica, propostas descritivas diferentes ou francamente opostas na interpretação de
um dado fenômeno. Nesses casos, a experimentação pode ser um recurso capaz de pôr à prova
as previsões de cada uma dessas propostas alternativas, de modo a verificar em favor de qual
delas os dados obtidos em situação experimental se encaminham. Tal testagem experimental se
torna possível quando tais propostas alternativas permitem a elaboração de previsões
comportamentais, como índices de acerto/erro numa tarefa, tempo de resposta a um estímulo,
padrão de escaneamento visual durante a leitura, percentual de aceitação ou rejeição de uma
estrutura etc.
A lógica da exploração experimental de certas previsões comportamentais assenta-se no
método científico proposto por Popper (1959), conhecido como hipotético-dedutivo. Para
Popper, esse método seria poderoso o suficiente para estabelecer limites claros entre ciência
empírica e reflexão puramente metafísica, já que devem ser interpretadas como científicas
apenas pesquisas que formulem previsões passíveis de falseamento, isto é, previsões que podem
ser submetidas a algum teste objetivo (i.e, passível de observação e de replicação por
pesquisadores independentes) e, dessa forma, podem se revelar falsas ou não. Uma pesquisa
hipotético-dedutiva tem início com um conjunto de questões/problemas que interessam ao
pesquisador. Essas questões/problemas são interpretadas por uma dada teoria ou certa hipótese
descritiva. É dessa teoria/hipótese que uma (ou mais) previsão comportamental é derivada, a
qual é então projetada num desenho experimental específico. Finalmente, esse desenho se
apresenta a um participante numa determinada tarefa experimental, da qual serão colhidos e
interpretados estatisticamente os resultados relevantes para refutar ou confirmar as previsões
do experimento. Tais dados realimentarão de alguma maneira as questões/problemas que deram
origem à pesquisa e, dessa maneira, farão a ciência sobre o assunto avançar, tal como ilustrado
na Figura 1 a seguir.
Figura 1: a lógica da pesquisa experimental no método hipotético-dedutivo.
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
A abordagem experimental em linguística está ao alcance de qualquer projeto de
pesquisa que possa ser submetido ao fazer científico ilustrado na Figura 1. Como será visto na
seção a seguir, os resultados obtidos num experimento linguístico qualquer são dados de
natureza psicométrica que, por hipótese, decorrem das variáveis controladas nos estímulos
apresentados durante uma tarefa experimental. É por essa razão que os requisitos básicos para
o ingresso efetivo no mundo da experimentação em linguística são selecionar problemas de
pesquisa atinentes à dimensão cognitiva da linguagem e, a partir de alguma teoria ou alguma
análise linguística, formular previsões comportamentais a serem aferidas psicometricamente.
2. Protocolo de pesquisa
Uma pesquisa experimental sempre deve possuir um protocolo metodológico que
explicita com a máxima clareza a maneira pela qual a pesquisa é concebida e conduzida. Tal
protocolo garante, por um lado, a objetividade do processo científico e, por outro, enseja a
replicação de um estudo em particular, com adaptações ou não, por outros pesquisadores
interessados no tema.
O trabalho experimental tem início com a especificação dos problemas da pesquisa. A
partir desse ponto, o pesquisador formulará, com base nas hipóteses derivadas de sua teoria,
alguma previsão comportamental passível de análise psicométrica. Há um número incalculável
de previsões dessa natureza, em todos os níveis linguísticos. Para citar apenas um exemplo,
imagine-se que um linguista pode assumir que determinado tipo de estrutura sintática será
considerada quase sempre aceitável pelos falantes nativos de uma dada língua, por contraste a
outra estrutura correlacionada, a qual, em sua previsão, deverá ser julgada como inaceitável de
forma regular pelos mesmos falantes. Estabelecida sua previsão, o pesquisador deverá dar
continuidade a seu projeto experimental selecionando uma técnica de pesquisa compatível com
suas previsões. Logo depois, uma série de especificações metodológicas devem ser cumpridas:
o pesquisador definirá a tarefa experimental, delineará as variáveis independentes e as variáveis
dependentes relevantes para a pesquisa, estabelecerá as condições do experimento, formulará
os estímulos experimentais, os estímulos de controle e os estímulos distrativos, selecionará e
distribuirá os participantes da tarefa experimental de alguma maneira organizada, aplicará o
experimento e, finalmente, organizará e interpretará os seus resultados. Cada uma dessas etapas
será caracterizada nas subseções a seguir.
2.1. Técnicas experimentais
Existem dois tipos de medidas psicométricas que definem dois grandes grupos de
técnicas experimentais: medidas on-line e medidas off-line. As medidas on-line são aferidas
durante o processamento cognitivo que uma pessoa realiza inconscientemente enquanto recebe
um estímulo linguístico oral ou escrito. Medidas on-line envolvem o registro de tempos muito
rápidos (anotados em milésimos de segundo) e/ou a mensuração de algum comportamento
automático, como a movimentação dos olhos durante a leitura. Experimentos que recolham
medidas on-line precisam ser necessariamente programados e aplicados em equipamentos
especializados, como softwares desenvolvidos para a realização de tarefas psicométricas e
hardwares projetados para monitorar os movimentos oculares humanos. Equipamentos dessa
natureza são capazes de registrar dados comportamentais precisos e finos. As técnicas
experimentais on-line mais produtivas na pesquisa em linguística no Brasil são o
monitoramento ocular, a leitura segmentada autocadenciada (também chamada leitura
automonitorada) e a audição segmentada autocadenciada. Dados obtidos por meio de técnicas
on-line refletem mais diretamente o funcionamento de uma língua, já que envolvem a medição
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
de comportamentos reflexos independentes da inspeção consciente dos participantes de um
experimento.
Por sua vez, medidas off-line são aferidas após a conclusão do processamento cognitivo
da informação linguística e, por conseguinte, envolvem reflexões mais conscientes e
deliberadas por parte daqueles que participam de uma tarefa experimental. Esse tipo de
experimentação não impõe a necessidade de softwares ou hardwares especializados, embora
preferencialmente seja realizado em equipamentos simples, como programas psicométricos
gratuitos e computadores com caixas de respostas (joysticks), que permitem, inclusive, a
medição do tempo consumido durante a realização de uma tarefa. Alguns experimentos
linguísticos off-line podem ser realizados até mesmo por meio de um formulário impresso, a
ser respondido com uma caneta, como o julgamento de aceitabilidade de frases ou a produção
induzida (num preenchimento de questionário), ou por meio de gravações de áudio ou vídeo
com equipamentos amadores comuns. As técnicas experimentais off-line mais utilizadas em
pesquisas empíricas são julgamento imediato de aceitabilidade (também denominada juízo de
gramaticalidade), produção induzida de fala ou escrita, reconhecimento de palavras, respostas
a perguntas interpretativas e priming. Em função de sua natureza mais consciente, dados off-
line apenas indiretamente refletem a realidade linguística presente na mente dos participantes
de uma tarefa, uma vez que, em situações mais reflexivas e deliberadas, diversos domínios
cognitivos diferentes da linguagem em sentido restrito interagem em tempo real na mente das
pessoas.
Para começar a delinear uma pesquisa experimental, o linguista deverá, portanto,
identificar qual é o tipo de medida que melhor poderá decorrer de sua previsão de pesquisa
comportamental. Ele também deverá ter acesso e familiarizar-se a eventuais equipamentos úteis
para pesquisas on-line e off-line.
2.2. A tarefa do experimento
Um experimento linguístico utiliza, no caso típico, participantes ingênuos, ou seja,
pessoas que não sejam especialistas em linguística ou estudiosos de gramática. Por essa razão,
a tarefa experimental de uma pesquisa deve ser a mais clara, simples e objetiva possível – livre,
inclusive, de utilização de metalinguagem. Em experimentos on-line, as tarefas experimentais
mais comuns são (1) ler ou ouvir uma frase apresentada em segmentos – que podem ser
sintagmas ou palavras – numa tela de computador, os quais são disparados pelo próprio
participante, conforme sua velocidade natural de leitura/audição, enquanto o computador
registra o tempo que é consumido em cada segmento da frase, (2) ler com naturalidade palavras
ou frases numa tela de computador, enquanto um equipamento monitora o comportamento
ocular inconscientemente produzido ao longo da leitura.
Já em experimentos off-line, as tarefas mais típicas são (1) julgar frases binariamente
(declarando-as aceitáveis versus inaceitáveis), (2) julgar frases por meio de escalas de
aceitabilidade (atribuindo-lhes uma nota, por exemplo de 0 a 5), (3) preencher formulários
dando continuidade a uma frase oral ou escrita, (4) declarar o reconhecimento ou a
familiaridade com uma palavra ou um expressão apresentada por escrito ou oralmente, (5)
responder a questionários variados, (6) declarar o reconhecimento ou a familiaridade com um
determinado estímulo após a apresentação de outro (priming).
Em resumo, ao delinear uma pesquisa experimental, o linguista deverá formular
previsões comportamentais com base no tipo de tarefa a que os participantes de seu experimento
serão submetidos. Essas tarefas produzirão um conjunto de respostas, que deverão decorrer, por
hipótese, do processamento cognitivo demandado pelos estímulos da tarefa, os quais deverão
conter os fenômenos linguísticos que motivaram a pesquisa.
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
2.3. Delimitação de variáveis
Definir variáveis é uma das etapas mais importantes no delineamento de um projeto
experimental. Por um lado, o linguista deverá delimitar os fenômenos que, de acordo com sua
hipótese de trabalho, são capazes de provocar certo comportamento durante a execução de uma
tarefa experimental. Por outro lado, ele também deve estabelecer qual é a medida psicométrica
que registrará esse comportamento.
Os fenômenos selecionados como possíveis causadores do comportamento são
denominados variáveis independentes, enquanto as medidas psicométricas aferidas numa tarefa
denominam-se variáveis dependentes. Variáveis independentes são também denominadas
variáveis controladas, enquanto variáveis dependentes também são chamadas de variáveis de
resposta ou medidas dependentes. Por exemplo, numa pesquisa sobre, digamos, concordância
verbal, um pesquisador poderia definir a posição do sujeito relativamente ao verbo (anteposto
ou posposto) como uma variável independente capaz de desencadear, como variável
dependente, maior ou menor índice de estabelecimento da concordância numa tarefa de
produção induzida.
Num experimento, pode haver mais de uma variável independente ou dependente, a
critério das hipóteses e das previsões da pesquisa específica. O importante é que todas essas
variáveis sejam definidas com a maior clareza e, mais do que isso, é fundamental que haja o
máximo controle sobre outras variáveis que podem igualmente provocar ou influenciar
determinado comportamento. Continuando com o exemplo de uma pesquisa sobre
concordância verbal, existem muitos fatores, para além da posição do sujeito em relação ao
verbo, que podem influenciar o estabelecimento ou não da concordância, tais como natureza do
verbo (se regular ou irregular, de qual conjugação), o número e o tipo de itens intervenientes
entre sujeito e verbo, a distinção morfofonológica entre formas do singular e do plural, a
frequência e a familiaridade de verbos específicos, o grau de instrução e letramento dos
participantes da tarefa etc. Numa pesquisa sobre concordância, o estudioso não poderá deixar
de controlar tais variáveis, do contrário as chamadas variáveis de confusão (isto é, aquelas que
não foram controladas pelo pesquisador) podem influenciar o comportamento registrado no
experimento e, assim, enfraquecer ou anular o poder explicativo atribuído à(s) variável(is)
independente(s).
2.4. Condições experimentais
Nos estímulos a serem apresentados aos participantes de uma tarefa experimental, as
variáveis independentes irão se concretizar em formas linguísticas específicas que realizam as
condições experimentais da pesquisa. Por exemplo, no hipotético estudo sobre concordância
verbal, se a seleção da posição relativa entre verbo e sujeito for eleita como uma variável
independente, então essa variável será concretizada em dois níveis que, no caso de um
experimento com uma única variável independente, serão também as duas condições
experimentais: (1) estímulos em que o sujeito antecede o verbo e (2) estímulos em que o sujeito
sucede o verbo.
Nos experimentos que possuem mais de uma variável independente, as condições são
concretizadas a partir da multiplicação entre os níveis de cada variável selecionada. Imagine-
se, por exemplo, que, num experimento sobre concordância verbal, o traço de animacidade do
sujeito também fosse selecionado com variável independente, ao lado da posição do sujeito.
Nesse caso, o respectivo experimento possuiria quatro condições experimentais, resultantes da
multiplicação entre os dois níveis de cada uma das duas variáveis independentes escolhidas: (1)
sujeito animado + anteposição ao verbo, (2) sujeito inanimado + anteposição ao verbo, (3)
sujeito animado + posposição ao verbo e (4) sujeito inanimado + posposição ao verbo. Nesse
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
exemplo, teríamos um experimento com o desenho fatorial 2x2, no qual há duas variáveis
independentes (primeira variável X segunda variável), cada qual com dois níveis, que
combinados geram quatro condições experimentais (dois níveis da primeira variável X dois
níveis da segunda variável). Se, nesse experimento, fosse incluída uma terceira variável
independente, digamos, a conjugação verbal, com três níveis (1ª, 2ª e 3ª conjugações), então o
desenho do experimento passaria a ser 2x2x3, o que daria à luz doze condições experimentais.
Ao delinear seus experimentos, o linguista deverá, portanto, definir seu desenho fatorial,
determinando quais são as condições experimentais de sua pesquisa. Recomenda-se fortemente
que experimentos contenham um número reduzido de condições, para que, por um lado, se evite
a fadiga do participante durante a tarefa e, por outro, para que se diminua a possibilidade de
reconhecimento explícito ou tácito do propósito da tarefa experimental. Sendo assim, um
desenho 2x2x3 pode não ser aconselhável, a depender da distribuição dos estímulos por
participante, conforme será visto mais adiante.
2.5 Tratamento dos estímulos
As condições experimentais assumem, na prática de uma tarefa, alguma forma
linguística concreta e específica, seja um morfema, uma palavra, um sintagma, uma oração etc.
Essas formas são denominadas estímulos. A tradição das pesquisas experimentais estabelece
que cada condição experimental deve ser apresentada aos participantes de uma tarefa pela
menos quatro vezes, na forma de quatro estímulos verbais distintos, de modo que um padrão de
reação a tal condição, se houver, possa ser detectado. Ora, se um estímulo fosse apresentado ao
participante uma única vez, não seria possível saber se o respectivo comportamento provocado
ocorreu de maneira sistemática ou se se deveu a um evento único e aleatório, daí a necessidade
da apresentação de, no mínimo, quatro exposições de uma dada condição experimental a cada
sujeito específico.
Na elaboração de estímulos, o pesquisador deve aplicar o máximo de esmero. Deve
controlar, dentre outros fatores, a extensão dos estímulos de cada condição, em número de
sílabas ou palavras, bem como a frequência e a familiaridade dos itens lexicais utilizados. Esse
controle visa à tentativa de evitar que fatores outros (variáveis de confusão), diferentes da
variável independente, possam afetar o desempenho dos participantes da tarefa – por exemplo,
o tempo de reação a um determinado estímulo em, digamos, duas condições experimentais deve
variar em função da variável independente selecionada na pesquisa, e não porque os estímulos
de uma condição possuem muito mais palavras do que o da outra condição e, assim, obviamente
demandam mais tempo de reação, ou ainda, a sensação de estranhamento a um estímulo deve
decorrer da variável controlada pelo pesquisador e não da presença de uma palavra rara ou
ambígua que interferiu no julgamento.
Além do cuidado necessário na equivalência entre os estímulos de cada condição, o
pesquisador também deve utilizar num experimento estímulos distrativos. Tais estímulos não
devem possuir nenhuma relação com as variáveis independentes de pesquisa e cumprem apenas
a função de evitar que o participante reconheça (explicitamente ou não) o tipo de estrutura
linguística que está sendo apresentada nos estímulos das condições experimentais. Por
convenção, os estímulos distrativos de um experimento devem perfazer pelo menos dois terços
do número total de estímulos da tarefa. Sendo assim, num experimento com apenas uma
variável independente e duas condições experimentais, cada participante será exposto a, pelo
menos, oito estímulos experimentais e dezesseis estímulos distrativos.
Por fim, um experimento pode conter também estímulos de controle. A função desses é
permitir o cotejo entre uma condição em que determinado fenômeno está presente com outra
(de controle) em que ele é ausente. Por exemplo, numa pesquisa sobre ambiguidade, o
desempenho dos participantes diante de estímulos ambíguos deve ser comparado com o que
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
ocorre com estímulos de controle não ambíguos, o que permitirá a identificação de eventuais
reações específicas na condição com ambiguidade. Os estímulos experimentais e distrativos (e
também os de controle, se houver) devem ser apresentados ao participante de maneira
randomizada, isto é, aleatória, sem qualquer padrão de sequência linear. Softwares
especializados em experimentos já produzem randomização de maneira automática. No caso de
pesquisas mais simples, com formulário de papel a ser preenchido a caneta, é o próprio
pesquisador que deve sortear aleatoriamente a ordem de apresentação dos estímulos,
embaralhando os dois terços de distrativas ao terço final de experimentais.
No delineamento de sua pesquisa, um linguista precisará dispensar todo o cuidado à
elaboração dos estímulos experimentais presentes em sua tarefa. Eles devem ser apresentados
aos participantes numa quantidade tal que permita a identificação de algum padrão de reação e
também devem se apresentar simétricos entre todas as condições e embaralhados a um número
significativamente maior de estímulos distrativos.
2.6. Distribuição dos participantes
Os participantes de um determinado experimento podem, na verdade, constituir uma
variável independente. Ou seja, se o pesquisador assumir que o comportamento a ser registrado
numa tarefa pode variar de acordo com o tipo de participante (por exemplo, bilíngues versus
monolíngues, com patologia versus sem patologia, estudantes de L2 fluentes versus não
fluentes, pessoas com nível superior versus pessoas analfabetas etc.), então o experimento
possuirá uma variável grupal (também chamada de fator grupal). Se não for esse o caso, o
linguista deverá apenas determinar o perfil sociocultural das pessoas que podem participar da
tarefa – fatores como idade, sexo, escolaridade, região e outros que se mostrem relevantes – e
também deverá estabelecer como se dá a distribuição das condições experimentais pelos
participantes.
Na distribuição dos participantes, existem duas possibilidades a serem adotadas. Na
primeira delas, todos os participantes são expostos a todas as condições experimentais. Essa
distribuição denomina-se dentre participantes (within-subjects, em inglês) ou
intraparticipantes. Na outra, cada participante é exposto a uma e somente uma condição
experimental. Nesse caso, haveria um grupo de participantes separado para cada condição do
experimento, razão pela qual tal distribuição denomina-se entre participantes (between
subjects, em inglês) ou interparticipantes.
A distribuição dentre participantes tem a vantagem de exigir um número menor de
indivíduos desempenhando as tarefas do experimento, já que todos são utilizados em todas as
condições. Porém, essa opção tem a desvantagem de facilitar o efeito de familiaridade
(aprendizado da tarefa durante o experimento) e a identificação explícita ou não de padrões nos
estímulos, considerando-se que uma mesma pessoa é estimulada por todas as condições
experimentais pelo menos quatro vezes em cada. Com a distribuição entre participantes, as
chances de ocorrer o efeito de familiaridade são menores, mas para isso é demandado um
número maior de participantes, dado que eles devem distribuir-se em igual número por cada
uma das condições do experimento.
Quando se opta pela distribuição dentre participantes, os estímulos experimentais
devem receber um tratamento adicional: o controle num quadrado latino. Esse recurso permite
o balanceamento dos estímulos presentes em cada condição experimental, evitando-se que o
mesmo participante seja exposto a estímulos muito parecidos, de diferentes condições, distintos
apenas em função da variável independente do experimento. Com o quadrado latino, estabelece-
se que um participante numa distribuição within-subjects será exposto a todas as condições
(type) do experimento, mas em cada condição serão usados itens lexicais específicos (tokens),
de modo que a relação entre essas condições não se torne evidente durante a realização da tarefa.
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
Por exemplo, um participante que veja um estímulo do tipo “verbo + sujeito” como “Chegaram
as encomendas” seria exposto, na condição “sujeito + verbo”, a um estímulo como “As
reclamações cessaram” (e não “As encomendas chegaram”).
Grupo 1 Grupo 2
Condição 1 Estímulos 1a, 2a, 3a, 4a Estímulos 5a, 6a, 7a, 8a
Condição 2 Estímulos 5b, 6b, 7b, 8b Estímulos 1b, 2b, 3b, 4b
Figura 2: controle da distribuição dos estímulos experimentais num quadrado latino. “B” é uma versão
idêntica do estímulo “A”, itens lexicais e estruturas sintático-semântica são repetidos, com exceção da
condição experimental manipulada como projeção da variável independente.
2.7. Aplicação do experimento
Após o longo percurso de elaboração de um experimento, o pesquisador deve manter a
vigilância mesmo durante a condução das tarefas com os participantes. Eles devem receber
todas as instruções e demonstrações necessárias para a perfeita realização da tarefa e devem ser
submetidos a um breve treinamento, na presença do experimentador, por meio de um pré-teste
constituído somente estímulos distrativos, cujo objetivo é evitar que o desempenho durante o
experimento propriamente dito possa ser prejudicado devido a questões mecânicas ou a fatores
decorrentes da incompreensão da tarefa. Quando os participantes demonstram ter
compreendido perfeitamente o que devem fazer durante o experimento, o treinamento pode ser
finalizado e o experimento, iniciado.
Dando início ao experimento, os participantes devem encontrar-se sozinhos, numa sala
isolada, sem elementos que possam distrair a sua atenção e interferir na realização da tarefa.
Deve-se registrar o tempo médio despendido na tarefa, bem como, após a realização do
experimento, deve-se receber um feedback dos participantes, a fim de verificar se eles reportam
alguma anomalia ou mesmo se confessam ter identificado o padrão subjacente à tarefa ou o
fenômeno linguístico em análise.
2.8. Análise de resultados
Com o experimento concluído, é possível passar à análise dos resultados para verificar
se os dados psicométricos coletados se encaminham ou não em favor das previsões da pesquisa.
Nesse momento, o pesquisador precisará ou contratar os serviços de um profissional de
estatística ou utilizará, ele mesmo, softwares de pacotes estatísticos para organizar e interpretar
os resultados numéricos do experimento. A depender da variável dependente em questão, do
tipo de distribuição dos participantes e da normalidade distributiva dos dados comportamentais
coletados, diferentes tipos de análise estatística podem ser aplicados. Os mais comuns são
análise da variância, teste T, qui-quadrado e regressão. Há uma grande gama de softwares
estatísticos no mercado. O mais recomentado é o R, que possuiu uma adaptação para a interface
de Microsoft Excel no aplicativo brasileiro ActionStat. Outro software largamente empregado
no Brasil é o SPSS (Statistical Package for the Social Sciences).
O objetivo de um teste estatístico é, por um lado, descrever a distribuição dos dados
obtidos no experimento e, por outro, verificar se o comportamento típico encontrado nesses
dados pode ser interpretado como provavelmente decorrente das variáveis independentes
selecionadas na pesquisa – ou se, alternativamente, são grandes as chances de tal
comportamento ter sido provocado por fatores aleatórios. O famoso p-valor utilizado nas
análises estatísticas é, justamente, o resultado de cálculos matemáticos complexos que medem
a atuação das variáveis da pesquisa no cotejo com o acaso. Simplificadamente, estudos
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
experimentais em linguística assumem um nível de significância de no mínimo 95%, o que
significa dizer que um p-valor igual ou inferior a 0.05 indica baixa probabilidade (igual ou
inferior a 5%) de os resultados da pesquisa terem sido gerados aleatoriamente. Com resultados
dentro dessa margem, os dados reunidos por um projeto experimental em linguagem podem ser
interpretados como indicadores da atuação de uma ou mais variáveis independentes e/ou da
interação entre duas ou mais delas.
3. A teoria na prática: um exemplo
A pesquisa de doutoramento de Dias (2015), conduzida no âmbito do GEPEX, é uma
boa ilustração de uma pesquisa experimental em linguística. A autora reuniu evidência
experimental no intuito de verificar qual seria a descrição tipológica mais adequada para definir
a Língua de Brasileira de Sinais (Libras): (1) se uma língua que organiza suas sentenças
eminentemente na camada discursiva, no domínio do chamado “sintagma complementizador”
(CP, na sigla em inglês para complementizer phrase), isto é, na periferia esquerda das estruturas
sintáticas e, dessa forma, apresenta prominência de constituintes nominais “topicalizados”, ou
seja, sintagmas de valor nominal gerados ou deslocados à esquerda, sobre os quais se formula,
no âmbito da oração, algum comentário ou (2) se uma língua que organiza suas sentenças
eminentemente na camada flexional, no domínio do chamado “sintagma flexional” (IP, na sigla
inglesa para inflectional phrase), isto é, na camada funcional intermediária, imediatamente
superior ao sintagma verbal à periferia direita da frase, em que ocorrem as predicações lexicais,
e, assim, possui proeminência de sujeitos gramaticais, ou seja, sintagmas nominais gerados
como argumentos lexicais, à direita da hierarquia frasal, que, em IP, recebem marcas estruturais
de sujeito sentencial, como caso e concordância. A literatura linguística especializada em Libras
é escassa e conflitante a respeito da tipologia dessa língua. Autores como Ferreira Brito (1997)
sustentam que a ordenação linear não marcada em Libras é “tópico > comentário”, fato que
permitiria a classificação da língua como orientada para o discurso. Segundo essa hipótese, as
construções com “sujeito > predicado” até existem na língua, mas são marcadas e apresentam
situações restritas de uso. Já pesquisadores como Quadros & Karnopp (2004) assumem um
posicionamento contrário e afirmam que a Libras deve ser identificada como uma língua
orientada para a sentença, cuja ordenação linear básica e não marcada é “sujeito > predicado”.
De acordo com tal hipótese, estruturas com topicalização são de fato bastante produtivas na
língua, mas se licenciam em contextos marcados, conforme ocorre com inúmeras línguas orais.
O interessante sobre essas propostas contraditórias é que ambas foram formuladas com
base na intuição dos próprios pesquisadores2 e/ou em evidências de corpus. Trata-se de um caso
nada incomum na pesquisa sobre linguagem, quando dados de corpus e intuições de falantes
podem ser usados para sustentar hipóteses descritivas incompatíveis e, na verdade, antagônicas
a respeito de um fenômeno específico ou mesmo, como é o caso, sobre a tipologia de uma
língua em particular. É precisamente nessas ocasiões que a pesquisa experimental se apresenta
como uma terceira margem, capaz de testar as previsões comportamentais de modelos
descritivos opostos e verificar na direção de qual deles os dados experimentais convergem.
Dias (2015) delineou uma série de experimentos para verificar como os nativos da
Libras se comportavam diante de construções “tópico > comentário” e “sujeito > predicado”,
assumindo uma previsão comportamental geral simples e direta: (1) se a Libras puder ser
caracterizada como língua orientada para o discurso, então os surdos brasileiros mostrarão
preferência para a ordenação “tópico > comentário”, que, como estrutura sintática não marcada,
deve ser a mais frequente na produção e na compreensão dos usuários; (2) já se a Libras puder
2 Os autores em questão são ouvintes, filhos de pais surdos, que foram expostos à Libras e ao português brasileiro
durante o período crítico da aquisição da linguagem e, assim, qualificam-se como falantes bilíngues nativos dessa
língua de sinais e do português.
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
ser caracterizada como orientada para a sentença, então a ordenação “sujeito > predicado” será
a preferencial na língua e, assim, estruturas “tópico > comentário”, em virtude de serem
marcadas, devem ocorrer em contextos de uso específicos. Para testar tais previsões, a autora
aplicou quatro experimentos: julgamento imediato de aceitabilidade, produção induzida com
adultos, produção induzida com crianças e rastreamento ocular. Por questões de espaço neste
volume, serão reportados a seguir apenas os dados referentes aos dois primeiros experimentos.
O julgamento imediato de aceitabilidade é uma técnica off-line em que a tarefa do
participante consiste apenas em declarar, a respeito de cada frase que lhe é apresentada, se a
considera aceitável/natural em sua língua ou, ao contrário, se a considera inaceitável/anormal.
Por se tratar de um julgamento imediato, o participante deve emitir o seu julgamento em até
somente cinco segundos após assistir à sinalização da frase. Como esse é um tempo bastante
reduzido, assume-se que a intuição do participante sobre a (in)aceitabilidade de uma frase deve
refletir de maneira indireta, mas relativamente confiável, a gramática da língua, em especial o
fenômeno linguístico controlado nas variáveis independentes selecionadas pelo pesquisador.
Dias definiu como variável independente para sua pesquisa o tipo frasal. Tal variável
projetou duas condições experimentais: (1) “tópico > comentário” e (2) “sujeito > predicado”.
Na primeira condição, a topicalização acontecia sempre sobre um objeto (O) que, assim,
antecedia o sujeito (S) e o verbo (V) da frase, provocando a ordenação OSV. Na segunda
condição, não havia topicalização (o sujeito não recebia marcas de tópico) e a ordem linear era
SVO. Como estímulo de controle, foram usadas estruturas VSO, que são consideradas
agramaticais em Libras. Não foram utilizados estímulos distrativos, dado que, nesse caso, ou
todos teriam a mesma estrutura SV presente nas duas condições experimentais, ou
introduziriam anteposições verbais que redundariam na agramaticalidade já presente nos
estímulos de controle. No total, o experimento foi composto por 21 frases-estímulo, sendo 7 em
cada condição experimental e 7 no controle. Cada estímulo continha 3 ou 4 palavras e declarava
algum conteúdo a respeito de uma história muda apresentada em vídeo aos surdos
imediatamente antes da apresentação das frases (a fábula A cigarra e as formigas), que serviu
como contexto (informação velha) que licenciaria eventuais topicalizações. No experimento, a
variável dependente caracterizava-se como o índice de aceitação e de inaceitação de cada
condição experimental.
Tabela 1: variável independente e condições do experimento de julgamento imediato de aceitabilidade.
Variável independente: tipo frasal Exemplos
Condição 1: tópico > comentário (OSV) TRABALHO, CIGARRA NÃO GOSTAR.3
Condição 2: sujeito > predicado (SVO) FORMIGA TER CASA
Controle: agramatical (VSO) * COMER FORMIGA PÃO
Participaram do experimento 36 surdos nativos de Libras, todos nascidos e criados no
Rio de Janeiro e alunos do Instituto Nacional de Educação de Surdos (Ines), distribuídos em
três faixas de escolarização com 12 indivíduos cada (nível fundamental, médio e superior), de
modo a permitir a verificação de eventual interferência do grau de instrução como variável
independente.4 Desse grupo, 14 participantes eram do sexo feminino e 22, do masculino, com
idade média de 26 anos. A distribuição das condições foi dentre participantes.
A história muda prévia (fábula) e as frases do experimento foram exibidas num televisor
de 40 polegadas. Os estímulos experimentais e de controle foram gravados em vídeo de alta
3 Nos exemplos de Libras, segue-se a convenção de apresentar palavras e frases em letras maiúsculas para indicar
que se trata da sinalização correspondente naquela língua e não dados em língua portuguesa. Em Libras, não há
morfologia flexional verbal. 4 Houve efeito dessa variável grupal, mas aqui se deixará esse aspecto dos resultados inexplorado.
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
definição por um falante nativo de Libras, ouvinte bilíngue do português5. Após a apresentação
da história muda, as frases eram sinalizadas uma a uma para cada surdo, que se encontrava
sozinho numa sala, diante do televisor que projetava as imagens. Para cada frase, havia um
formulário com uma face sorridente (smile) ou uma face triste (simle triste) dispostas lado a
lado. Uma dessas faces deveria ser marcada para indicar se a respectiva frase era considerada
aceitável/natural (smile) ou inaceitável/anormal (simle triste). O participante assistia à
sinalização de uma frase e, ao seu término, dispunha de até 5 segundos para marcar no
formulário o seu julgamento. Durante esse intervalo, uma ampulheta indicava no televisor a
passagem do tempo. Passados os 5 segundos, uma nova frase era automaticamente sinalizada
no televisor e todo o procedimento se repetia. Essa sequência ocorria de forma sucessiva até o
fim da tarefa. Todos os surdos participaram de um pré-teste, na presença do experimentador,
composto apenas de frases SVO (gramaticais) e VSO (agramaticais), cujo objetivo era
familiarizar o participante com a tarefa a ser executada. O pré-teste consumiu, em média, 15
minutos. O experimento propriamente dito foi realizado na média de 10 minutos.
Os resultados indicaram que as estruturas “tópico > comentário” foram consideradas
aceitáveis em 70% dos casos, que se distinguiram estatisticamente das frases agramaticais de
controle, julgadas aceitáveis em somente 38% das ocorrências (conforme teste qui-quadrado,
p < 0.05, X² (2, N=36) = 43,56). Por sua vez, as estruturas com “sujeito > predicado” também
foram consistentemente julgadas aceitáveis pelos participantes, atingindo 83% de aceitação e,
da mesma forma, distinguindo-se em termos estatísticos das frases de controle (p-valor inferior
a 0.05). Tais dados atestaram que ambas as estruturas controladas como projeções variáveis
independentes se comportam como gramaticalmente legítimas em Libras, com produtividade
semelhante. Diante desses fatos, Dias (2015) argumentou que já se tornara possível definir
preliminarmente que a Libras ou tenha o comportamento de uma língua de sujeitos ou de uma
língua mista, em que sujeitos e tópicos coexistem com a mesma produtividade. Por conseguinte,
os resultados de seu primeiro experimento indicavam pouca probabilidade de a Libras poder
ser caracterizada como pertencente à tipologia das línguas orientadas para o discurso, com
proeminência de tópicos, dado o alto grau de aceitação de estruturas com sujeito não
topicalizado registrado na variável dependente da pesquisa.
Para seguir com sua investigação, Dias delineou um experimento de produção induzida.
Trata-se de uma técnica off-line cuja tarefa do participante é produzir uma frase pertinente ao
contexto da indução. No caso, Dias apresentou a duplas de participantes surdos uma historinha
em quadrinhos mudos. Na apresentação do último quadrinho, apenas um dos surdos assistia ao
desfecho da história, enquanto o outro virava-se de costas para o televisor em que os quadrinhos
eram projetados um a um. Após o fim dos quadrinhos, o surdo que não havia assistido ao seu
desfecho virava-se para o outro, que assistira a toda a história, e perguntava-lhe em Libras “O
QUE ACONTECEU?”. Segundo Ordóñez (2000), é no contexto de resposta a perguntas desse
tipo que a ordenação linear mais básica de uma língua se revela. Sendo assim, Dias objetivou
testar as seguintes previsões: (1) se a Libras se caracterizar como uma língua de tópico, então
as respostas a perguntas do tipo “o que aconteceu?” serão tipicamente apresentadas com a
ordenação “tópico > comentário”; (2) já se nessa língua há proeminências de sujeitos, ela será
tipologicamente classificada como língua de sujeitos e a estrutura básica para responder a tal
tipo de pergunta será “sujeito > predicado”.
A variável independente selecionada para o experimento foi a saliência discursiva para
a produção de um tópico. Tal variável projetou duas condições experimentais: contexto saliente
e contexto não saliente. A saliência do contexto foi definida pela presença, em todos os
quadrinhos, de um objeto não humano, argumento interno do verbo que descreve a ação do
5 Trata-se de uma pessoa ouvinte filha de pais surdos, que, assim, adquiriu naturalmente a língua de seus pais na
comunicação doméstica (Libras) e também adquiriu português na interação linguística fora do ambiente familiar.
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
último quadrinho, objeto esse que é o tema da historinha narrada. Como tal objeto é sempre
uma informação velha, compartilhada entre os falantes e alvo da declaração do último
quadrinho, Dias (2015) assumiu que esse seria o contexto prototípico para a produção de uma
estrutura “tópico > comentário”, conforme se ilustra na Tabela 2. Em contraste, a ausência de
todos esses fatores criava um contexto não saliente para a topicalização, no qual a estrutura
“tópico > comentário” não chega a ser impossível, mas é bastante improvável. Por hipótese,
uma língua de tópico lançará mão da estrutura “tópico > comentário” quer na presença, quer na
ausência de contexto discursivo saliente para o tópico, por oposição a línguas de sujeito, que só
realizarão a topicalização em contextos discursivos em que esses sejam licenciados. No
experimento, a variável dependente selecionada foi o índice de topicalizações em cada condição
experimental.
Tabela 2: variável independente e condições do experimento de produção induzida.
Variável
independente:
saliência
discursiva
para o tópico
Exemplos
Condição 1:
contexto
saliente
Condição 2:
contexto não
saliente
Foram utilizados no experimento 12 estímulos, 6 em cada condição experimental. Não
foram empregados estímulos distrativos ou de controle, que, no caso, coincidiriam
indesejavelmente com os estímulos não salientes. Todos os quadrinhos continham personagens
da Turma da Mônica, amplamente empregados em ilustrações de materiais didáticos no Ines.
Cada história era constituída por 5 slides, cada qual correspondente a um quadrinho da história,
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
conforme Tabela 2. Os slides eram apresentados num intervalo de 7 segundos entre um e outro.
Participaram da tarefa 24 jovens, alunos do ensino médio do Ines, surdos de nascença e
naturais/residentes do Rio de Janeiro, 10 homens e 14 mulheres, com faixa etária média de 19
anos. A distribuição dos estímulos foi dentre participantes.
Durante o experimento, os participantes foram dispostos em duplas, que assistiam aos
slides num televisor de 40 polegadas. Como já dito, um membro da dupla, após a exposição do
penúltimo slide, virava-se de costas para o televisor, de modo que não assistisse ao fim da
história, com a projeção do quinto e último slide. Após a exibição do último quadrinho, com a
televisão em tela preta, o participante que havia se virado voltava-se então para o outro e lhe
perguntava “O que aconteceu?”. É precisamente neste momento que o surdo que assistira a
todos os slides tinha sua produção induzida e deveria descrever o desfecho da história para o
colega que não assistira ao último quadrinho. Durante todo o teste, os participantes foram
filmados, sob autorização. Todos receberam previamente as informações necessárias à perfeita
condução do experimento. Os participantes também foram submetidos ao pré-teste, a fim de
esclarecer todas as dúvidas quanto ao procedimento e acostumar-se com a tarefa. A participação
de cada dupla durou, em média, 20 minutos.
Os resultados registraram que, em contextos menos salientes, a produção de tópicos em
Libras não ultrapassou 8% dos dados, por oposição aos 92% de estruturas “sujeito > predicado”
produzidas no mesmo contexto. Já no contexto discursivo mais saliente para o tópico, a
topicalização ocorreu em 52% das vezes. Trata-se de uma subida significativa da produtividade
da construção “tópico > comentário” (de 8% para 52%), tal como apontou o teste estatístico
qui-quadrado (X² (3, N = 24) = 6,178, p < 0.01). No entanto, na condição mais saliente, o
número de produções de frases com “sujeito > predicado” também foi considerável, atingindo
48% das ocorrências”. Isso significa que, na condição menos saliente para o tópico, construções
com “sujeito > predicado” são maciçamente empregas, enquanto, na condição mais saliente, o
uso de sujeitos não topicalizados é menor, mas se mostra tão produtivo quanto o de tópicos,
sendo, nesse contexto, irrelevante a diferença estatística entre ambas as estruturas (52% x 48%),
com p-valor superior a 0.05.
Com tais resultados, Dias (2015) concluiu que a Libras deve ser considerada uma língua
orientada para a sentença, com proeminência de sujeitos, em que a topicalização ocorre com
produtividade significativa apenas em contextos marcados. Os resultados dos experimentos de
julgamento imediato de aceitabilidade e de produção induzida foram corroborados e
aprofundados nos demais experimentos que a autora conduziu durante sua tese de doutoramento
no GEPEX, um deles foi de natureza on-line, o rastreamento ocular.
4. Áreas da linguística que empregam a metodologia experimental
A linha de investigação mais proeminente na exploração experimental de questões
descritivas relevantes para a linguística teórica é, certamente, a Sintaxe Experimental. O texto
seminal de Cowart (1997) indicava como, em especial, os julgamentos de gramaticalidade
utilizados informalmente entre gerativistas poderiam ser transformados numa ferramenta
metodológica séria ao incorporar os rigores das ciências experimentais. Os trabalhos de Sprouse
(2007), no exterior, e de Kenedy (2007), no Brasil, foram provavelmente as primeiras teses de
doutoramento em teoria sintática formal a adotar explicitamente a abordagem experimental a
fim de investigar fenômeno em sintaxe. Desde então, a área tem crescido exponencialmente e
vem abrindo espaços institucionais importantes na linguística.
As relações entre a abordagem tradicional da Sintaxe Gerativa e o fazer da Sintaxe
Experimental podem ser estabelecidas de maneira relativamente simples, uma vez que, na
linguística gerativa, sempre se assumiu que as computações gramaticais propostas pelos
sintaticistas corresponderiam, em alguma medida, às operações cognitivas que derivam
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
estruturas sintáticas na mente dos falantes de uma língua. De acordo com a proposta da Sintaxe
Experimental, tais computações não devem ser postuladas apenas como virtuais, mas, antes,
como psicologicamente reais, de modo que possam ser capturadas por algum instrumento
psicométrico. Com efeito, Sprouse & Almeida (2010) verificaram que 98% dos 469 dos tipos
de frase utilizadas num livro de teoria sintática formal bastante adotado em universidades
americanas e brasileiras (ADGER, 2003) poderiam receber um tratamento metodológico
adequado por meio da experimentação. Isso quer dizer que tais dados poderiam receber
sustentação empírica mais sólida, para além da intuição individual e assistemática do autor.
A “nova sintaxe” proposta pela Sintaxe Experimental é capaz de preservar a essência
do empreendimento da Sintaxe Gerativa e, ao mesmo tempo, pode evitar as falhas
metodológicas dos julgamentos de gramaticalidade informais (o método jocosamente
denominado “Hey, Sally” – sendo Sally a primeira pessoa que passa pela frente do linguista,
para quem ele pede um julgamento improvisado). Com um tratamento experimental, uma
pesquisa em sintaxe é capaz de estabelecer mais claramente suas variáveis independentes,
controlar variáveis de confusão, formular estímulos linguísticos mais equilibrados, evitar o
efeito de saciedade (que ocorre quando um indivíduo se acostuma a uma anomalia gramatical
e a considerada “mais aceitável” ao longo do tempo de execução da tarefa) e aplicar testes
estatísticos na amostra de participantes selecionada. Fora dos rigores da experimentação, a
Sintaxe Gerativa tradicional pode pecar não mais gravemente pela natureza daquilo que ela
descobre acerca das intuições sintáticas humanas, mas sobretudo por aquilo que ela deixa de
descobrir (falsos negativos) e também pelo que descobre inadequadamente (falsos positivos).
Fora do escopo do gerativismo, a abordagem experimental em linguística também vem
sendo explorada de maneira significativa em pesquisas de orientação funcionalista e
sociocognitiva, em modelos que se referem a si mesmos como “abordagens centradas no uso”.
No exterior, o livro de Bybee (2010) e, no Brasil, a publicação de Abraçado & Kenedy (2014)
indicam que a lógica subjacente à exploração experimental de questões linguísticas não depende
de uma concepção teórica específica. Na coletânea organizada por Abraçado & Kenedy, por
exemplo, foram desenvolvidas tarefas com técnicas off-line a fim de testar previsões derivadas
das teorias funcionalistas sobre transitividade verbal, que correlacionam sintaxe, semântica e
pragmática.
Além da Sintaxe Experimental e das pesquisas em sintaxe, semântica e pragmática de
orientação funcionalista e sociocognitva, outros domínios da linguística também vêm
recebendo recentemente exploração relevante em pesquisas experimentais. É provável que, em
alguns anos, pesquisas em fonologia, morfologia – e também léxico e discurso – figurem entre
as grandes linhas de investigação da área.
5. Indicações de leituras
Este capítulo não poderia deixar de indicar aos interessados algumas leituras futuras,
que ampliarão as informações aqui apresentadas.
Indicações de leituras iniciais em português.
KENEDY, E. Tópicos e sujeitos no PB: uma abordagem experimental. Revista da ANPOLL, v.
31, p. 69-88, 2011.
KENEDY, E. Análise de corpus, a intuição do linguista e metodologia experimental na pesquisa
sobre as orações relativas do PB e do PE. Linguística (UFRJ), v. 4, p. 30-51, 2009.
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
MAIA, M. Sintaxe experimental. IN: OTHERO, G. & KENEDY, E. (org.) Sintaxe, sintaxes.
SP: Contexto (no prelo).
Revista da Associação Brasileira de Linguística – Abralin. Volume XIII – número 2, jul/dez de
2014. Número especial sobre Sintaxe Experimental.
Revista Virtual de Estudos da Linguagem – ReVEL. Volume 10 – número 18, março de 2012.
Número especial sobre Sintaxe Experimental.
Indicações de leituras intermediárias em inglês.
COWART, W. Experimental syntax: Applying objective methods to sentence judgments. Sage
Publications, 1997.
SCHÜTZE, C. The empirical base of linguistics: Grammaticality judgments and linguistic
methodology. Chicago: The University of Chicago Press, 1996.
SPROUSE, J. Continuous acceptability, categorical grammaticality, and experimental syntax.
Biolinguistics, v. 1, p. 123-134, 2007.
Conclusões
Por tudo o que se disse neste capítulo, é possível compreender que uma pesquisa
experimental deve ser conduzida por meio de diferentes etapas interdependentes. Delinear um
projeto experimental demanda esforços de diferentes naturezas, desde a seleção de um
problema de análise passível de teste de previsão comportamental, até a análise estatística de
resultados, passando pela adoção de uma técnica experimental adequada, o estabelecimento de
uma tarefa clara e simples, o delineamento de variáveis independentes, dependentes e de
condições experimentais, bem como pelo tratamento adequado dos estímulos, da distribuição
dos participantes e da aplicação do experimento. Quando esse longo processo é conduzido com
zelo e os resultados experimentais vão ao encontro das hipóteses do pesquisador, dados robustos
podem ser utilizados em favor de uma hipótese de pesquisa em linguística, seja a respeito de
um fenômeno específico, seja a respeito uma hipótese teórica mais abrangente. É por essa razão
que a pesquisa experimental em linguística vem crescendo como uma abordagem metodológica
extremamente produtiva, no Brasil e no exterior. O GEPEX é somente um entre os diversos
grupos de pesquisa experimental brasileiros.
Referências
ADGER, D. Core syntax: a minimalist approach. Oxford University Press, 2003.
ABRAÇADO, J. & KENEDY, E. Transitividade traço a traço. Niterói: EDUFF, 2014.
BYBEE, J. Language, usage and cognition. Cambridge: Cambridge University Press, 2010.
CARREIRAS, M. & CLIFTON JR, C. (Eds.) The on-line study of sentence comprehension:
Eyetracking, ERP, and beyond. Brighton, UK: Psychology Press, 2004.
COWART, W. Experimental syntax: Applying objective methods to sentence judgments. Sage
Publications, 1997
KENEDY, E. Uma breve introdução aos estudos experimentais em linguística. IN.: WIEDEMER, M. (ORG.) Estudos linguísticos contemporâneos: questões e tendências. RJ: Autografia, 2019. pp. 159-194
DERWING, B. & DE ALMEIDA, R. G. Métodos Experimentais em Linguística. In: MAIA,
M. & FINGER (Org.) Processamento da Linguagem, Pelotas: Educat, 2005, pp. 401-442.
DIAS, A. O status das construções de tópico em Libras sob uma perspectiva experimental de
análise. Niterói: UFF, 2015. (Tese de doutorado).
FERNÁNDEZ, E. & CAIRNS, M. Fundamentals of psycholinguistics. EUA: Wiley Blackwell,
2011.
FERREIRA BRITO, L. Língua de Sinais Brasileira – LIBRAS. In: RINALDI, G. et al. Brasil,
Secretaria de Educação Especial – Deficiência Auditiva – Série Atualidades Pedagógicas.
Brasília: SEESP, 1997.
KENEDY, E. A hipótese da antinaturalidade de pied-piping em orações relativas. RJ: UFRJ,
2007. (Tese de doutorado)
KENEDY, E. Psicolinguística na descrição gramatical. IN.: MAIA, M. (Org.) Psicolinguística,
piscolinguísticas: uma introdução. SP: Contexto, 2015.
MAIA, M. (Org.) Psicolinguística, piscolinguísticas: uma introdução. SP: Contexto, 2015.
MAIA, M, & FINGER, I. Processamento da linguagem. Pelotas: Educat, 2005.
ORDÓÑEZ, G. Comentario pragmático de textos de desecho. Madrid: Arco Libros, 2000.
POPPER, K. The logic of scientific discovery. London and New York, 1959.
QUADROS, R. & KARNOPP, L. Língua de sinais brasileira: estudos linguísticos. Porto
Alegre: Artmed, 2004.
SPROUSE, J. A program for experimental syntax: Finding the relationship between
acceptability and grammatical knowledge. Unpublished doctoral dissertation, University of
Maryland, 2007.
SPROUSE, J. & ALMEIDA, D. The 469 data points that form the empirical foundation of
generative syntactic theory are at least 98% replicable using formal experiments. Disponível
em http://ling.auf.net/lingbuzz/001195. Acesso em 28.dez.2017.
TRAXLER, M. Introduction to psycholinguistics: understanding language science.
Massachusetts: Blackwell, 2012.