UFRJ

O Processamento das Interfaces Sintaxe/Semântica 
e Sintaxe/Prosódia na Compreensão de Frases em Línguas Naturais

Marcus Antonio Rezende Maia*

I – Introdução

Um dos debates mais importantes da Lingüística nas últimas décadas diz respeito à caracterização da faculdade da linguagem em relação a outros sistemas cognitivos e  à caracterização dos subcomponentes do conhecimento lingüístico, a saber, a sintaxe, a semântica, a pragmática e o componente fonético/fonológico. Trata-se de saber em que medida a linguagem é um componente cognitivo autônomo em relação a outras faculdades mentais e de que forma os subcomponentes da faculdade da linguagem interagem entre si.  No quadro teórico do Programa Minimalista (Chomsky 1991, 1992, 1995, 1998, 2000), que  assume basicamente a abordagem de Princípios e Parâmetros (Chomsky 1981, 1982, 1986; Chomsky & Lasnik, 1993), mas introduz princípios de economia  que têm como conseqüência uma reestruturação do modelo da gramática, os níveis de representação lingüística são reduzidos àqueles “conceptualmente necessários”: a forma fonética (FF) e a forma lógica (FL). Ao contrário dos níveis de representação  da estrutura profunda (EP) e da estrutura superficial (ES), que só poderiam ser postulados com base em  justificativas empíricas fortes, FF e FL têm uma justificação teórica resultante do fato de que  a faculdade de linguagem tem interfaces necessárias com um sistema articulatório/perceptual  e com um sistema conceptual/intencional.

O presente projeto pretende investigar a relação entre esses níveis de representação do conhecimento lingüístico no que diz respeito ao acesso a esses sistemas durante o processamento on line  de frases em línguas naturais. O estudo dos processos psicolingüísticos da análise sintática propicia que se explorem  as interfaces entre os dois sistemas que, segundo Chomsky (1995: 2), constituem a faculdade humana de linguagem: o sistema cognitivo de representacão do conhecimento e o sistema de desempenho que acessa  e utiliza a informação lingüística, podendo contribuir para caracterizar, além dos processos de acesso, a própria forma da gramática.

A subárea da Psicolingüística conhecida como Processamento de Frases (Sentence Processing) constitui um campo de pesquisas extremamente produtivo, embora ainda  relativamente pouco praticado no Brasil. O objetivo central  das teorias de processamento de frases é o de identificar os procedimentos psicologicamente reais que colocamos em jogo ao produzir e compreender frases. A distinção entre um nível de representação gramatical e um nível de acesso a essas representações, consubstanciada na dicotomia competência x desempenho (Chomsky 1965),  permitiu um balizamento da área em que perfilam modelos que pressupõem a independência entre a gramática e o processador  como um postulado básico. No âmbito do Programa Minimalista (Chomsky, 1995,1998), pode-se  indentificar uma aproximação crescente a questões diretamente relacionadas ao  processamento, cuja caracterização passou, inclusive, por uma reconceituação fundamental  de Chomsky  (1995) para Chomsky (1998),  abrindo caminho para a identificação progressiva entre a gramática e o processador. Conforme apontamos em Maia (2000), enquanto Chomsky (1995)  assume a hipótese de que o processamento, ao contrário do sistema da competência gramatical, é invariável,  Chomsky (1998) propõe, à base de evidências psicolingüísticas recentes, que  os sistemas de processamento podem variar  de língua para língua,  sendo modulados pela gramática de cada língua específica.

No âmbito dos estudos sobre a compreensão de frases, a dicotomia chomskyana (cf. Chomsky, 1965, p. 83-97), ganha contornos mais nítidos, refletindo-se na relação entre a gramática e o processador ou parser. O termo inglês parser ou parseador em português, oriundo do Latim pars orationis,  indica,  em  sentido estrito,  o procedimento de identificação dos constituintes oracionais e de suas relações hierárquicas, no processo de compreensão. Em sentido lato, o termo tem sido tomado até como sinônimo de desempenho, dificultando a determinação dos processos específicos que têm lugar a cada momento em que ouvimos uma frase.

Conforme discutimos em Maia (2001), Gramática e parser têm também sido pensados como um mesmo e único objeto, como na instigante proposta de Mike Dillinger (1992), que resolve a dicotomia, tornando-a um monômio: o parser seria a  própria gramática em ação.  Segundo Dillinger,  a relação entre a gramática e o processamento seria comparável à relação entre a Anatomia e a Fisiologia, na Medicina, ou entre a Estática e a Cinemática  em Física.  Esta maneira de colocar o problema equaciona uma teoria da competência com uma teoria estática da faculdade de linguagem e uma teoria do processamento com uma teoria cinemática da faculdade de linguagem. A diferença entre competência e desempenho corresponderia, então, à presença ou ausência do fator tempo.

As diversas teorias psicolingüísticas  têm, de uma forma ou de outra, sido balizadas por essa dicotomia, especialmente na subárea do Processamento Sintático. Quando de sua vinda ao Brasil, em 1996, Noam Chomsky, instado a posicionar-se sobre a relevância do binômio, reafirmou sua naturalidade conceitual, lembrando que “…existe uma diferença categorial entre o que você sabe e o que você faz.” (Chomsky, 1997), havendo, pois que se distingüir os dois processos, até no que se refere aos aspectos não  estritamente lingüísticos da cognição. Não obstante,  a dicotomia  apresenta tensão variável ao longo da história da Psicolingüística, sendo particularmente interessante observar-se, como já aludimos acima, sua reformulação no âmbito do programa minimalista, etapa mais recente da teoria gerativa.

Nosso objetivo geral no presente  projeto é o de colocar em perspectiva a relação Gramática/Parser, investigando experimentalmente a compreensão de  frases ambíguas em Português e em Inglês, para avaliar  a pertinência de sua caracterização em alguns dos principais modelos de processamento de frases da Psicolingüística moderna.  Entre as questões que abordaremos, destaca-se a investigação sobre os aspectos particulares e universais da representação e do acesso. As teorias universalistas, tais como a teoria do Garden-Path  (Frazier, 1979) tendem a assumir a existência de um conjunto uniforme de princípios de parsing aplicáveis a todas as línguas. No outro extremo do espectro encontram-se teorias como alguns modelos conexionistas que propõem os chamados “totally data shaped parsers”, isto é, processadores totalmente modulados pelo corpus a que se aplicam. No meio termo,  há modelos que procuram conciliar princípios universais e parâmetros particulares. Uma segunda questão abordada no projeto e, de fato, intimamente relacionada à primeira, diz respeito ao processamento do bilingüismo, situação em que pode-se dar a interferência entre as rotinas  de acesso à informacão gramatical da L1 sobre a L2.  Nosso projeto pretende ainda investigar a integração entre os conhecimentos semântico-pragmáticos, de um lado e a atividade estrutural do parser, do outro, bem como a relação entre a informação prosódica e a construção da estrutura sintática pelo parser. Nesse sentido, o projeto espera contribuir para a importante questão sobre a autonomia ou isonomia dos saberes lingüísticos.

Os estudos experimentais previstos nas atividades do projeto permitirão identificar o estatuto psicológico desses construtos teóricos, fornecendo evidências de processamento relevantes para a  sua caracterização. Por outro lado,  a avaliação da saliência perceptual de diferentes tipos de traços  lingüísticos (fonéticos, semânticos, formais), acessados na computação on line de frases,  é relevante para duas questões centrais da Psicolingüística resenhadas acima: a natureza modular ou interativa  do parsing e a universalidade das suas estratégias. No que se refere à primeira questão,  a  investigação experimental sobre o  acesso do processador  em tempo real a diferentes tipos de traços semânticos, sintáticos e prosódicos nas atividades de construção de estrutura e de resolução anafórica poderá ser crucial para a própria caracterização dos módulos e da natureza de sua interação. Quanto à  questão da universalidade dos processos de parsing, estudos sobre a realidade psicológica de diferentes traços lingüísticos  poderão fornecer evidências explícitas sobre  a natureza dos processos de acesso à Gramática Universal,  podendo-se identificar com maior precisão o conjunto de traços  ativados universalmente, contrastando-os com aqueles cujo acesso pode variar de língua para língua, sendo modulados pela gramática de cada língua específica.

 

O presente projeto de pesquisa será levado a efeito no âmbito do Laboratório de Psicolingüística Experimental – LAPEX, que congrega atividades de pesquisa relacionadas à  linha “Aquisição, Processamento e Perda da Linguagem”, do programa de pós-graduação e pesquisa em Lingüística da UFRJ e apoia a formulação e a execução de projetos  teóricos e experimentais nas áreas de Teoria e Análise Gramatical e de Processamento de Frases. Ainda que pouco praticada  no Brasil, a Psicolingüística Experimental é uma das disciplinas mais produtivas das Ciências Cognitivas, havendo equipes de pesquisa constituídas, com acesso a laboratórios bem equipados, nas principais instituições universitárias do mundo.  A pesquisa em Processamento de Frases vem permitindo, direta ou indiretamente, o desenvolvimento tecnológico, ilustrado, por exemplo, pelos programas de reconhecimento de voz, analisadores sentenciais (parsers), e tradução automática, de amplo uso em Informática, como também tem tido um impacto considerável na pesquisa em diferentes subáreas da Lingüística, possibilitando o entendimento dos procedimentos cognitivos em jogo na compreensão oral e escrita. A técnica experimental de leitura auto-monitorada, ainda pouco praticada no Brasil, permite avaliar o acesso "on line" a diferentes tipos de informações gramaticais, fornecendo evidências  úteis para a Psicolingüística e  para a  Lingüística Teórica, tendo também aplicação no ensino de língua materna ou de  segunda língua.  Os resultados de estudos experimentais em processamento podem ser levados em conta  também na investigação de distúrbios fonoaudiológicos.

 

Finalmente, este projeto de pesquisa pretende alinhar-se ao lado de tendências recentes resultantes do desenvolvimento do campo interdisciplinar das Ciências Cognitivas  que vêm legitimando a utilização da evidência experimental como  instrumento de pesquisa valioso para a Lingüística Teórica.  A utilização de dados sobre o processamento psicolingüístico vem, assim, complementando os  dados de natureza interna ou intuitiva, tradicionalmente empregados na pesquisa teórica, ocasionando um redimensionamento do próprio escopo da Psicolingüística que deixa de confinar-se à testagem de hipóteses sobre o desempenho lingüístico per se  para abranger também a testagem de propostas sobre a estrutura lingüística fundamental (competência). 

 

Ao propor a utilização de bases de dados diversificadas, incluindo dados  de natureza experimental, o presente projeto de pesquisa  visa, portanto,  a estudar os sistemas de acesso a aspectos da gramática a partir de uma ótica interdisciplinar  que reflete tendências recentes da Lingüística.  Desta forma, além de objetivar a produção de  análises sobre aspectos da gramática de interesse para a Lingüística Teórica e para a Psicolingüística, o presente projeto pretende também  vir a  contribuir para estreitar o diálogo entre diferentes subáreas   da Lingüística e  diminuir o isolamento  teórico e metodológico que tradicionalmente tem caracterizado   a pesquisa lingüística no Brasil.

II – Justificativa

 

Revisamos nesta seção três questões teóricas em Psicolingüística importantes para se compreenderem adequadamente os objetivos específicos do presente projeto, apresentados na seção III.   Na seção 2.1.,  discutimos o papel das estruturas específicas de cada língua  na compreensão da linguagem, especialmente no que diz respeito aos processos puramente estruturais da computação sintática,  levados a efeito na fase inicial da compreensão pelo mecanismo de parseamento de frases, e aos  processos  ditos interpretativos,  onde o objeto estrutural construído pelo  processador ou parser  é submetido ao processador temático a  fim de receber  a devida interpretação semântica, discursiva e pragmática.   Em 2.2., discutimos o  processamento do bilinguismo. Em 2.3., discutimos a relação prosódia-parser.

2.1. A parametrização do parser

Até muito recentemente  as teorias  sobre o parser  vinham  geralmente assumindo, implícita ou explicitamente,  que o acesso  à competência gramatical é essencialmente universal, respondendo apenas a condições de natureza  genética impostas  de forma idêntica para todas as línguas. Não obstante,  pesquisas conduzidas em diferentes línguas  vêm indicando que as propriedades  da gramática de cada língua específica têm, de fato, um papel importante a desempenhar  em diversos níveis da compreensão da linguagem.

Na área da percepção da fala, por exemplo,  estudos experimentais realizados ainda  na década de 80,  tais  como  o trabalho de Mehler, Dommergues, Frauenfeld  e Seguí (1981),  complementados por Cutler, Mehler, Norris e Seguí (1986) demonstraram a existência de efeitos silábicos na segmentação do sinal acústico em francês,  mas não  em inglês.  Mais recentemente,  Bosch e Sebastián-Gallés (1997) investigaram as habilidades de reconhecimento de fala por bebês  de quatro meses, demonstrando  a existência de efeitos de discriminação entre  o Espanhol e  o Catalão,  variáveis  em função do ambiente monolíngüe ou bilíngüe a que os bebês  estejam expostos.  Além desses, vários trabalhos recentes  vêm também descobrindo a existência de estratégias de segmentação da fala específicas para diferentes línguas, tais como,  o Japonês, o Holandês,  o Italiano e   o Português  (cf. Carreras et alii, 1996).

No que se refere ao processo de compreensão de frases por falantes-ouvintes adultos,  experimentos com diferentes línguas  vêm  também colocando em cheque a afirmação  de Frazier (1987) de que é possível  remover a gramática da língua inglesa da teoria universal do processamento de frases, plugar a gramática de qualquer outra língua, e obter a teoria de processamento adequada para aquela língua.  O modelo proposto por Frazier (1979) e por Frazier e Fodor (1978), a teoria do garden path  ou teoria do labirinto, conhecido incialmente como a máquina de salsichas, unifica em um sistema mais econômico e elegante as  estratégias propostas durante a década de 70 por Bever e por Kimball.  Basicamente este modelo procede à estruturação inicial dos itens lexicais em sintagmas que são, subseqüentemente, montados em um marcador frasal completo. As decisões iniciais do parser  quanto às relações estruturais entre os nós são determinadas basicamente pelos princípios  da Aposição Mínima (Minimal Attachment) e Fechamento Recente (Late Closure), que asseguram que o parser  inclua cada item da cadeia  da fala no marcador  frasal  em construção  de forma imediata e incrementacional, postulando como default   a estrutura mais simples e preferindo integrar cada constituinte com o material correntemente em análise. Estes algoritmos automáticos seriam diretamente motivados pelos limites de memória do mecanismo de processamento de frases cujo desempenho computacional parece ser restrito a 7 ± 2 itens em um período ativo de 18 a 30 segundos.  Assim, pressionado pela arquitetura do sistema de memória de curto prazo, que tem limites estreitos de processamento e de armazenagem, o parser  segue um princípio psicológico na escolha desta estrutura: use-se o menor número possível de nós (Aposição Mínima) e, se duas aposições mínimas existem, aponha-se cada nova palavra ao sintagma corrente (Fechamento Recente). Como estas são condições  que se presumem características da cognição humana em geral, Frazier (1987) assume que devam aplicar-se universalmente para o processamento de todas as línguas do mundo.  Frazier assume ainda que  o parser  usa uma porção do seu conhecimento gramatical de forma encapsulada, isto é,  não se deixando influenciar por fatores não-sintáticos em suas decisões de identificação e hierarquização inicial das relações sintagmáticas. As informações de natureza semântica, discursiva e contextual estariam,  segundo este modelo,  disponíveis apenas em um segundo momento da análise, quando um mecanismo conhecido como o processador temático  entraria em ação,  integrando as diferentes fontes de informação e revisando, quando necessário, a estrutura sintática inicialmente postulada. Conforme avaliado por Cuetos, Mitchell e Corley (1996),  embora não haja afirmações claras sobre a generalidade dessas operações,  a  escassez  de estudos avaliando sua variabilidade entre as diferentes línguas acaba por corroborar a sua generalização como rotina de processamento aplicável sem exceção a todas as línguas do mundo.

No que se refere  ao encapsulamento informacional do parser  à informação estritamente sintática, já existe hoje um conjunto amplo de evidências,  em diversas línguas,  sugerindo que a análise sintática possa, com efeito, ser influenciada por informações tais como a grade de subcategorização dos predicados, sua grade temática, suas propriedades de controle de sujeito e de objeto, bem como por fatores discursivos e contextuais  (cf. MacDonald, MC. (1997)). No que tange aos princípios psicológicos da teoria do labirinto, a própria Frazier já procedeu a revisões drásticas, tal como o modelo de Construal  de 1995,  que restringe a sua aplicabilidade às chamadas relações primárias da oração, embora ainda assumindo a sua aplicabilidade universal entre as línguas.  Um dos estudos pioneiros que questionam a universalidade dos princípios de parsing  é,  sem dúvida, o trabalho de  Cuetos e Mitchell (1988), em que os autores identificam uma preferência confiável dos falantes de espanhol por estruturas  que favorecem a aposição de uma oração relativa ao SN mais alto  no marcador, em contraste com a predição da estratégia de Fechamento Recente que, como resenhamos acima,  propõe com base em dados sobre a compreensão de frases em inglês que a aposição preferencial seja ao SN mais baixo.  Com base em resultados experimentais dessa natureza, tem-se proposto na literatura  sobre o processamento de frases a existência  de processos paramétricos em que estratégias gerais tais como o Fechamento  Recente competiriam com estratégias de propósito especial.

Assim,  os dados sobre a compreensão  de  diferentes  línguas vêm,  reconhecidamente, contribuindo para  o avanço do conhecimento sobre o processo de compreensão de frases e sua relação com a estrutura gramatical, tanto no que se refere aos princípios universais em jogo na gramática, quanto à sua parametrização nas línguas específicas.  O estudo comparativo desses processos abre novas perspectivas para a elucidação daquele que tem sido considerado por muitos  o problema principal da Psicolingüística:  a relação entre o processador e a gramática.  Como já aludimos na Introdução do presente projeto de pesquisa, uma medida que permite aferir o impacto recente desses estudos psicolingüísticos sobre a  própria  caracterização da faculdade da linguagem é a sua abordagem  contrastante em  Chomsky (1995) e Chomsky (1998).  Enquanto Chomsky (95)  assume a hipótese de que o processamento, ao contrário do sistema da competência gramatical, é invariável,  Chomsky (98) propõe, à base de evidências psicolingüísticas recentes, que  os sistemas de processamento podem variar  de língua para língua,  sendo modulados pela gramática de cada língua específica.

2.2. O Processamento do bilingüismo

Uma área da Psicolingüística em franco desenvolvimento hoje nas Ciências Cognitivas é o estudo  da representação e do acesso aos conhecimentos  gramaticais da primeira e da segunda língua  e a sua interação na mente dos falantes bilíngües. Várias das questões aludidas acima, tais como a universalidade e o encapsulamento  do parser, encontram nos estudos sobre a compreensão de frases por falantes bilíngües um campo de estudos bastante profícuo para a testagem de hipóteses.

Sabe-se que os falantes que aprenderam uma segunda língua (L2) quando adultos geralmente não exibem o mesmo grau de domínio dessa língua que os falantes que a adquiriram até a puberdade. No quadro da teoria de Princípios e Parâmetros (Chomsky, 1981; Chomsky  & Lasnik, 1993), assume-se que a aquisição da linguagem pode ser concebido como um processo de fixação de parâmetros, através do qual os princípios inatos da Gramática Universal (UG) são modulados de acordo com  os dados das línguas específicas a que a criança está exposta. A acessibilidade a tais princípios inatos oferece uma explicação lógica ao problema da pobreza de estímulos. A despeito da subdeterminação dos dados, as crianças são capazes de adquirir uma língua de forma rápida e espontânea, graças a existência dos princípios inatos. Em um artigo considerado seminal na área, Fernandez (1999) propõe que a aprendizagem da L2 por adultos é  dificultada pela interferência das estratégias de processamento específicas da L1 sobre a L2,  que  ocasiona o desenvolvimento de representações subjacentes da L2 inadequadas. Se  as estratégias de processamento empregadas para a compreensão de frases da L2 forem impróprias, tal fato pode implicar no desenvolvimento de representações gramaticais da L2 igualmente inadequadas, dificultando sua aprendizagem e uso.  Note-se que esta hipótese atribui a falta de sucesso na internalização da gramática da L2 à interferência de rotinas de acesso solidificadas da L1 sobre a L2. Essas rotinas, adequadas para processar os dados da L1, acabam por prejudicar a formação das representações adequadas da L2. Esta possibilidade justifica que se investigue se os falantes adultos da L2 processam os dados lingüísticos da mesma maneira que os falantes monolíngües o fazem.

2.3. O Processamento da informação prosódica

.  A maior parte da pesquisa sobre o processamento de frases por adultos nos últimos 20 anos focalizou a língua escrita. Contudo, desenvolvimentos recentes da lingüística teórica e da tecnologia computacional vem permitindo um grande número de experimentos que examinam os processos de compreensão da língua oral  e, em particular, o papel desempenhado pela prosódia nestes processos.  Note-se que o interesse sobre o papel da prosódia no parsing  chega vários anos após o início dos estudos sobre o papel da prosódia na aquisição. Embora estas duas áreas de investigação sejam distintas quanto às questões específicas que estudam e quanto às metodologias que adotam, vários tópicos em aquisição  apresentam contrapartes nas discussões emergentes  sobre o papel da prosódia no parsing. Gerken (1996) identifica três tópicos que seriam de grande relevo para se investigar a relação entre a informação prosódia e o processamento e a aquisição da linguagem:

1. o papel da prosódia na segmentação (localizar palavras e constituintes na cadeia);

2. o papel da prosódia na parentetização (relações estruturais entre elementos);

3. a confiabilidade de pistas prosódicas.

Neste projeto, focalizaremos a importância desses fatores no processamento de frases ambíguas em português. .  A maior parte da pesquisa sobre o processamento de frases por adultos nos últimos 20 anos focalizou a língua escrita. Contudo, desenvolvimentos recentes da lingüística teórica e da tecnologia computacional vem permitindo um grande número de experimentos que examinam os processos de compreensão da língua oral  e, em particular, o papel desempenhado pela prosódia nestes processos.

O foco da pesquisa nesses estudos tem sido saber se a informação prosódica poderia influenciar/guiar a escolha dos ouvintes entre estruturas sintáticas possíveis em pontos de ambiguidade na frase.  Apesar das diferenças entre as questões específicas levantadas para os dois campos, exitem contrapartes de parsing para os tópicos levantados  sobre o papel da prosódia na aquisição. Um dos tópicos principais em parsing também pode ser enquadrado em termos do papel da prosódia na segmentação versus parentetização estrutural e , em particular, em termos do papel da estrutura sintática vs. estrutura prosódica no controle da colocação das pistas prosódicas.

Diversos estudos, principalmente sobre dados da língua inglesa, têm identificado diferentes tipos de pistas prosódicas, tais como contornos entonacionais, padrões de acento, pausas, etc.  como marcadores potenciais de unidades sintáticas na cadeia da fala (cf. Jusczyk 1997; Price et alii 1991). Há, nesses estudos,  indicações de que  as mudanças prosódicas em enunciados em inglês freqüentemente coincidem com  as fronteiras de constituintes sintáticos, tendo se demonstrado que mudanças na entonação, bem como outros fatores supra-segmentais, tais como a duração, o acento e as pausas afetam a percepção de fronteiras sintáticas e, por conseguinte, a compreensão de frases.

Os estudos sobre a compreensão leitora de frases ambíguas em português, conforme intencionamos desenvolver no âmbito do presente projeto, serão complementados por verificações on line de dados orais, pretendendo-se caracterizar acusticamente diferentes tipos de enunciados ambíguos, conforme explicitado na seção 3.  para, em seguida,  se investigar se algumas dessas propriedades fonéticas são acessadas pelo parser na resolução da ambigüidade. Estudos  experimentais dessa natureza, inéditos no Brasil, poderão contribuir para a investigação sobre a sensibilidade do processador sinteatico aos marcadores prosódicos, aduzindo dados específicos da língua portuguesa para o debate.

III – Objetivos

 

À luz das questões teóricas revisadas nas seções precedentes, podemos agora explicitar adequadamente os quatro objetivos específicos do presente projeto:

 

3.1.            A compreensão de tópicos e categorias vazias em português.

 

Pesquisa inicialmente  conduzida como projeto de tese de doutoramento do Prof. Marcus Maia, proponente do presente projeto,  na University of Southern California, em Los Angeles, EUA, orientada pelos Profs. Joseph Aoun e Maryellen Macdonald. Comparou-se a compreensão de frases de sujeito com frases de tópico, relacionando-se essas estruturas com a anáfora zero e pronominal em posição de objeto. Experimentos baseados nas técnicas de priming e de julgamento imediato de gramaticalidade permitiram o estabelecimento de efeitos de reativação de sintagmas nominais em posição de tópico pela categoria vazia em posição  de objeto.  Resultados parciais foram publicados em Maia 1996 e Maia 1997a, b. Pretende-se, agora, investigar, através de técnicas de leitura auto-monitorada e de priming se traços tais como [± animado], [±humano] podem ser acessados rapidamente em tempo real,  influenciando  o processamento de frases do tipo tópico/comentário em Português, comparativamente a frases do tipo sujeito/predicado. Por exemplo, investigaremos se em frases como (1), o objeto nulo apresenta propriedades de reativação (priming) do seu antecedente [+animado] significativamente distintas do antecedente [-animado/-humano] da frase (2):

 

(1)   Esta criança, o médico examinou [objeto nulo +animado/+humano] ontem.

(2)   Esse lápis, o rapaz comprou [objeto nulo –animado/-humano] ontem.

 

3.2. O processamento de estruturas sintaticamente ambíguas em Português.

 

Estudo psicolingüístico de quatro tipos de ambigüidade de  aposição sintática em português, a saber:

 

1. Oração substantiva ou adjetiva

O diretor contou à aluna que o professor beijou (a) a secretária /(b) a estória.

2. Aposição de SP a SV ou SN

O guarda viu o rapaz  (a) com o binóculo/ (b) com o revólver

3. Oração principal ou relativa reduzida

Mãe suspeita de assassinato e foge / Mãe suspeita de assassinato foge.

4. SN complemento ou Sujeito de oração principal

Como João sempre corre (a)um km, ele não ficou cansado (b) um km é fácil p/ele.

.

A compreensão dessas estruturas será investigada através de experimentos offline e online, que reunirão evidências  a fim de testar hipóteses de diferentes modelos psicolingüísticos, tais como a teoria do “garden-path”, a teoria incrementacional interativa (Crain, S & Steedman,M,1985), modelos  de satisfação de condições ( e.g. Thornton, R., MacDonald,M & Gil, 1999)  e a teoria do processamento minimalista (Weinberg, A. 1999).

O fênomeno da ambiguidade sintática temporária tem sido produtivamente investigado em Psicolingüística Experimental a fim de se estudar os procedimentos do chamado mecanismo humano de processamento de frases ou parser. Ao encontrar uma ambigüidade estrutural, o parser  pode decidir-se rapidamente por uma das análises possíveis,  havendo-se postulado princípios, tais como a “aposição mínima” (minimal attachment) e a “aposição baixa”, (late closure), à base,  principalmente, de dados da língua inglesa (Frazier, 1979; Frazier & Rayner, 1982). Estes estudos colocam em questão, ainda, a natureza das informações usadas pelo parser para guiar suas decisões de processamento. Trata-se de determinar se o parser é estritamente sintático em sua análise inicial ou se  já acessa rapidamente informações de natureza semântica, prosódica e pragmática a tempo de influenciar a análise sintática (Sedivy & Spivey-Knowlton, 1994). Outra questão importante que o estudo de ambiguidades sintáticas em línguas diferentes do inglês tem levantado diz respeito à universalidade dos procedimentos de acesso ao componente cognitivo da faculdade da linguagem. Como já discutimos na Introdução do presente projeto, investigações recentes sobre o processamento têm permitido, inclusive, reformulações importantes na própria teoria gramatical, conforme se nota em Chomsky 1995 e Chomsky 1999 (cf. Maia, 2001 para uma revisão dessas questões). Essas questões empíricas têm, portanto, conseqüências teóricas importantes, podendo contribuir decisivamente para debates em curso na lingüística contemporânea, tais como a forma da gramática, a universalidade do parser, autonomia e interação, serialidade e paralelismo, etc.

A metodologia incluirá a  formulação  e a aplicação de questionários  pilotos que testarão a compreensão das frases ambíguas dos tipos acima exemplificados, visando a identificar as  preferências interpretativas acionadas na leitura,  comparando  e avaliando os resultados a partir de pesquisas similares realizadas com outras línguas. Em um segundo momento, utilizar-se-ão procedimentos de investigação on line, isto é, aferir-se-ão os tempos de resposta a  tarefas relacionadas a frases ambíguas  e não ambíguas em milésimos de segundos, procurando-se  investigar as estratégias de parsing colocadas em jogo e a sua relevância para apoiar ou rejeitar hipóteses de diferentes modelos. Nos experimentos on line, utilizar-se-á o programa computacional de Macintosh Psyscope.

3.3.            O Processamento do Bilingüismo

Investigaremos a compreensão de orações relativas, atendo-se a comparação das estrategias utilizadas na resolução entre aposição alta ou baixa da relativa em frases do tipo SN1 – do(a) - SN2 – OR, conforme exemplificado em (3):

(3) Alguém atirou no empregado da atriz    que estava na varanda

                             SN1                 SN2         OR                                                                     

Compararemos as estratégias de aposição de orações relativas por falantes nativos  de português e de inglês com as estratégias empregadas por falantes nativos de português que utilizam e ensinam o inglês como segunda língua e por falantes nativos de inglês que utilizam o português como segunda língua. Nosso objetivo ao testar a compreensão dessas estruturas é o de verificar se a teoria do garden path (Frazier, 1979, 1987) que faz a predição de aposição baixa (SN2) da relativa em inglês, é igualmente aplicável  na compreensão de dados do português e se as estratégias de parsing aplicáveis na compreensão da língua materna influenciam o processamento de frases da segunda língua.

De acordo com  Frazier (1978 e 1987), a aposiçao das OR seria universalmente resolvido através da estratégia de parsing conhecida por Late Closure (LC), ou seja, a relativa seria ligada ao sintagma mais baixo.  Sua teoria baseia-se em pesquisas experimentais realizadas com falantes nativos da língua inglesa, que atestam sua preferência pelo processo de aposição baixa (LC). Contudo, em vista do trabalho de  Cuetos & Mitchell (1988), em que são relatados experimentos com falantes nativos de língua espanhola,  63% dos quais preferiram a resolução pela aposição alta da relativa ou Early Closure (EC), e ainda face aos estudos de De Vincenzi & Job (1993), também nos mesmos moldes e realizados em língua italiana( 65% de preferência pelo EC), a afirmação forte de Frazier sobre a universalidade da estratégia de LC é colocada em questão. Este projeto visa não a testar a preferência dos falantes nativos de língua portuguesa na aposição de orações relativas, tarefa esta já desenvolvida por Ribeiro (2000) e por Maia & Maia (2001), mas a analisar  comparativamente as interferências de uma segunda língua sobre a nativa e vice-versa no que tange ao processo de parsing escolhido pelos falantes quando em face a frases do tipo exemplificado acima.

O estudo das características cognitivas relacionadas ao bilingüismo tem se constituído recentemente em um campo produtivo de pesquisas, tanto do ponto de vista do desenvolvimento, quanto do ponto de vista do processamento (cf. Bialystok , 1996). Mitchell and Brysbaert (1998) discutem trabalho de Clifton (1988), em que dados experimentais indicam uma preferência pela aposição alta da relativa por parte de  falantes  de inglês, sugerindo que uma possível explicação para esse fato seja a não exclusão sistemática dos falantes de inglês do universo de sujeitos testados.  A esse respeito, Fernandez (1995) reporta evidências de que falantes bilíngües de espanhol e inglês apresentam preferências de aposição da oração relativa diferentes das apresentadas por falantes monolíngües de Inglês. O estudo dessas diferenças em relação a falantes bilíngües de português e inglês pode trazer novos fatos  tanto para o estudo do processamento sintático por parte de bilíngües como para questões centrais da psicolingüística, tais como a universalidade do parser e as diferentes teorias que têm sido propostas para explicar as diferenças de processamento entre línguas (cf. Cuetos S, F., D.C. Mitchell e M. Corley, 1996).

Pretende-se investigar a questão da aposição das relativas por falantes bilíngües através de procedimentos experimentais on line, tais como a técnica de leitura auto-monitorada, que permite a mensuração dos tempos relativos de leitura dos segmentos oracionais em milésimos de segundos, podendo-se distinguir procedimentos de parsing de procedimentos de interpretação na atividade de compreensão de frases.

 

3.4.            O Acesso Prosódico no Parsing Sintático

 

Investigaremos as estruturas ambíguas especificadas em 3.2 e em 3.3. do ponto de vista da compreensão leitora e complementaremos esses estudos do ponto de vista da compreensão oral. É interessante notar  que a influência  de fatores prosódicos no processamento sintático tem sido demonstrado, em inglês,  tanto na leitura, quanto na compreensão oral de frases. Fodor (2001), por exemplo,  refere-se à  “prosódia silenciosa ou implícita” levada a efeito pelos leitores, que computariam o contorno prosódico mentalmente, projetando sobre ele o estímulo lido.

A realização de  diferentes experimentos psicolingüísticos com estímulos visuais e auditivos, focalizando frases ambíguas em português, levará à constituição de um conjunto de dados e análises envolvendo o estudo dos padrões prosódicos na leitura em voz alta e na leitura silenciosa, podendo-se, então aferir o papel desses fatores na resolucão das ambiguidades estruturais estudadas. Por exemplo,  no estudo das ambiguidades de aposição de orações relativas caracterizado em 3.3., poderemos investigar se a preferência de aposição da oração relativa ao SN mais alto ou ao SN mais baixo está relacionada, como sugere Fodor, à complexidade do fraseamento prosódico, que pode variar entre as línguas. Segundo Fodor, as línguas em que o fraseamento prosódico do SN complexo parece ser  /SN1 SP SN2/  OR (oração relativa), a aposição preferencial deveria ser feita ao SN1, como parece ser o caso em Português. Por outro lado, a aposição ao SN2 deveria ser preferida nas línguas que não tendem a uma quebra entre o SN2 e a oração relativa, como parece ser o caso em Inglês.  Uma questão relacionada que se coloca, então, é que, se a prosódia é a causa das diferenças de aposição em estruturas desse tipo, sustentando a hipótese da prosódia implícita, que conseqüências pode-se extrair para a questão da universalidade do parser. Cutler (2001) apresenta evidências em favor da influência da prosódia implícita no processamento de frases escritas ambíguas, levantando a seguinte questão: os leitores sempre geram uma representação prosódica imediata ou tal representacão só é produzida quando uma dificuldade de parsing requer uma reanálise? Tais questões poderão ser abordadas em nossa pesquisa, inaugurando um campo de investigações até hoje ainda  inédito no Brasil.

 

 

IV – Metodologia

 

O presente projeto prevê a realização de diversos experimentos psicolingüísticos focalizando a compreensão de frases relevantes para os objetivos do projeto. Objetiva-se tanto  a obtenção de dados de processamento  on line ” ,  quanto off line .  Pretende-se realizar  experimentos "on line" além de  “mini-experimentos” informais que  possibilitem a formulação de hipóteses iniciais sobre diferentes estratégias de processamento psicolingüístico. Tais experimentos poderão, por exemplo, monitorar a leitura de frases, comparar as diferentes interpretações atribuídas a frases com e sem categorias vazias;  verificar as soluções interpretativas disponíveis para resolver fenômenos de ambigüidade estrutural; contrastar as interpretações precisa e imprecisa de pronomes e categorias vazias; avaliar as reações a frases com diferentes ordens de constituintes, identificar as estratégias de parsing das construções do tipo Qu (relativas), etc.   Os  experimentos  on line  ” utilizarão o Programa "Psyscope", desenvolvido por pesquisadores da Carnegie Mellon University para a investigação dos processos cognitivos  em ação na compreensão de frases. Nesse sentido, realizar-se-ão experimentos psicolingüísticos fundamentados nos paradigmas de “priming”, leitura auto-monitorada, julgamento imediato de gramaticalidade e de compatibilidade, a fim de testar, principalmente, a influência de fatores  semânticos, pragmáticos  e prosódicos no parsing sintático.

 

V – Recursos humanos

 

O presente projeto inscreve-se entre as investigações em curso sobre o  compreensão de frases em língua portuguesa, que vêm se desenvolvendo no âmbito da linha de pesquisa sobre processamento  sintático, no programa de pós-graduação em lingüística da UFRJ, havendo-se constituído na sala H-308 da Faculdade de Letras da UFRJ um laboratório de psicolingüística (LAPEX), coordenado pelo Prof. Marcus Maia, proponente desse projeto.

Atuarão como colaboradores do projeto, os seguintes alunos da pós-graduação em Lingüística da UFRJ: Maria do Carmo Lourenço Gomes, Guiomar da Silva Albuquerque, Márcio Leitão. Também  duas alunas da graduação, bolsistas PIBIC colaborarão com o projeto: Simone de Oliveira e Fernanda de Souza Faria.

 

 

VI – Recursos materiais

 

O LAPEX – Laboratório de Psicolingüística Experimental da UFRJ, no âmbito do qual o presente projeto será desenvolvido, conta atualmente com os seguintes equipamentos e programas:

1.      Computador Power PC desktop 4400/200 – Apple Macintosh

2.      Laptop Powerbook Macintosh 1400cs/133

3.      Button-box Psyscope de 3 botões, capaz de medir tempos de reação  a dados lingüísticos com precisão de milésimos de segundos.

4.      Programa Psyscope, desenvolvido por pesquisadores da Carnegie Mellon University, EUA, que permite a projeção, monitoramento e análise de experimentos psicolingüísticos  de diversos tipos, tais como “priming” e leitura auto-monitorada.

 

 

VII – Cronograma

 

O presente projeto de pesquisa tem a duração prevista de dois anos, podendo ser renovado no fim deste período.  Delineiam-se abaixo as fases prováveis de evolução do projeto em períodos semestrais:

1º Semestre:     Análise da literatura sobre os tópicos teóricos relevantes nas áreas da Teoria Gramatical e de Processamento de Frases;

Estabelecimento preliminar da base de dados inicial a partir do  levantamento  dos dados já disponíveis              e da pesquisa  offline com informantes;

Delimitação de problemas específicos e formulação       de hipóteses; Realização de experimentos pilotos do tipo offline;

                        Produção de análises preliminares.

2º Semestre:    Realização de experimentos psicolingüísticos "on line" com dados escritos

                        Fixação e análise dos dados;

                        Avaliação das análises preliminares;

3º Semestre:     Realização de   testes e mini-experimentos psicolingüísticos;

Reanálise dos dados com base nos testes e       experimentos;

Realização de experimentos on line com dados orais

4º Semestre:     Produção de análises;

                        Redação de relatórios técnicos, monografias, artigos, capítulos de livros.

 

 

VIII – Bibliografia                 Bosch, L.  e N. Sebastián-Gallés.(1997). Native-language recognition abilities in 4-month-old infants from monolingual and bilingual environments. Cognition, 65, 33-69. Carreras, M., J. E. Garcia-Albea & N. Sebastián-Gallés (1996). (eds). Language Processing in Spanish. New Jersey: Lawrence Erbaum Associates. Chomsky, N. (1965). Aspects of a Theory of Syntax. Cambridge, Mass: MIT Press.

Chomsky, N. (1981). Lectures on government and binding. Dodrecht: Foris.

Chomsky, N. (1982). Some concepts and consequences of the theory of government and binding. Cambridge, Mass.: MIT Press.

Chomsky, N. (1986).  Knowledge of language, its nature, origin, and use . New York: Praeger.

Chomsky, N. (1991).  Some Notes on Economy of Derivation and Representation, in R. Freidin (org) Principles and Parameters inComparative Grammar, Cambridge, MIT Press.

Chomsky, N. (1992).  A Minimalist Program for Linguistic Theory, MIT

            Occasional Papers in Linguistics, MIT, Cambridge..

Chomsky, N. (1995). The Minimalist Program.  Cambridge, MIT Press.

Chomsky, N (1997). A Lingüística como uma Ciência Natural. Entrevista à Revista Mana, vol. 3, nº 2, Ed. Contra-capa, Rio de Janeiro.

Chomsky, N. (1998). Minimalist Inquiries: the Framework. MIT, manuscript. Chomsky, N. & Lasnik, H. (1993). The Theory of Principles and          Parameters.  In Jacobs,J. et alii (org), Syntax, an International   Handbook of  Contemporary  Research . Walter de Gruyter, Berlin, New York. Crain, S. & Steedman, M. (1985). On not being led up the garden path: the use of context by the Psychological syntax processor. In D. Dowty, L Kartunnen, & A.M. Zwicky (eds.), Natural language parsing: psychological, computational and theoretical perspectives (pp. 320-358). Cambridge,UK: Cambridge University Press. Cutler, A. (2001). Prosody and Interpretation. Ms.

Cuetos , F., D.C. Mitchell. (1988). Crosslinguistic differences in Parsing: Restrictions on the use of the Late Closure strategy in Spanish. Cognition,  30, 73-105.

Cuetos, F., D.C. Mitchell e M. Corley.(1996). Parsing in Different Languages. In: CARREIRAS, M., J. E. GARCÍA-ALBEA & N. SEBASTIÁN-GALLÉS (eds). Language Processing in Spanish. New Jersey: Lawrence Erbaum Associates. Cutler, A, J. Mehler, D. Norris,  e J. Seguí. (1986) The syllable’s differing role in the segmentatin of French and English. Journal of Memory and Language, 25, 385-400.

Dillinger, M. (1992).   Parsing Sintático. Boletim da ABRALIN, 13

Fernandez, E.M. (1999) Processing strategies in second language acquisition: some preliminary results. In E.C. Klein and G. Martohardjono (eds.), The development of second language grammars: a generative approach. Amsterdam:John Benjamins. Fodor, J.D. (2001). "Prosodic disambiguation in silent reading: New evidence from Croatian" ms. Frazier, L.(1979). On comprehending sentences: Syntactic parsing strategies. Doctoral dissertation, University of Connecticut. Distributed by Indiana Linguistics Club. Frazier, L. (1987). Sentence Processing: A tutorial review. In M. Coltheart (Ed.), Attention and performance XII: The psychology of reading (pp. 559-586). Hillsdale, NJ: Lawrence Erlbaum Associates. Frazier, L. & C. Clifton Jr. (1995).  Construal. Cambridge: The MIT Press. Frazier, L. & J.D. Fodor. (1978). The sausage machine: A new two stage parsing model. Cognition, 6, 291-325.

Frazier, L. & K. Rayner. (1982). Making and correcting errors during sentence comprehension: eye movements in the analysis of structurally ambiguous sentences. Cognitive Psychology, 14.

Gerken, L. A. (1996). Prosody’s role in Language Acquisition and Adult Parsing. Journal of Psycholinguistic Research, vol. 25, n. 2.

Jusczyk, Peter W. (1997). The discovery of spoken language. Cambridge, Mass.: The MIT Press.

MacDonald, M.C. (1997). (ed). Lexical Representations and Sentence Processing. Special Issue of Language and Cognitive Processes, 2/3, vol 12.

MacDonald, M.C., Pearlmutter, N.J., and  Seidenberg, M.S. (1994). The lexical nature of syntactic ambiguity resolution. Psychological Review, 101, 676-703.

MacDonald, M.C, Thornton,R.. and Gil, M.(1997). Pragmatics Constrain the initial interpretation complex noun phrases in English and Spanish. Unpublished manuscript, USC.

Maia, M. (1996).“Language and Priming Memory”. Artigo publicado  na Revista da ANPOLL, nº 2, p.109-131.

Maia, M. (1997). The  Processing of Object Anaphora in Brazilian Portuguese” Artigo publicado em Recherches Linguistiques de Vincennes nº 26, p.151-172, França.

Maia, M. (2000). “A Compreensão de Relações Espaciais em Karajá”. Revista PaLavra, vol. 6, p. 154-165, Ed. Trarepa, Petrópolis, ISBN 1413-7763.

Maia, M. (2001). “Gramática e Parser” . Comunicação apresentada no simpósio “Dimensões do Processamento”, realizado no dia 15 de março de 2001, durante o II Congresso Internacional da Abralin, na Universidade Federal do Ceará, CE. Trabalho completo a aparecer nos anais do congresso.

Maia, M. & Maia, Juliana.(2001) “A Compreensão de orações relativas por falantes monolíngües e bilíngües de Português e de Inglês”. Comunicação apresentada   no dia 17 de novembro, durante o IV  Congresso da Sociedade Internacional de Português como Segunda Língua – SIPLE, realizada na PUC-RJ entgre os dias 15 e 18 de novembro de 2001.  Trabalho completo publicado nos anais  do Congresso, em formato CD-ROM.

Mehler, J., J.Y. Dommergues, U. Frauenfeld,  &  J. Seguí. (1981). The syllable’s role in speech segmentation. Journal of Verbal Learning and Verbal Behavior, 20, 298-305. Price, P.J., M. Ostendorf, S. Shattuck-Hufnagel, and C. Fong. (1991). The use of prosody in syntactic disambiguation. Journal of the Acoustical Society of America 90, 2956-2970.

Ribeiro, A.J.C. (2000). O Processamento de Orações Relativas no Português do Brasil. Trabalho apresentado no GT de Psicolingüística  da XV ANPOLL, UFF, Niterói.

            Sedivy, J & Spivey-Knowlton, M. (1994).The use of structural, lexical and pragmatic information in parsing attachment ambiguities. Hillsdale: Lawrence-Erlbaum. Weinberg, A. (1999). A Minimalist Theory of Human Sentence Processing. In: Epstein, S. & Norbert Hornstein (eds). Working Minimalism. Cambridge, Mass: The MIT Press.

                                                                                                                                                                        



(1)     Professor Adjunto III do Departamento de Antropologia do Museu Nacional-UFRJ

e do Programa de Pós-graduação em Lingüística da Faculdade de Letras da UFRJ.

 


© 2001 - LAPEX - UFRJ. All Rights Reserved
Atualizado em 18 de abril de 2002.

WebDesigner