AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de...
Transcript of AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E ... · Incidência de palavras de...
AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E TEXTOS LITERÁRIOS
Bianca Pasqualini Doutoranda PPGLet/UFRGS
Orientadora: Profa. Dra. Maria José B. Finatto
PRIMEIRO ESTUDO:
2
ANÁLISE DE ÍNDICES DE COMPLEXIDADE TEXTUAL EM DOIS TEXTOS DE PEDIATRIA E SUAS TRADUÇÕES PARA
O INGLÊS: UM ESTUDO EXPLORATÓRIO
Artigo publicado em: http://www.pgletras.uerj.br/palimpsesto/num13/estudos/palimpsesto13estudos01.pdf
Textos de Pediatria: textos com termos
Complexidade textual: textos especializados
Terminologia Geral: foco conceitual
Terminologia variacionista
Terminologia Comunicativa
Terminologia com ênfase textual: o texto com termos
Terminologia
A complexidade textual de textos “com termos”
4
MÉTRICAS/ÍNDICES COMPARÁVEIS
TEXTOS PTG (FONTE)
COH-METRIX COH-METRIX-
PORT
TEXTOS ING (TRADUÇÕES)
Preparação dos textos
Análise dos resultados
Etapa 1: Coleta dos textos
Etapa 2: Seleção das ferramentas
Etapa 3: Resultados
ETAPAS DA PESQUISA
Conclusões
Etapa 1: Preparação dos textos Materiais – corpus
• 2 artigos do JPed (Jornal de Pediatria) em português
• Traduções dos 2 artigos do JPed para o inglês
• 2 contos literários brasileiros
• Traduções dos 2 contos para o inglês
• Total: 8 textos
5
Grupo 1: textos de Pediatria
Grupo 2: textos para comparação
Etapa 2: Materiais – ferramentas: Coh-Metrix
O Coh-Metrix é uma
ferramenta que calcula métricas e índices de
coesão e coerência de textos num amplo espectro
de medidas. Baseia-se em pesquisas de Linguística Computacional e Psicolinguística. A versão on-line oferece 60 métricas
para uso livre.
http://tool.cohmetrix.com/
Etapa 2: Materiais – ferramentas: Coh-Metrix-Port
• Adaptação do Coh-Metrix para o português, contando com 48 métricas.
http://www.nilc.icmc.usp.br:3000/
Ligado ao Projeto PorSimples – NILC, USP, UFSCar, UNESP, 2009
Etapa 2: Métricas/índices comparáveis
8
MÉTRICAS COH-METRIX-PORT
EQUIVALÊNCIA DAS
MÉTRICAS
COH-METRIX-ING
Métricas
Lexicais
Índice Flesch EQUIVALENTE Flesch Reading Ease
Número de palavras EQUIVALENTE Number of words
Incidência de palavras de conteúdo NÃO EQUIVALENTE Concreteness content words
Frequências TALVEZ Raw frequency
Mínimo frequências TALVEZ Min. Raw frequency
Métricas
Sintáticas
Operadores lógicos EQUIVALENTE Logic Operators
Palavras antes de verbos principais EQUIVALENTE Words before main verb
Types/tokens EQUIVALENTE Types/token
Incidência de Sintagmas Nominais EQUIVALENTE NP incidence
Incidência de conectivos EQUIVALENTE All conectives
Métricas
Referenciais e
Semânticas
Anáforas EQUIVALENTE Anaphor reference
Sobreposição de argumentos adjacentes EQUIVALENTE Adjacent argument overlap
Sobreposição de argumentos EQUIVALENTE Argument overlap
Legenda: azul = métricas e índices analisados; laranja = métricas e índices não comparáveis
Etapa 3: Análise dos resultados
9
Métrica
Jped – Texto 1 Jped – Texto 2 A promessa/ Light of
my life
Cantiga de esponsais/
Wedding song
Português Inglês Português Inglês Português Inglês Português Inglês
Types/tokens 0,63 0,64 0,62 0,619 0,79478 0,762 0,61385 0,576
Types/tokens ratio (variação do vocabulário) • JPed: variação entre os textos-fonte e traduções
bastante baixa ou quase nula. • Textos literários: diferença mais expressiva, com
variação menor nas traduções para o inglês, ou seja, o vocabulário foi mais repetido.
Etapa 3: Análise dos resultados
10
Métrica
Jped – Texto 1 Jped – Texto 2 A promessa/ Light of
my life
Cantiga de esponsais/
Wedding song
Português Inglês Português Inglês Português Inglês Português Inglês
Número de
palavras 1068 1044 1171 1277 1108 1183 1435 1653
Número de palavras: • JPed: não mostra um padrão, pois um deles é
traduzido com um maior número de palavras e o outro com menos.
• Textos literários: apresentam ambas maior número de palavras.
• Observação: 3 das 4 traduções apresentam mais palavras
que os textos-fonte.
Etapa 3: Análise dos resultados
11
Métrica
Jped – Texto 1 Jped – Texto 2 A promessa/ Light of
my life
Cantiga de esponsais/
Wedding song
Português Inglês Português Inglês Português Inglês Português Inglês
Operadores
lógicos 45,88 63,218 37,57 43,853 37,9061 49,028 55,0523 37,508
Operadores lógicos: • JPed: número expressivamente maior nas
traduções. • Textos literários: uma das traduções dos textos
literários mostra número maior de operadores lógicos e a outra, menor.
Etapa 3: Análise dos resultados
12
Métrica
Jped – Texto 1 Jped – Texto 2 A promessa/ Light of
my life
Cantiga de esponsais/
Wedding song
Português Inglês Português Inglês Português Inglês Português Inglês
Incidência de
sintagmas
nominais
304,307 283,525 298,035 245,106 284,2960 285,714 230,62 300,06
Incidência de sintagmas nominais: • JPed: incidência menor nas traduções. • Textos literários: uma das traduções mostra
incidência maior.
Etapa 3: Análise dos resultados
13
Métrica
Jped – Texto 1 Jped – Texto 2 A promessa/ Light of
my life
Cantiga de esponsais/
Wedding song
Português Inglês Português Inglês Português Inglês Português Inglês
Incidência de
conectivos 71,16 86,207 59,77 67,345 74,0072 79,459 86,4111 61,101
Incidência de conectivos: • JPed: as traduções apresentam incidência maior
dos que os textos-fonte em ambas as traduções.. • Textos literários: as traduções apresentam
incidência maior no caso do texto 1 e menor no caso do texto 2.
Etapa 3: Análise dos resultados
14
Métrica
Jped – Texto 1 Jped – Texto 2 A promessa/ Light of my
life
Cantiga de esponsais/
Wedding song
Português Inglês Português Inglês Português Inglês Português Inglês
Anáforas 0,0 0,046 0,0 0,063 0,1333 0,224 0,391304 0,219
Anáforas: • JPed: as traduções apresentam incidência maior
dos que os textos-fonte em ambas as traduções. • Textos literários: as traduções apresentam
incidência maior.
Etapa 3: Análise dos resultados
15
Métrica
Jped – Texto 1 Jped – Texto 2 A promessa/ Light of
my life
Cantiga de esponsais/
Wedding song
Português Inglês Português Inglês Português Inglês Português Inglês
Índice
Flesh 15,48 30,391 17,48 27,722 49,0490 65,06 66,87 78,623
Índice Flesch (quanto mais alto, mais fácil): • JPed: as traduções apresentam menor
complexidade dos que os textos-fonte. • Textos literários: as traduções apresentam
menor complexidade dos que os textos-fonte.
ÍNDICE FLESCH
• Rudolf Flesch – década de 50.
• Fórmula para avaliação de complexidade textual.
• Adaptada para o PT-BR – Nilc/USP, 1996.
• Pouco conhecida entre linguistas.
16
Índices entre 75 - 100 Muito fáceis
Textos adequados para leitores com nível de escolaridade até a quarta série do ensino fundamental
Índices entre 50 - 75
Fáceis Textos adequados a alunos com escolaridade até a oitava
série do ensino fundamental
Índices entre 25 - 50
Difíceis Textos adequados para alunos cursando o ensino médio ou
universitário
Índices entre 0 – 25
Muitos difíceis Textos adequados apenas para áreas acadêmicas
específicas
Etapa 3: Conclusões
• É possível fazer um levantamento estatístico de elementos coesivos (indicativos do nível de complexidade). – Exemplo: a proporção types/tokens, a incidência
de sintagmas nominais e a incidência de anáforas consideradas em relação umas com as outras num texto especializado: • uma variação pequena de vocabulário (uma proporção
types/tokens baixa), uma grande incidência de sintagmas e uma baixa presença de anáforas indica um elevado grau de repetição vocabular, o que, para um texto técnico-científico, talvez seja um indício de legibilidade e de densidade terminológica.
17
Observe os slides 15 e 16, sobre o índice Flesch.
• Seria possível afirmar que há uma diminuição do nível de complexidade nos textos traduzidos com base apenas nos resultados do índice Flesch?
• Que outro(s) elemento(s) complementaria(m) a afirmativa de que os textos traduzidos são mais ou menos complexos quando comparados aos seus textos-fonte?
18
Exercício