Escrita, tradução automática e autopós-edição de resumos acadêmicos: uma análise textual com base em taxonomia de erros

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Deise Prina Dutra
Norma Barbosa de Lima Fonseca

Resumo

O inglês, como língua dominante da ciência, representa uma barreira para pesquisadores não anglófonos, que precisam ler, pesquisar e publicar em uma língua estrangeira (Van Dijk, 1994). Dado que publicações em periódicos de alto impacto são essenciais para o avanço na carreira acadêmica, os tradutores automáticos apresentam-se como alternativa acessível (Bowker, Ciro, 2019). Essa ferramenta viabiliza a pós-edição, um processo em que um texto é traduzido automaticamente para outra língua e, em seguida, é editado, de forma a corrigir possíveis erros e gerar um texto de qualidade (Allen, 2003, Mesa-Lao, 2015). Na continuidade do projeto de Nunes (2021), o presente estudo investiga a influência da autopós-edição na qualidade de resumos acadêmicos em inglês, analisando a frequência e os tipos de erros encontrados nesses textos com base nas categorias estabelecidas pela taxonomia de Costa et al. (2015). Para tanto, compilamos um corpus paralelo bilíngue, composto por resumos originais escritos em português brasileiro e suas respectivas traduções automáticas e autopós-edições. Os textos foram produzidos por doutorandos de três grandes áreas do conhecimento: Ciências Exatas e da Terra, Ciências Humanas e Ciências Sociais Aplicadas. Para a anotação dos erros, adaptamos a taxonomia de Costa et al. (2015), destinada à categorização tanto de erros humanos quanto de sistemas de tradução automática. Realizamos a análise quantitativa dos dados, extraindo-os com o auxílio de scripts em Python para a contagem de erros e análise estatística. Os resultados indicam um aumento significativo na frequência de erros nos resumos autopós-editados em comparação com os originais em português, o que pode ser atribuído tanto a limitações na proficiência linguística dos autores quanto a uma pré-edição inadequada. A ordem em que as tarefas foram realizadas também influenciou os resultados, dado que a escrita em inglês anterior à autopós-edição contribuiu para textos de maior qualidade. Finalmente, os estudantes de Ciências Humanas cometeram um número significativamente maior de erros, sugerindo que a familiaridade com a escrita acadêmica em inglês pode variar entre as áreas do conhecimento. Esta pesquisa tem o potencial de contribuir tanto para o ensino e aprendizado de línguas quanto para a compreensão da influência dos sistemas de tradução automática na produção acadêmica de estudantes universitários.

Abstract

English, as the dominant language of science, poses a barrier for non-native researchers who must read, conduct research, and publish in a foreign language (Van Dijk, 1994). Given that publications in high-impact journals are essential for academic career advancement, machine translation tools emerge as an accessible alternative. These tools enable post-editing, a process in which the machine translated text is revised to correct potential errors and produce better quality outputs (Allen, 2003; Mesa-Lao, 2015). Drawing on Nunes (2021), this study investigates the impact of self-post-editing on the quality of academic abstracts in English by analyzing the frequency and types of errors found in these texts based on the categories established by Costa et al.'s taxonomy (2015). A bilingual parallel corpus was compiled, consisting of original abstracts in Brazilian Portuguese, their automatic translations, and their post-edited versions produced by doctoral students from three major fields of knowledge: Earth and Exact Sciences, Humanities, and Applied Social Sciences. For error annotation, an adapted version of Costa et al.'s taxonomy (2015), designed for categorizing both human and machine errors, was employed. Quantitative analysis was performed, with error counts and statistical analysis conducted using Python scripts. The results indicate a significant increase in error frequency in self-post-edited abstracts compared to their original Portuguese versions, which can be attributed to both linguistic proficiency limitations of the authors and inadequate pre-editing. Task sequencing also influenced the outcomes, as writing directly in English prior to self-post-editing contributed to higher-quality texts. Finally, students from the Humanities realm made significantly more errors, suggesting that familiarity with academic writing in English may vary across disciplines. This research has the potential to contribute both to language teaching and learning and to understanding the influence of machine translation systems on the academic production of university students.

Assunto

Tradução e interpretação, Tradução automática, Redação acadêmica

Palavras-chave

Escrita acadêmica, Tradução automática, Autopós-edição, Taxonomia de erros

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Aberto