Viés de gênero na tradução automática: uma avaliação no par inglês-português

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Helena de Medeiros Caseli
Yohan Bonescki Gumiel

Resumo

Modelos de tradução automática neural (NMT) possibilitaram avanços consideráveis na qualidade das traduções geradas (Castilho; Caseli, 2023). Entretanto, tais modelos ainda têm limitações (Caseli, 2017; Castilho; Caseli, 2023); por exemplo, a produção de linguagem que promove distintos tipos de vieses (Bianchi et al., 2023), como é o caso do viés de gênero. Gênero, enquanto uma feature linguística, representa um desafio para a TA, especialmente quando um sistema precisa trabalhar com uma língua-fonte que é categorizada como de gênero mínimo ou de gênero conceitual (Salvodi et al., 2021), as quais tendem a não realizar marcações morfológicas de gênero gramatical em substantivos e adjetivos que designam pessoas, em contraste com uma língua-alvo que realiza tais marcações (Stanovsky; Smith; Zettlemoyer, 2019). Portanto, avaliar viés em sistemas de TA faz-se necessário para identificar limitações e promover melhorias (Popović; Castilho, 2019; Castilho et al., 2023), além de mitigar riscos semióticos (Matthiessen, 2013) relacionados à comunicação mediada por esses sistemas de TA. Segundo Matthiessen (2013), o risco semiótico engloba potenciais problemas decorrentes de falhas ou distorções na comunicação e no fluxo de informações em sistemas semióticos, o que inclui a linguagem e outros meios de significação utilizados na transmissão de informações. Este estudo apresenta os resultados de uma avaliação quantitativa e qualitativa de viés em traduções automáticas. A abordagem quantitativa baseia-se em uma adaptação do código de avaliação automática de Stanovsky, Smith e Zettlemoyer (2019), ajustado para avaliar as traduções do corpus de teste WinoMT para o português. A análise qualitativa das TAs é conduzida sob a perspectiva da Teoria Sistêmico-Funcional (Halliday, 1950). O corpus utilizado, o WinoMT, foi criado com a finalidade de avaliar a capacidade dos modelos de TA para lidar com o gênero gramatical de substantivos relacionados a profissões (Stanovsky; Smith; Zettlemoyer, 2019). Esse corpus de teste foi traduzido do inglês para o português pelos tradutores automáticos comerciais Microsoft Translator (Azure), Amazon Translate (AWS) e Google Translate, bem como pelo modelo de língua GPT-3.5 Turbo. Os resultados indicam que os quatro modelos apresentam melhor desempenho na tradução de profissões (entidades-alvo) quando o gênero de referência (no padrão-ouro) é masculino do que quando o gênero é feminino. Além disso, os quatro modelos tendem a apresentar maior acurácia na tradução das entidades-alvo quando o gênero de referência da profissão reforça estereótipos sociais de gênero. Já quando a entidade-alvo no corpus possui um gênero considerado antiestereotipado, os modelos avaliados tendem a gerar traduções com viés.

Abstract

Neural machine translation (NMT) models have achieved considerable improvements in the quality of their renditions (Castilho; Caseli, 2023). However, such models still present limitations (Caseli, 2017; Castilho; Caseli, 2023), e.g., the reproduction of language that promotes various types of bias (Bianchi et al., 2023), such as gender bias. Gender as a linguistic feature poses a challenge for MT, especially when it comes to translating from a source language that does not realize gender or has notional gender into a language that morphologically realizes grammatical gender (Stanovsky; Smith; Zettlemoyer, 2019; Salvodi et al., 2021). Therefore, evaluating MT systems proves necessary to identify limitations and promote improvements (Popović; Castilho, 2019; Castilho et al., 2023), in addition to mitigating semiotic risks (Matthiessen, 2013) associated to communication mediated by such systems. According to Matthiessen (2013), the notion of semiotic risk encompasses potential problems derived from miscommunication or distortions in communication and in the information flux in semiotic systems, which includes language and other meaning-making media used in information transmission. This thesis reports on a quantitative and qualitative investigation of machine translated sentences. The quantitative approach was conducted by adapting the automatic evaluation code proposed by Stanovsky, Smith and Zettlemoyer (2019) to evaluate translations from the test corpus WinoMT into Portuguese. Concomitantly, the qualitative analysis of the automatic translations was performed from the perspective of Systemic-Functional Theory (Halliday, 1950). To carry out our study , WinoMT, a test corpus designed to evaluate MT models’ capacity of dealing with the grammatical gender of nouns related to professions (Stanovsky; Smith; Zettlemoyer, 2019), was translated from English into Portuguese by the commercial MT models Microsoft Translator (Azure), Amazon Translate (AWS) and Google Translate, as well as the large language model GPT-3.5 Turbo. Results show that the four models perform better in translating occupations (target entities) when the reference gender is male rather than female. In addition, the four models show more accuracy in translating target entities when the reference gender (gold standard) of the occupation reinforces social gender stereotypes. When the target entity is assigned a gender in an anti-stereotypical way, the models generate translations promoting gender bias.

Assunto

Tradução e interpretação, Traduções – Estudo e ensino, Inteligência artificial – Aplicações educacionais, Processamento da linguagem natural (Computação), Língua portuguesa – Gênero

Palavras-chave

Tradução automática, Viés de gênero, Gênero gramatical, Gênero social, Processamento de Linguagem Natural, Inteligência Artificial

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Restrito