Viés de gênero na tradução automática: uma avaliação no par inglês-português
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Helena de Medeiros Caseli
Yohan Bonescki Gumiel
Yohan Bonescki Gumiel
Resumo
Modelos de tradução automática neural (NMT) possibilitaram avanços consideráveis na qualidade das traduções geradas (Castilho; Caseli, 2023). Entretanto, tais modelos ainda têm limitações (Caseli, 2017; Castilho; Caseli, 2023); por exemplo, a produção de linguagem que promove distintos tipos de vieses (Bianchi et al., 2023), como é o caso do viés de gênero. Gênero, enquanto uma feature linguística, representa um desafio para a TA, especialmente quando um sistema precisa trabalhar com uma língua-fonte que é categorizada como de gênero mínimo ou de gênero conceitual (Salvodi et al., 2021), as quais tendem a não realizar marcações morfológicas de gênero gramatical em substantivos e adjetivos que designam pessoas, em contraste com uma língua-alvo que realiza tais marcações (Stanovsky; Smith; Zettlemoyer, 2019). Portanto, avaliar viés em sistemas de TA faz-se necessário para identificar limitações e promover melhorias (Popović; Castilho, 2019; Castilho et al., 2023), além de mitigar riscos semióticos (Matthiessen, 2013) relacionados à comunicação mediada por esses sistemas de TA. Segundo Matthiessen (2013), o risco semiótico engloba potenciais problemas decorrentes de falhas ou distorções na comunicação e no fluxo de informações em sistemas semióticos, o que inclui a linguagem e outros meios de significação utilizados na transmissão de informações. Este estudo apresenta os resultados de uma avaliação quantitativa e qualitativa de viés em traduções automáticas. A abordagem quantitativa baseia-se em uma adaptação do código de avaliação automática de Stanovsky, Smith e Zettlemoyer (2019), ajustado para avaliar as traduções do corpus de teste WinoMT para o português. A análise qualitativa das TAs é conduzida sob a perspectiva da Teoria Sistêmico-Funcional (Halliday, 1950). O corpus utilizado, o WinoMT, foi criado com a finalidade de avaliar a capacidade dos modelos de TA para lidar com o gênero gramatical de substantivos relacionados a profissões (Stanovsky; Smith; Zettlemoyer, 2019). Esse corpus de teste foi traduzido do inglês para o português pelos tradutores automáticos comerciais Microsoft Translator (Azure), Amazon Translate (AWS) e Google Translate, bem como pelo modelo de língua GPT-3.5 Turbo. Os resultados indicam que os quatro modelos apresentam melhor desempenho na tradução de profissões (entidades-alvo) quando o gênero de referência (no padrão-ouro) é masculino do que quando o gênero é feminino. Além disso, os quatro modelos tendem a apresentar maior acurácia na tradução das entidades-alvo quando o gênero de referência da profissão reforça estereótipos sociais de gênero. Já quando a entidade-alvo no corpus possui um gênero considerado antiestereotipado, os modelos avaliados tendem a gerar traduções com viés.
Abstract
Neural machine translation (NMT) models have achieved considerable improvements in the quality of their renditions (Castilho; Caseli, 2023). However, such models still present limitations (Caseli, 2017; Castilho; Caseli, 2023), e.g., the reproduction of language that promotes various types of bias (Bianchi et al., 2023), such as gender bias. Gender as a linguistic feature poses a challenge for MT, especially when it comes to translating from a source language that does not realize gender or has notional gender into a language that morphologically realizes grammatical gender (Stanovsky; Smith; Zettlemoyer, 2019; Salvodi et al., 2021). Therefore, evaluating MT systems proves necessary to identify limitations and promote improvements (Popović; Castilho, 2019; Castilho et al., 2023), in addition to mitigating semiotic risks (Matthiessen, 2013) associated to communication mediated by such systems. According to Matthiessen (2013), the notion of semiotic risk encompasses potential problems derived from miscommunication or distortions in communication and in the information flux in semiotic systems, which includes language and other meaning-making media used in information transmission. This thesis reports on a quantitative and qualitative investigation of machine translated sentences. The quantitative approach was conducted by adapting the automatic evaluation code proposed by Stanovsky, Smith and Zettlemoyer (2019) to evaluate translations from the test corpus WinoMT into Portuguese. Concomitantly, the qualitative analysis of the automatic translations was performed from the perspective of Systemic-Functional Theory (Halliday, 1950). To carry out our study , WinoMT, a test corpus designed to evaluate MT models’ capacity of dealing with the grammatical gender of nouns related to professions (Stanovsky; Smith; Zettlemoyer, 2019), was translated from English into Portuguese by the commercial MT models Microsoft Translator (Azure), Amazon Translate (AWS) and Google Translate, as well as the large language model GPT-3.5 Turbo. Results show that the four models perform better in translating occupations (target entities) when the reference gender is male rather than female. In addition, the four models show more accuracy in translating target entities when the reference gender (gold standard) of the occupation reinforces social gender stereotypes. When the target entity is assigned a gender in an anti-stereotypical way, the models generate translations promoting gender bias.
Assunto
Tradução e interpretação, Traduções – Estudo e ensino, Inteligência artificial – Aplicações educacionais, Processamento da linguagem natural (Computação), Língua portuguesa – Gênero
Palavras-chave
Tradução automática, Viés de gênero, Gênero gramatical, Gênero social, Processamento de Linguagem Natural, Inteligência Artificial
Citação
Departamento
Endereço externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Restrito
