Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/60247
Type: Tese
Title: Context-enriched Natural Language Generation models
Other Titles: Modelos de Geração de Linguagem Natural enriquecidos com contexto
Authors: Rossana da Cunha Flores
First Advisor: Fábio Alves da Silva Júnior
First Co-advisor: Adriana Silvina Pagano
metadata.dc.contributor.advisor-co2: Thiago Castro Ferreira
First Referee: Igor Antônio Lourenço da Silva
Second Referee: Yohan Bonescki Gumiel
Third Referee: Evandro Landulfo Teixeira Paradela Cunha
metadata.dc.contributor.referee4: Maucha Andrade Gamonal
Abstract: Com o advento de agentes conversacionais ou chatbots e a disseminação digital generalizada de informações em domínios criticamente sensíveis, como a governança e a saúde, a necessidade de modelar a geração de linguagem natural a fim de alcançar interlocutores humanos tornou-se ainda mais importante. Embora os modelos de Processamento de Linguagem Natural (PLN) tenham ganhado atenção substancial, apenas nos últimos anos a pesquisa abriu novos caminhos para abordar a Interação Humano-computador (IHC) a partir da perspectiva da linguagem natural. Entre esses, poucos estudos investigaram como desenvolver modelos de produção de linguagem através de uma perspectiva do Design Centrado em Humanos (HCD) na construção de modelos Geração de Linguagem Natural (GLN) enriquecidos de contexto desde a concepção. Com base nos princípios da metodologia HCD, esta tese compila três estudos que visam enriquecer modelos GLN com contexto a fim de gerar textos para uma comunicação eficaz, além de oferecer uma melhora produtiva na compreensão e experiência do usuário. O primeiro estudo se concentra em uma tarefa particular de modelos de GLN, conhecida como Geração de Expressão de Referência (REG), abordando a lacuna dos modelos REG de última geração em lidar com entidades que não foram vistas durante seu treinamento e assim prejudicando a compreensão do texto final. A partir dos resultados das avaliações automática e humana e de um estudo de ablação que utiliza o corpus WebNLG, esta primeira abordagem contribui para gerar expressões de referência mais significativas a entidades não vistas. O segundo estudo colabora com o desenvolvimento do DaMata, um robô jornalista que produz relatórios diários e mensais automaticamente sobre o desmatamento na Amazônia Legal. Com o enriquecimento contextual do componente REG, o DaMata pode fornecer informações mais diversificadas e alcançar uma maior audiência. Além disso, a estrutura de pipeline do DaMata assegura a publicação de dados de alta fidelidade e promove uma melhor experiência do usuário. Finalmente, no terceiro estudo, o principal objetivo é o desenvolvimento de um modelo GLN centrado em humanos através de uma abordagem de agente conversacional de pergunta e resposta para o domínio da saúde. Foram criadas personas de forma a modelar as relações interpessoais (usuários especialistas e não especialistas) nesse domínio em particular. A terceira abordagem apresentou resultados competitivos através do enriquecimento de contexto centrado em humanos, e com direcionamentos para implementações mais adequadas às relações entre humanos e PLN - PLN Centrado em Humanos. Além disso, mostramos que uma abordagem HCD pode beneficiar a geração de linguagem da perspectiva das "máquinas", mas principalmente dos humanos, que são os principais atores do PLN. No geral, esta tese contribui com novas direções para contextos com poucos recursos (idiomas diferentes do inglês e domínios sensíveis) onde a necessidade de promover uma comunicação eficaz é essencial.
Abstract: With the advent of conversational agents or chatbots and the widespread digital dissemination of information on critically sensitive domains, such as governance and healthcare, the need to model natural language generation to target human interlocutors has become all the more important. While Natural Language Processing (NLP) models have gained substantial attention, only in recent years has research opened new paths for tackling Human-Computer Interaction (HCI) from the perspective of natural language. Among those, just a few have investigated how to develop language production models using a Human-Centered Design (HCD) perspective to build context-enriched Natural Language Generation (NLG) models from their conceptions. Drawing on the tenets of the HCD methodology, this thesis compiles three studies aimed at enriching NLG models with context in order to generate texts for successful human communication, offering a productive improvement in user comprehension and experience. The first study focuses on a particular task of NLG models known as Referring Expression Generation (REG). We address the gap in state-of-the-art REG models when dealing with entities not seen during their training, compromising the comprehension of the final text. Drawing on the results of the automatic and human evaluation and an ablation study using the WebNLG corpus, this first approach contributes to generating more meaningful referring expressions to unseen entities. The second study collaborates with the development of DaMata, a robot journalist that automatically produces daily and monthly reports about the deforestation of the Legal Amazon area. With the context enrichment of the REG component, DaMata can provide more diverse information and reach wider audiences. Moreover, DaMata's pipeline framework ensures high-fidelity data publishing and enhances user experience. Finally, in the third study, we focus on developing a human-centered NLG model within a conversational question-answering system in the healthcare domain. We created personas to model interpersonal interaction (expert and non-expert users) in that specific domain. The third approach presented competitive results with a human-centered context enrichment, giving direction to more adequate relations between humans and NLP - Human-Centered NLP. In addition, we showed that an HCD approach benefits language generation from the perspective of "machines" but mainly humans, who are the primary actors within NLP. Overall, this thesis contributes with new directions to low-resource contexts (languages other than English and sensitive domains) where the need to promote effective communication is essential.
Subject: Linguística aplicada
Linguística – Processamento de dados
Processamento da linguagem natural (Computação)
language: eng
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: FALE - FACULDADE DE LETRAS
metadata.dc.publisher.program: Programa de Pós-Graduação em Estudos Linguísticos
Rights: Acesso Restrito
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-sa/3.0/pt/
URI: http://hdl.handle.net/1843/60247
Issue Date: 1-Sep-2023
metadata.dc.description.embargo: 1-Sep-2025
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
rossana_cunha_phd_thesis_2023.pdf
???org.dspace.app.webui.jsptag.ItemTag.restrictionUntil??? 2025-09-01
5.54 MBAdobe PDFView/Open    Request a copy


This item is licensed under a Creative Commons License Creative Commons