Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/62849
Type: Dissertação
Title: Construção de significados de emoções em textos de compartilhamento de experiências sobre autocuidados em diabetes nas mídias sociais
Authors: Rivaney Félix de Oliveira Junior
First Advisor: Adriana Silvina Pagano
First Referee: Evandro Landulfo Teixeira Paradela Cunha
Second Referee: Igor Antônio Lourenço da Silva
Abstract: Esta dissertação examina, com subsídios da linguística sistêmico-funcional (HALLIDAY; MATTHIESSEN, 2014), a tarefa computacional de Classificação de Emoções em corpora de textos em português brasileiro. A pesquisa buscou examinar que propriedades semântico-lexicais podem explicar a rotulação de um texto com uma categoria correspondente a uma dada emoção humana. Para tanto, foi compilado um corpus composto por textos adaptados de postagens em fóruns de discussão online no domínio do autocuidado em Diabetes. Os textos foram submetidos à anotação automática de emoções por um modelo computacional treinado para a língua portuguesa e, num segundo momento, anotados manualmente por estudantes de Letras, fazendo uso do mesmo conjunto de etiquetas utilizadas pelo modelo. As categorias de emoção classificadas pelo modelo e as anotadas pelos humanos foram primeiramente computadas e comparadas. Num segundo momento, os itens lexicais nos textos classificados pelo modelo com cada categoria de emoção foram examinados para verificar se havia um padrão lexical que pudesse explicar os resultados obtidos pelas métricas de Precisão (quantidade de acertos em relação ao total de textos classificados) e Sensibilidade (quantidade de textos de uma mesma emoção encontrados em relação ao total). Em seguida, as categorias de emoção classificadas pelo modelo e as anotadas pelos humanos foram comparadas em relação aos sentimentos Positivo e Negativo. O próximo passo foi analisar se havia alguma correlação entre as categorias de emoções que o modelo teve maior dificuldade em classificar corretamente. Por último, foram analisados os textos classificados pelo modelo como “Neutro” (não contendo emoção), assim como os textos que não receberam nenhuma categoria pelo modelo. Os resultados apontaram que o reconhecimento pelo modelo dos itens lexicais mais frequentes nos textos não é suficiente para uma correta classificação das emoções. Ao analisarmos os textos agrupados por sentimentos, foi possível observar que a presença de itens lexicais considerados negativos não necessariamente motivou a rotulação com emoções negativas. Em outras palavras, o contexto de situação teve maior impacto na rotulação dos textos pelos anotadores humanos do que o grau de negatividade e/ou positividade de um determinado item lexical em específico. As principais contribuições desta dissertação são a realização de um estudo sobre a linguagem utilizada para a construção de emoções em português brasileiro, bem como, a caracterização dos principais itens lexicais associados a emoções; a construção de um corpus que pode ser utilizado como um dataset para treinamento e refinamento de modelos; a avaliação do desempenho de um modelo de Classificação de Emoções treinado em um conjunto de dados num domínio quando aplicado a um outro domínio; e a comparação quantitativa e qualitativa dos resultados sob uma perspectiva linguística abrangente.
Abstract: This thesis reports on a systemic-functionally (HALLIDAY; MATTHIESSEN, 2014) informed study of the computational task known as Emotion Classification in a corpus of Brazilian Portuguese text. The study sought to examine which semantic-lexical properties can account for a given text to be labeled with a category pertaining to a given human emotion. To this end, a corpus was created consisting of texts adapted from posts in online discussion forums in the domain of diabetes self-care. First, the texts were automatically annotated for emotions by a computational model trained on a Brazilian Portuguese corpus. Second, the texts were manually annotated by language students using the model tagset. The emotion categories assigned by the model and those by humans were first computed for frequency and compared. Next, the lexical items in the texts classified by the model with each emotion category were examined to observe if there was a lexical pattern that could explain the results obtained for the metrics of Precision (number of correct answers in relation to the total of classified texts) and Sensitivity (number of texts of the same emotion found in relation to the total). Then, the texts were compared in terms of Positive and Negative sentiment. Subsequently, an analysis was carried out to find any correlation between the classes of emotions that the model failed to classify correctly. Finally, the texts classified by the model as “Neutral” (containing no emotion) were analyzed, as well as the texts that were not assigned any category. The results showed that relying on the most frequent lexical items in the texts is not sufficient for the model to correctly assign emotion categories. The analysis of texts grouped by sentiment showed that the mere occurrence of negative lexical items did not lead annotators to label those texts with negative emotions. In other words, context of situation, rather than the negative or positive meaning of a lexical item, proved to have had more impact on annotators' labeling of emotions. The main contributions of this thesis are thus the results of a study on the language used to construe emotions in Brazilian Portuguese together with the characterization of the main lexical items pertaining to emotion categories; the compilation of a corpus that can be used as a dataset to train a model to be applied on a new domain; an evaluation of the performance of an Emotion Classification model trained on a particular domain dataset when applied to a new domain; and a quantitative and qualitative comparison of the results from a comprehensive linguistic perspective.
Subject: Tradução e interpretação
Linguística aplicada
Funcionalismo (Linguística)
Emoções
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: FALE - FACULDADE DE LETRAS
metadata.dc.publisher.program: Programa de Pós-Graduação em Estudos Linguísticos
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI: http://hdl.handle.net/1843/62849
Issue Date: 14-Aug-2023
Appears in Collections:Dissertações de Mestrado



This item is licensed under a Creative Commons License Creative Commons