Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/62849
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Adriana Silvina Paganopt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/9048531014341931pt_BR
dc.contributor.referee1Evandro Landulfo Teixeira Paradela Cunhapt_BR
dc.contributor.referee2Igor Antônio Lourenço da Silvapt_BR
dc.creatorRivaney Félix de Oliveira Juniorpt_BR
dc.creator.Latteshttp://lattes.cnpq.br/4819289003837891pt_BR
dc.date.accessioned2024-01-16T12:48:59Z-
dc.date.available2024-01-16T12:48:59Z-
dc.date.issued2023-08-14-
dc.identifier.urihttp://hdl.handle.net/1843/62849-
dc.description.abstractThis thesis reports on a systemic-functionally (HALLIDAY; MATTHIESSEN, 2014) informed study of the computational task known as Emotion Classification in a corpus of Brazilian Portuguese text. The study sought to examine which semantic-lexical properties can account for a given text to be labeled with a category pertaining to a given human emotion. To this end, a corpus was created consisting of texts adapted from posts in online discussion forums in the domain of diabetes self-care. First, the texts were automatically annotated for emotions by a computational model trained on a Brazilian Portuguese corpus. Second, the texts were manually annotated by language students using the model tagset. The emotion categories assigned by the model and those by humans were first computed for frequency and compared. Next, the lexical items in the texts classified by the model with each emotion category were examined to observe if there was a lexical pattern that could explain the results obtained for the metrics of Precision (number of correct answers in relation to the total of classified texts) and Sensitivity (number of texts of the same emotion found in relation to the total). Then, the texts were compared in terms of Positive and Negative sentiment. Subsequently, an analysis was carried out to find any correlation between the classes of emotions that the model failed to classify correctly. Finally, the texts classified by the model as “Neutral” (containing no emotion) were analyzed, as well as the texts that were not assigned any category. The results showed that relying on the most frequent lexical items in the texts is not sufficient for the model to correctly assign emotion categories. The analysis of texts grouped by sentiment showed that the mere occurrence of negative lexical items did not lead annotators to label those texts with negative emotions. In other words, context of situation, rather than the negative or positive meaning of a lexical item, proved to have had more impact on annotators' labeling of emotions. The main contributions of this thesis are thus the results of a study on the language used to construe emotions in Brazilian Portuguese together with the characterization of the main lexical items pertaining to emotion categories; the compilation of a corpus that can be used as a dataset to train a model to be applied on a new domain; an evaluation of the performance of an Emotion Classification model trained on a particular domain dataset when applied to a new domain; and a quantitative and qualitative comparison of the results from a comprehensive linguistic perspective.pt_BR
dc.description.resumoEsta dissertação examina, com subsídios da linguística sistêmico-funcional (HALLIDAY; MATTHIESSEN, 2014), a tarefa computacional de Classificação de Emoções em corpora de textos em português brasileiro. A pesquisa buscou examinar que propriedades semântico-lexicais podem explicar a rotulação de um texto com uma categoria correspondente a uma dada emoção humana. Para tanto, foi compilado um corpus composto por textos adaptados de postagens em fóruns de discussão online no domínio do autocuidado em Diabetes. Os textos foram submetidos à anotação automática de emoções por um modelo computacional treinado para a língua portuguesa e, num segundo momento, anotados manualmente por estudantes de Letras, fazendo uso do mesmo conjunto de etiquetas utilizadas pelo modelo. As categorias de emoção classificadas pelo modelo e as anotadas pelos humanos foram primeiramente computadas e comparadas. Num segundo momento, os itens lexicais nos textos classificados pelo modelo com cada categoria de emoção foram examinados para verificar se havia um padrão lexical que pudesse explicar os resultados obtidos pelas métricas de Precisão (quantidade de acertos em relação ao total de textos classificados) e Sensibilidade (quantidade de textos de uma mesma emoção encontrados em relação ao total). Em seguida, as categorias de emoção classificadas pelo modelo e as anotadas pelos humanos foram comparadas em relação aos sentimentos Positivo e Negativo. O próximo passo foi analisar se havia alguma correlação entre as categorias de emoções que o modelo teve maior dificuldade em classificar corretamente. Por último, foram analisados os textos classificados pelo modelo como “Neutro” (não contendo emoção), assim como os textos que não receberam nenhuma categoria pelo modelo. Os resultados apontaram que o reconhecimento pelo modelo dos itens lexicais mais frequentes nos textos não é suficiente para uma correta classificação das emoções. Ao analisarmos os textos agrupados por sentimentos, foi possível observar que a presença de itens lexicais considerados negativos não necessariamente motivou a rotulação com emoções negativas. Em outras palavras, o contexto de situação teve maior impacto na rotulação dos textos pelos anotadores humanos do que o grau de negatividade e/ou positividade de um determinado item lexical em específico. As principais contribuições desta dissertação são a realização de um estudo sobre a linguagem utilizada para a construção de emoções em português brasileiro, bem como, a caracterização dos principais itens lexicais associados a emoções; a construção de um corpus que pode ser utilizado como um dataset para treinamento e refinamento de modelos; a avaliação do desempenho de um modelo de Classificação de Emoções treinado em um conjunto de dados num domínio quando aplicado a um outro domínio; e a comparação quantitativa e qualitativa dos resultados sob uma perspectiva linguística abrangente.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentFALE - FACULDADE DE LETRASpt_BR
dc.publisher.programPrograma de Pós-Graduação em Estudos Linguísticospt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Abertopt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/pt/*
dc.subjectLinguística sistêmico-funcionalpt_BR
dc.subjectAnálise de sentimentospt_BR
dc.subjectClassificação de emoçõespt_BR
dc.subjectProcessamento de língua naturalpt_BR
dc.subject.otherTradução e interpretaçãopt_BR
dc.subject.otherLinguística aplicadapt_BR
dc.subject.otherFuncionalismo (Linguística)pt_BR
dc.subject.otherEmoçõespt_BR
dc.titleConstrução de significados de emoções em textos de compartilhamento de experiências sobre autocuidados em diabetes nas mídias sociaispt_BR
dc.typeDissertaçãopt_BR
Appears in Collections:Dissertações de Mestrado



This item is licensed under a Creative Commons License Creative Commons