Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/LETR-AX2HPS
Type: Dissertação de Mestrado
Title: Uma abordagem sistêmico-funcional da Análise de Sentimentos em português brasileiro orientada para aplicações multilíngues
Authors: Julia Santos Nunes Rodrigues
First Advisor: Adriana Silvina Pagano
First Co-advisor: Heloisa de Carvalho Torres
First Referee: Leonardo Pereira Nunes
Second Referee: Kelen Cristina Sant Anna de Lima
Abstract: Esta dissertação introduz uma abordagem sistêmico-funcional (HALLIDAY; MATTHIESSEN, 2014) para a Análise de Sentimentos em português brasileiro. A pesquisa buscou examinar padrões gramaticais que podem ser associados à caracterização das emoções na linguagem. Para tal fim, foi utilizada uma amostra de um corpus de linhas finas de notícias escritas em português brasileiro, compiladas previamente por pesquisadores da PUC/PR e anotadas por professores do ensino superior com experiência em linguística da PUC/PR e da Universidade Tecnológica Federal do Paraná (UTFPR) com categorias correspondentes às emoções humanas definidas por Ekman (1970) Tristeza, Repugnância, Medo, Raiva, Neutro, Alegria e Surpresa. A amostra foi segmentada em orações, as quais foram anotadas manualmente de acordo com as categorias relativas aos sistemas de cada uma das Metafunções da linguagem Interpessoal, Ideacional e Textual como estabelecidas por Halliday e Matthiessen (2014). Dois scripts foram desenvolvidos no software e ambiente computacional R (R CORE TEAM, 2018), o primeiro destinado à identificação de padrões gramaticais nas orações anotadas e o segundo à análise de agrupamento das categorias correspondentes às emoções humanas, realizada com base nos sistemas gramaticais selecionados para as orações anotadas. Os resultados obtidos por meio do primeiro script evidenciaram que há sistemas gramaticais que apresentaram maior potencial para caracterizar as categorias correspondentes às emoções. O sistema da Transitividade foi um dos sistemas anotados que mais contribuiu para essa caracterização. O sistema de Dêixis e a presença ou ausência de Complementos e/ou Adjuntos também tiveram impacto sob essa caracterização. Ainda, o Tema Ideacional e o Tema Textual apresentaram resultados que auxiliaram essa caracterização. Foram observados sistemas que não apresentaram potencial para caracterizar as categorias correspondentes às emoções, como os sistemas de Sujeitabilidade: Número e Sujeitabilidade: Pressuposição, no escopo da Metafunção Interpessoal, e o sistema de Tema Interpessoal no escopo da Metafunção Textual, uma vez que os resultados obtidos apontaram escolhas predominantes para a maior parte das orações anotadas. Os resultados encontrados através do segundo script mostraram que as configurações obtidas para as categorias correspondentes às emoções Alegria e Surpresa são consideradas gramaticalmente semelhantes. As categorias correspondentes às emoções Tristeza e Repugnância apresentaram configurações gramaticais diferentes por formarem um agrupamento isolado das outras categorias correspondentes às demais emoções. Os resultados encontrados a partir da anotação das orações pertencentes às categorias correspondentes à emoção Medo, à ausência de emoção, Neutro e, por último, à Raiva são considerados gramaticalmente similares aos obtidos para as categorias correspondentes às emoções que se agruparam primeiro Alegria e Surpresa. O impacto deste trabalho diz respeito ao potencial da metodologia com base gramatical para aplicações multilíngues proposta neste estudo, a qual pode beneficiar as pesquisas que lidam com a Análise de Sentimentos, uma vez que os padrões encontrados podem subsidiar o desenvolvimento de um algoritmo para aprendizado de máquina.
Abstract: This thesis introduces a systemic-functional approach (HALLIDAY; MATTHIESSEN, 2014) to Sentiment Analysis in Brazilian Portuguese. It focuses on grammatical patterns that can be associated with characterization of emotions in language. The text sample herein analyzed was retrieved from a corpus of sub headlines of newspaper articles written in Brazilian Portuguese, previously compiled by researchers at PURC/PR and annotated with categories naming emotions as defined by Ekman (1970), namely Sadness, Disgust, Fear, Anger, Neutral, Happiness, and Surprise, by language lecturers at PUC/PR and Federal University of Technology Paraná (UTFPR). The sample was segmented into clauses, which were manually annotated according to grammatical categories pertaining to the three language Metafunctions Interpersonal, Ideational, and Textual as established by Halliday e Matthiessen (2014). Two scripts were developed within the R software and environment (R CORE TEAM, 2018), the first one designed for identification of grammatical patterns in annotated clauses and the second one for cluster analysis of categories naming emotions based on selected categories for each group of annotated clauses. The first script yielded results showing grammatical systems potentially useful to characterize categories naming emotions. The Transitivity system was one of the annotated systems that contributed the most to characterization of categories naming emotions. The system of Deixis and presence or absence of Complements and/or Adjuncts had impact on characterization of categories naming emotions as well. Ideational Theme and Textual Theme pointed out results that also supported characterization of categories naming emotions. There were systems that did not show potential to characterize these categories naming emotions, as the systems of Subject Number and Subject Presumption pertaining to the Interpersonal Metafunction and the system of Interpersonal Theme regarding the Textual Metafunction, as these systems presented predominant choices to most of the annotated clauses. Results yielded by the second script showed that configurations obtained for categories corresponding to emotions of Happiness and Surprise were grammatically similar. Categories corresponding to emotions of Sadness and Disgust had different configurations in comparison to categories that corresponded to other emotions, because they composed an isolated group. Results obtained for category corresponding to emotion of Fear, for category corresponding to absence of emotion, Neutral, and, finally, for category corresponding to emotion of Anger were grammatically similar to those obtained for categories corresponding to emotions that formed the first group Happiness and Surprise. The impact of this study has to do with potential multilingual applications of the grammatical approach herein proposed, which may enhance research on Sentiment Analysis, since grammatical patterns can be useful to support the development of an algorithm for machine learning.
Subject: Funcionalismo (Linguística)
Traduções Estudo e ensino
Língua portuguesa Gramática
Tradução e interpretação
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/LETR-AX2HPS
Issue Date: 9-Feb-2018
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
1884m.pdf2.4 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.