Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/52746
Type: Dissertação
Title: Mineração de opiniões comparativas em português
Other Titles: Mining comparative opinions in portuguese
Mining portuguese comparative opinions
Authors: Daniel Pimentel Kansaon
First Advisor: Fabrício Benevenuto de Souza
First Referee: Adriano César Machado Pereira
Second Referee: Flávio Vinícius Diniz de Figueiredo
Third Referee: Karin Becker
Abstract: A constante expansão do comércio eletrônico, recentemente impulsionada pela pandemia de COVID-19, tem levado a um grande aumento no número de compras online, feitas por clientes cada vez mais exigentes, que buscam por comentários e revisões na Web para auxiliar na tomada de decisão sobre a compra de produtos. Nessas revisões, parte das opiniões encontradas são comparações, que contrastam aspectos expressando preferência a um objeto em relação a outros, o que permite, por exemplo, que empresas entendam como clientes comparam seus produtos aos de seus concorrentes. Essas informações muitas vezes são negligenciadas pelas técnicas tradicionais de análise de sentimentos, que quase sempre capturam apenas sentimentos positivos ou negativos associados a aspectos de produtos. Apesar de recentes esforços voltados para a língua inglesa, quase nenhum estudo foi feito para o desenvolvimento de soluções apropriadas que permitam a análise de comparações na língua portuguesa. Este trabalho apresenta um dos primeiros estudos sobre opiniões comparativas na língua portuguesa. De maneira geral, o trabalho contém duas principais contribuições. Primeiramente, foi proposta uma abordagem hierárquica para a detecção de comparações, que consiste em uma etapa binária inicial, que subdivide as opiniões regulares das comparativas, para posteriormente categorizar as comparativas nos cinco grupos detalhados de opiniões: (1) Não Comparativa; (2) Gradativa com Predileção; (3) Equitativa; (4) Superlativa; e (5) Não Gradativa. Os resultados obtidos se mostram promissores, alcançando 87% de Macro-F1 e 0,94 de AUC para a etapa binária, e 61% de Macro-F1 para a categorização em múltiplas classes. Por fim, na segunda contribuição, foi proposto um algoritmo para detecção da entidade expressa como preferida em sentenças comparativas, alcançando valores de 94% de Macro-F1 para as Superlativas e aproximadamente 84% para as Gradativas com Predileção.
Abstract: The constant expansion of e-commerce, recently boosted due to the coronavirus pandemic, has led to a huge increase in online shopping, made by increasingly demanding customers, who seek comments and reviews on the Web to assist in decision-making regarding the purchase of products. In these reviews, part of the opinions found are comparisons, which contrast aspects expressing a preference for an object over others, allowing, for example, companies to know how customers compare their products to their competitors. However, this information is neglected by traditional sentiment analysis techniques, and it is not applicable for comparisons, since they do not directly express a positive or negative sentiment. In this context, despite efforts in the English language, almost no studies have been done to develop appropriate solutions that allow the analysis of comparisons in the Portuguese language. This work presents one of the first studies on comparative opinion in Portuguese. In general, this work contains two main contributions. First, a hierarchical approach for detecting comparisons was proposed, which consists of an initial binary step, which subdivides the regular opinions of the comparatives, to further categorize the comparatives into the five groups of opinions: (1) Non-Comparative; (2) Non-Equal Gradable; (3) Equative, (4) Superlative; and (5) Non-Gradable. The results obtained are promising, reaching 87% of Macro-F1 and 0.94 of AUC for the binary step, and 61% of Macro-F1 for classification in multiple classes. Finally, in the second contribution, an algorithm was proposed to detect the entity expressed as preferred in comparative sentences, reaching 94% of Macro-F1 for Superlative and almost 84% for Non-Equal Gradable opinions.
Subject: Computação – Teses
Mineração de opinião – Teses
Análise de sentimentos – Teses
Processamento de linguagem natural (Computacao) – Teses
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
metadata.dc.publisher.program: Programa de Pós-Graduação em Ciência da Computação
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/52746
Issue Date: 23-Feb-2021
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
UFMG_Dissertacao_Final.pdf1.72 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.