Mineração de opiniões comparativas em português

dc.creatorDaniel Pimentel Kansaon
dc.date.accessioned2023-05-03T14:38:05Z
dc.date.accessioned2025-09-09T01:17:26Z
dc.date.available2023-05-03T14:38:05Z
dc.date.issued2021-02-23
dc.description.abstractThe constant expansion of e-commerce, recently boosted due to the coronavirus pandemic, has led to a huge increase in online shopping, made by increasingly demanding customers, who seek comments and reviews on the Web to assist in decision-making regarding the purchase of products. In these reviews, part of the opinions found are comparisons, which contrast aspects expressing a preference for an object over others, allowing, for example, companies to know how customers compare their products to their competitors. However, this information is neglected by traditional sentiment analysis techniques, and it is not applicable for comparisons, since they do not directly express a positive or negative sentiment. In this context, despite efforts in the English language, almost no studies have been done to develop appropriate solutions that allow the analysis of comparisons in the Portuguese language. This work presents one of the first studies on comparative opinion in Portuguese. In general, this work contains two main contributions. First, a hierarchical approach for detecting comparisons was proposed, which consists of an initial binary step, which subdivides the regular opinions of the comparatives, to further categorize the comparatives into the five groups of opinions: (1) Non-Comparative; (2) Non-Equal Gradable; (3) Equative, (4) Superlative; and (5) Non-Gradable. The results obtained are promising, reaching 87% of Macro-F1 and 0.94 of AUC for the binary step, and 61% of Macro-F1 for classification in multiple classes. Finally, in the second contribution, an algorithm was proposed to detect the entity expressed as preferred in comparative sentences, reaching 94% of Macro-F1 for Superlative and almost 84% for Non-Equal Gradable opinions.
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.identifier.urihttps://hdl.handle.net/1843/52746
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectComputação – Teses
dc.subjectMineração de opinião – Teses
dc.subjectAnálise de sentimentos – Teses
dc.subjectProcessamento de linguagem natural (Computacao) – Teses
dc.subject.otherMineração de opinião
dc.subject.otherAnálise de sentimentos
dc.subject.otherProcessamento de linguagem natural
dc.subject.otherOpinião comparativa
dc.subject.otherDetecção de preferência
dc.titleMineração de opiniões comparativas em português
dc.title.alternativeMining comparative opinions in portuguese
dc.title.alternativeMining portuguese comparative opinions
dc.typeDissertação de mestrado
local.contributor.advisor1Fabrício Benevenuto de Souza
local.contributor.advisor1Latteshttp://lattes.cnpq.br/7014991384513854
local.contributor.referee1Adriano César Machado Pereira
local.contributor.referee1Flávio Vinícius Diniz de Figueiredo
local.contributor.referee1Karin Becker
local.creator.Latteshttp://lattes.cnpq.br/0273544672957360
local.description.resumoA constante expansão do comércio eletrônico, recentemente impulsionada pela pandemia de COVID-19, tem levado a um grande aumento no número de compras online, feitas por clientes cada vez mais exigentes, que buscam por comentários e revisões na Web para auxiliar na tomada de decisão sobre a compra de produtos. Nessas revisões, parte das opiniões encontradas são comparações, que contrastam aspectos expressando preferência a um objeto em relação a outros, o que permite, por exemplo, que empresas entendam como clientes comparam seus produtos aos de seus concorrentes. Essas informações muitas vezes são negligenciadas pelas técnicas tradicionais de análise de sentimentos, que quase sempre capturam apenas sentimentos positivos ou negativos associados a aspectos de produtos. Apesar de recentes esforços voltados para a língua inglesa, quase nenhum estudo foi feito para o desenvolvimento de soluções apropriadas que permitam a análise de comparações na língua portuguesa. Este trabalho apresenta um dos primeiros estudos sobre opiniões comparativas na língua portuguesa. De maneira geral, o trabalho contém duas principais contribuições. Primeiramente, foi proposta uma abordagem hierárquica para a detecção de comparações, que consiste em uma etapa binária inicial, que subdivide as opiniões regulares das comparativas, para posteriormente categorizar as comparativas nos cinco grupos detalhados de opiniões: (1) Não Comparativa; (2) Gradativa com Predileção; (3) Equitativa; (4) Superlativa; e (5) Não Gradativa. Os resultados obtidos se mostram promissores, alcançando 87% de Macro-F1 e 0,94 de AUC para a etapa binária, e 61% de Macro-F1 para a categorização em múltiplas classes. Por fim, na segunda contribuição, foi proposto um algoritmo para detecção da entidade expressa como preferida em sentenças comparativas, alcançando valores de 94% de Macro-F1 para as Superlativas e aproximadamente 84% para as Gradativas com Predileção.
local.identifier.orcid0000-0001-5990-1629
local.publisher.countryBrasil
local.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Ciência da Computação

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
UFMG_Dissertacao_Final.pdf
Tamanho:
1.68 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: