An unsupervised approach based on self-learning for the combination of sentiment analysis methods

dc.creatorPhilipe de Freitas Melo
dc.date.accessioned2019-08-11T10:57:37Z
dc.date.accessioned2025-09-09T00:30:57Z
dc.date.available2019-08-11T10:57:37Z
dc.date.issued2017-06-23
dc.description.abstractSentiment analysis has become a very important tool for analysis of social media data. There are several methods developed for this research field, many of them working very differently from each other, covering distinct aspects of the problem and distinct strategies. Despite the large number of existent techniques, there is no single one which fits well in all cases and data sources. Moreover, in case of supervised approaches, it may be very hard to get labeled data for strategies that demand training, mainly for a new application. In this dissertation, we propose to combine several very popular and effective state-of-the-practice sentiment analysis methods, by means of an unsupervised bootstrapped strategy for classification of polarity. Our solution was thoroughly tested considering thirteen different datasets in several domains such as opinions, comments, and social media. The experimental results demonstrate that our combined method (aka, 10SENT) improves the effectiveness of the classification task, but more important, it solves a key problem in the field. It is consistently among the best methods in many data types, meaning that it can produce the best (or close to best) results in almost all considered contexts, without any additional costs. Our self-learning approach is also very independent of the base methods, which means that it is highly extensible to incorporate any new additional method that can be envisioned in the future. Finally, we investigate a transfer learning and active learning approach for sentiment analysis and show the potential of this technique to improve our results.
dc.identifier.urihttps://hdl.handle.net/1843/JCES-ARSMJV
dc.languageInglês
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectBootstrap (Estatística)
dc.subjectProcessamento de linguagem natural
dc.subjectAnálise de sentimento
dc.subjectMineração de opinião
dc.subjectComputação
dc.subject.otherBootstrapping
dc.subject.otherAnálise de Sentimento
dc.subject.otherAprendizado de Máquina
dc.subject.otherMineração de Opinião
dc.subject.otherClassificação Combinada
dc.subject.otherAprendizado Não-supervisionado
dc.subject.otherProcessamento de Linguagem Natural
dc.titleAn unsupervised approach based on self-learning for the combination of sentiment analysis methods
dc.typeDissertação de mestrado
local.contributor.advisor-co1Marcos Andre Goncalves
local.contributor.advisor1Fabricio Benevenuto de Souza
local.contributor.referee1Daniel Hasan Dalip
local.contributor.referee1Marco Antonio Pinheiro de Cristo
local.contributor.referee1Marcos Andre Goncalves
local.description.resumoA análise de sentimentos se tornou uma ferramenta muito importante para análise de dados de mídia social. Existem vários métodos desenvolvidos para este campo de pesquisa, vários deles trabalhando muito diferentes uns dos outros, cobrindo aspectos distintos do problema e estratégias diversas. Apesar do grande número de técnicas existentes, não existe uma única que se encaixe bem em todos os casos e origem de dados. Além disso, no caso de abordagens supervisionadas, pode ser muito difícil obter dados rotulados para estratégias que exigem treinamento, principalmente para novas aplicações. Neste trabalho, propomos combinar vários métodos populares de análise de sentimento do atual estado-da-arte e eficazes, por meio de uma estratégia não-supervisionada com uso de bootstrapping para classificação de polaridade. Nossa solução foi completamente testada considerando treze diferente conjuntos de dados em vários domínios, como opiniões de produtos, comentários e mídias sociais. Os resultados experimentais demonstram que o nosso método combinado (conhecido como 10SENT) melhora a eficácia da tarefa de classificação, mas mais importante, ele resolve um problema-chave no campo. Nosso método aparece consistentemente entre os melhores métodos em vários tipos de bases de dados, o que significa que ele pode produzir os melhores resultados (ou perto de melhor) em quase todos os contextos considerados, sem quaisquer custos adicionais. A nossa abordagem de auto-aprendizagem é também muito independente dos métodos base, o que significa que é altamente extensível incorporar qualquer novo método adicional que possa ser desenvolvido no futuro. Finalmente, investigamos duas abordagens de transfer learning e active learning para a análise de sentimento e mostramos o potencial dessas técnicas para melhorar nossos resultados.
local.publisher.initialsUFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
philipedefreitasmelo.pdf
Tamanho:
1.69 MB
Formato:
Adobe Portable Document Format