Um benchmark para comparação de métodos para análise de sentimentos

Pollyanna de Oliveira Gonçalves

Use este identificador para citar o ir al link de este elemento: http://hdl.handle.net/1843/ESBF-A2FJV4

Tipo:	Dissertação de Mestrado
Título:	Um benchmark para comparação de métodos para análise de sentimentos
Autor(es):	Pollyanna de Oliveira Gonçalves
primer Tutor:	Fabricio Benevenuto de Souza
primer miembro del tribunal :	Adriano César Machado Pereira
Segundo miembro del tribunal:	Alexandre Plastino de Carvalho
Tercer miembro del tribunal:	Marcos Andre Goncalves
Resumen:	Nos últimos anos, milhares de artigos científicos vêm explorando análise de sentimentos, várias startups que medem opiniões em tempo real também surgiram, assim como um número de produtos inovadores que vêm sendo desenvolvidos na área. Existem diversos métodos para medir sentimentos, incluindo abordagens léxicas e métodos deaprendizado de máquina. Apesar do grande interesse no tema e da alta popularidade de alguns desses métodos, ainda não está claro qual deles possui melhor performance na identificação de polaridade (positivo, negativo ou neutro) de uma mensagem. Tal comparação é crucial para o entendimento de potenciais limitações, vantagens e desvantagens de métodos populares. Esse estudo tem como objetivo preencher essa lacuna apresentando um benchmark de comparação de 21 métodos e ferramentas muito utilizados na análise de sentimentos para melhor entender suas performances. Nossa avaliação é baseada em um benchmark que consiste em 21 datasets rotulados, abrangendo mensagens compartilhadas em redes sociais online, reviews de filmes e produtos, assim como opiniões e comentários em notícias. Nossos resultados realçam limitações, vantagens e desvantagens dos métodos existentes, mostrando que suas performances variam através das bases de dados. Por fim, propomos um esforço inicial na combinação desses métodos com o objetivo de maximizar os resultados de classificação de sentimentos. Apesar da tentativa introdutória, mostramos que essa é uma estratégia promissora e que precisa de maiores investigações.
Abstract:	In the last few years thousands of scientific papers have explored sentiment analysis, several startups that measures opinions on real data have emerged, and a number of innovative products related to this theme have been developed. There are multiple methods for measuring sentiments, including lexical-based approaches and supervisedmachine learning methods. Despite the vast interest on the theme and wide popularity of some methods, it is unclear which method is better for identifying the polarity (i.e., positive, negative or neutral) of a message. Such a comparison is key for understanding the potential limitations, advantages, and disadvantages of popular methods. This study aims at filling this gap by presenting a benchmark comparison of 21 widelyused sentiment analysis methods and tools to better understand their strengths and weaknesses. Our evaluation is based on a benchmark of 21 labeled datasets, covering messages posted on social networks, movie and product reviews, as well as opinions and comments in news articles. Our results highlight limitations, advantages, and disadvantagesof existing methods, showing that their performances varied widely across datasets. Finally, we propose initial efforts in combining these methods with the aim of maximize the results of sentiment classification. Despite of this introductory attempt, we show that this is a promising strategy that needs further investigation.
Asunto:	Computação Redes sociais on-line Mineração de dados (Computação)
Idioma:	Inglês
Editor:	Universidade Federal de Minas Gerais
Sigla da Institución:	UFMG
Tipo de acceso:	Acesso Aberto
URI:	http://hdl.handle.net/1843/ESBF-A2FJV4
Fecha del documento:	14-ago-2015
Aparece en las colecciones:	Dissertações de Mestrado

archivos asociados a este elemento:

archivo	Descripción	Tamaño	Formato
pollyannagoncalves.pdf		3.82 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo del elemento Visualizar estadísticas