Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/ESBF-AQ2PSM
Type: Dissertação de Mestrado
Title: A comparative study of machine translation for multilingual sentence-level sentiment analysis
Authors: Matheus Lima Diniz Araujo
First Advisor: Fabricio Benevenuto de Souza
First Referee: Adriano César Machado Pereira
Second Referee: Flavio Vinicius Diniz de Figueiredo
Third Referee: Pedro Olmo Stancioli Vaz de Melo
Abstract: A análise de sentimentos se tornou uma ferramenta chave em aplicações voltadas para mídias sociais, isto inclui a classificação da opinião dos usuários sobre produtos e serviços, o monitoramento político das mídias durante campanhas eleitorais e até mesmo a influência no mercado de ações. Existem diferentes ferramentas para análise de sentimentos que exploram variadas técnicas, normalmente elas dependem de dicionários léxicos ou aprendizado de máquina. Apesar do significante interesse neste tema e o grande esforço investido nesta área pela comunidade científica, quase todos os métodos existentes para análise de sentimentos foram direcionados para o contexto da língua inglesa. A maioria das estratégias para análise em diferentes línguas consiste na adaptação de um léxico já existente em inglês, sem apresentar validações ou comparações com linhas de base. Neste trabalho, realizamos uma abordagem diferente para resolver o problema de análise de sentimentos em diferentes línguas. Para isto, avaliamos dezesseis métodos voltados à análise de sentimentos em sentenças criadas para o inglês e os comparamos com três abordagens geradas para línguas específicas. A partir de quatorze conjuntos de dados em diferentes línguas, rotulados por humanos, realizamos uma extensa análise quantitativa das abordagens criadas para múltiplos idiomas. Nossos resultados sugerem que a simples tradução automática do texto de entrada da língua específica para o inglês e em seguida a utilização dos métodos estado da arte criados para o inglês pode ser melhor que os métodos existentes desenvolvidos para uma língua específica. Nós também classificamos os métodos de acordo com sua capacidade de predição e identificamos aqueles métodos que alcançam os melhores resultados utilizando a tradução automática entre as diferentes línguas. Como contribuição final para a comunidade acadêmica, compartilhamos os códigos, conjuntos de dados e o sistema iFeel 3.0, um arcabouço para análise de sentimentos em sentenças para múltiplas línguas. Esperamos que nossa metodologia se torne uma linha de base para o desenvolvimento de novos métodos de análise de sentimentos ao nível de sentenças em múltiplas línguas.
Abstract: Sentiment analysis has become a key tool for several social media applications. Despite the significant interest in this theme and amount of research efforts in the field, almost all existing methods are designed to work with only English content. So, we provide an extensive quantitative analysis of existing multi-language approaches against state-of-the-art English methods with the help of machine translation tools in fourteen different human labeled datasets in various idioms. Our results suggest that simply translating the input text on a specific language to English and then using one of the existing best methods developed to English can be better than the existing language specific efforts evaluated. As a final contribution to the research community, we release the iFeel 3.0 system, a web framework for multilingual sentence-level sentiment analysis. We hope our system setups a new baseline for future sentence-level methods developed in a wide set of languages.
Subject: Recuperação da informação
Análise de sentimento
Redes sociais
Mineração de opinião
Computação
Redes sociais on-line
Tradução mecânica
language: Inglês
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/ESBF-AQ2PSM
Issue Date: 26-Jun-2017
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
matheuslimadiniz.pdf2.46 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.