Use este identificador para citar o ir al link de este elemento: http://hdl.handle.net/1843/ESBF-AQ2PSM
Tipo: Dissertação de Mestrado
Título: A comparative study of machine translation for multilingual sentence-level sentiment analysis
Autor(es): Matheus Lima Diniz Araujo
primer Tutor: Fabricio Benevenuto de Souza
primer miembro del tribunal : Adriano César Machado Pereira
Segundo miembro del tribunal: Flavio Vinicius Diniz de Figueiredo
Tercer miembro del tribunal: Pedro Olmo Stancioli Vaz de Melo
Resumen: A análise de sentimentos se tornou uma ferramenta chave em aplicações voltadas para mídias sociais, isto inclui a classificação da opinião dos usuários sobre produtos e serviços, o monitoramento político das mídias durante campanhas eleitorais e até mesmo a influência no mercado de ações. Existem diferentes ferramentas para análise de sentimentos que exploram variadas técnicas, normalmente elas dependem de dicionários léxicos ou aprendizado de máquina. Apesar do significante interesse neste tema e o grande esforço investido nesta área pela comunidade científica, quase todos os métodos existentes para análise de sentimentos foram direcionados para o contexto da língua inglesa. A maioria das estratégias para análise em diferentes línguas consiste na adaptação de um léxico já existente em inglês, sem apresentar validações ou comparações com linhas de base. Neste trabalho, realizamos uma abordagem diferente para resolver o problema de análise de sentimentos em diferentes línguas. Para isto, avaliamos dezesseis métodos voltados à análise de sentimentos em sentenças criadas para o inglês e os comparamos com três abordagens geradas para línguas específicas. A partir de quatorze conjuntos de dados em diferentes línguas, rotulados por humanos, realizamos uma extensa análise quantitativa das abordagens criadas para múltiplos idiomas. Nossos resultados sugerem que a simples tradução automática do texto de entrada da língua específica para o inglês e em seguida a utilização dos métodos estado da arte criados para o inglês pode ser melhor que os métodos existentes desenvolvidos para uma língua específica. Nós também classificamos os métodos de acordo com sua capacidade de predição e identificamos aqueles métodos que alcançam os melhores resultados utilizando a tradução automática entre as diferentes línguas. Como contribuição final para a comunidade acadêmica, compartilhamos os códigos, conjuntos de dados e o sistema iFeel 3.0, um arcabouço para análise de sentimentos em sentenças para múltiplas línguas. Esperamos que nossa metodologia se torne uma linha de base para o desenvolvimento de novos métodos de análise de sentimentos ao nível de sentenças em múltiplas línguas.
Abstract: Sentiment analysis has become a key tool for several social media applications. Despite the significant interest in this theme and amount of research efforts in the field, almost all existing methods are designed to work with only English content. So, we provide an extensive quantitative analysis of existing multi-language approaches against state-of-the-art English methods with the help of machine translation tools in fourteen different human labeled datasets in various idioms. Our results suggest that simply translating the input text on a specific language to English and then using one of the existing best methods developed to English can be better than the existing language specific efforts evaluated. As a final contribution to the research community, we release the iFeel 3.0 system, a web framework for multilingual sentence-level sentiment analysis. We hope our system setups a new baseline for future sentence-level methods developed in a wide set of languages.
Asunto: Recuperação da informação
Análise de sentimento
Redes sociais
Mineração de opinião
Computação
Redes sociais on-line
Tradução mecânica
Idioma: Inglês
Editor: Universidade Federal de Minas Gerais
Sigla da Institución: UFMG
Tipo de acceso: Acesso Aberto
URI: http://hdl.handle.net/1843/ESBF-AQ2PSM
Fecha del documento: 26-jun-2017
Aparece en las colecciones:Dissertações de Mestrado

archivos asociados a este elemento:
archivo Descripción TamañoFormato 
matheuslimadiniz.pdf2.46 MBAdobe PDFVisualizar/Abrir


Los elementos en el repositorio están protegidos por copyright, con todos los derechos reservados, salvo cuando es indicado lo contrario.