On the impact of attribute noise on movie review polarity classification

dc.creatorKaren Stéfany Martins
dc.date.accessioned2022-01-08T02:40:53Z
dc.date.accessioned2025-09-08T23:18:18Z
dc.date.available2022-01-08T02:40:53Z
dc.date.issued2020-10-16
dc.description.abstractA partir do crescimento da Internet, sites de críticas de filmes mudaram o setor cinematográfico. Eles podem afetar as bilheterias dos filmes, por exemplo. A polaridade dessas críticas é muito importante em várias aplicações. Algumas delas usam classificadores baseados em aprendizado de máquina para definir a polaridade. No entanto, esses classificadores não são perfeitos. Eles são frequentemente criticados pela falta de explicação dos seus sucessos e fracassos. Este trabalho ajuda a preencher essa lacuna, propondo uma metodologia para caracterizar, identificar e medir o impacto de instâncias problemáticas na tarefa de classificação da polaridade de críticas de filmes. Caracterizamos essas instâncias por dois tipos de ruído de atributo: neutralidade, quando o texto da crítica não transmite uma polaridade clara e discrepância, quando a polaridade do texto não corresponde à polaridade definida pelo autor. Para fazer isso, propomos um classificador humano composto por três juízes humanos independentes. Cada juíz classifica as críticas em dois níveis. No primeiro nível, eles classificam em relação à sua polaridade, isto é, positiva ou negativa. Em seguida, no segundo nível, eles respondem se estão confiantes ou não sobre a sua classificação e o por quê. Em seguida, agregamos suas respostas usando o voto da maioria. Por fim, testamos os classificadores baseados em aprendizado de máquina nessas críticas. A partir dessas etapas, quantificamos a quantidade de ruído em atributo na classificação de polaridade de críticas de filmes e fornecemos evidências empíricas sobre a necessidade de prestar atenção a essas instâncias problemáticas, pois são muito mais difíceis de classificar, tanto para os classificadores máquinas quanto para os humanos. Nossa metodologia proposta é simples e pode ser facilmente aplicada a outras tarefas de classificação. Até onde sabemos, esta é a primeira análise sistemática do impacto do ruído de atributo na detecção de polaridade a partir de críticas textuais bem formadas.
dc.identifier.urihttps://hdl.handle.net/1843/39044
dc.languageeng
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Restrito
dc.subjectComputação – Teses
dc.subjectAprendizado profundo – Teses
dc.subjectMineração de opinião – Teses
dc.subjectCrítica cinematográfica – Teses
dc.subject.otherAttribute noise
dc.subject.otherDeep Learning
dc.subject.otherExplainability
dc.subject.otherOpinion reviews
dc.subject.otherOpinion mining
dc.subject.otherMovie reviews
dc.titleOn the impact of attribute noise on movie review polarity classification
dc.title.alternativeO impacto do ruído de atributo na classificação da polaridade de críticas de filmes
dc.typeDissertação de mestrado
local.contributor.advisor-co1Rodrygo Luis Teodoro Santos
local.contributor.advisor1Pedro Olmo Stancioli Vaz de Melo
local.contributor.advisor1Latteshttp://lattes.cnpq.br/3262926164579789
local.contributor.referee1Helena de Medeiros Caseli
local.contributor.referee1Adriano Alonso Veloso
local.creator.Latteshttp://lattes.cnpq.br/4045223666758899
local.description.embargo2021-10-16
local.description.resumoWith the growth of the internet, movie review websites have changed the cinematography industry. It has been affecting the movie's box office, for example. The review polarity is very important in several applications. Some of them use machine learning classifiers to define the review polarity. However, these classifiers are not perfect. They are often criticized for the lack of explanation of their successes and failures. This work helps to fill this gap by proposing a methodology to characterize, identify, and measure the impact of problematic instances in the task of polarity classification of movie reviews. We characterize such instances by two types of attribute noise: \neutrality, where the review text does not convey a clear polarity, and \discrepancy, where the polarity of the text does not match the polarity of its rating. To do that, we propose a human classifier which is composed of three independent human annotators. Each annotator classifies the reviews on two levels. On the first level, they classify the review in relation to its polarity, that is, positive or negative. Next, on the second level, they answer whether they are confident or not about their classification and why. Then, we aggregate their answers using the majority vote. Finally, we test state-of-the-art machine learning classifiers on these reviews. From these steps, we quantify the amount of attribute noise in polarity classification of movie reviews and provide empirical evidence about the need to pay attention to such problematic instances, as they are much harder to classify, for both machine and human classifiers. Our proposed methodology is simple and can be easily applied to other classification tasks. To the best of our knowledge, this is the first systematic analysis of the impact of attribute noise in polarity detection from well-formed textual reviews.
local.identifier.orcidhttps://orcid.org/0000-0001-7949-4573
local.publisher.countryBrasil
local.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Ciência da Computação

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertação_Karen_Martins_ON THE IMPACT OF ATTRIBUTE NOISE ON MOVIE REVIEW POLARITY_UFMG.pdf
Tamanho:
1.08 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: