Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/39044
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Pedro Olmo Stancioli Vaz de Melopt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3262926164579789pt_BR
dc.contributor.advisor-co1Rodrygo Luis Teodoro Santospt_BR
dc.contributor.referee1Helena de Medeiros Caselipt_BR
dc.contributor.referee2Adriano Alonso Velosopt_BR
dc.creatorKaren Stéfany Martinspt_BR
dc.creator.Latteshttp://lattes.cnpq.br/4045223666758899pt_BR
dc.date.accessioned2022-01-08T02:40:53Z-
dc.date.available2022-01-08T02:40:53Z-
dc.date.issued2020-10-16-
dc.identifier.urihttp://hdl.handle.net/1843/39044-
dc.description.abstractA partir do crescimento da Internet, sites de críticas de filmes mudaram o setor cinematográfico. Eles podem afetar as bilheterias dos filmes, por exemplo. A polaridade dessas críticas é muito importante em várias aplicações. Algumas delas usam classificadores baseados em aprendizado de máquina para definir a polaridade. No entanto, esses classificadores não são perfeitos. Eles são frequentemente criticados pela falta de explicação dos seus sucessos e fracassos. Este trabalho ajuda a preencher essa lacuna, propondo uma metodologia para caracterizar, identificar e medir o impacto de instâncias problemáticas na tarefa de classificação da polaridade de críticas de filmes. Caracterizamos essas instâncias por dois tipos de ruído de atributo: neutralidade, quando o texto da crítica não transmite uma polaridade clara e discrepância, quando a polaridade do texto não corresponde à polaridade definida pelo autor. Para fazer isso, propomos um classificador humano composto por três juízes humanos independentes. Cada juíz classifica as críticas em dois níveis. No primeiro nível, eles classificam em relação à sua polaridade, isto é, positiva ou negativa. Em seguida, no segundo nível, eles respondem se estão confiantes ou não sobre a sua classificação e o por quê. Em seguida, agregamos suas respostas usando o voto da maioria. Por fim, testamos os classificadores baseados em aprendizado de máquina nessas críticas. A partir dessas etapas, quantificamos a quantidade de ruído em atributo na classificação de polaridade de críticas de filmes e fornecemos evidências empíricas sobre a necessidade de prestar atenção a essas instâncias problemáticas, pois são muito mais difíceis de classificar, tanto para os classificadores máquinas quanto para os humanos. Nossa metodologia proposta é simples e pode ser facilmente aplicada a outras tarefas de classificação. Até onde sabemos, esta é a primeira análise sistemática do impacto do ruído de atributo na detecção de polaridade a partir de críticas textuais bem formadas.pt_BR
dc.description.resumoWith the growth of the internet, movie review websites have changed the cinematography industry. It has been affecting the movie's box office, for example. The review polarity is very important in several applications. Some of them use machine learning classifiers to define the review polarity. However, these classifiers are not perfect. They are often criticized for the lack of explanation of their successes and failures. This work helps to fill this gap by proposing a methodology to characterize, identify, and measure the impact of problematic instances in the task of polarity classification of movie reviews. We characterize such instances by two types of attribute noise: \neutrality, where the review text does not convey a clear polarity, and \discrepancy, where the polarity of the text does not match the polarity of its rating. To do that, we propose a human classifier which is composed of three independent human annotators. Each annotator classifies the reviews on two levels. On the first level, they classify the review in relation to its polarity, that is, positive or negative. Next, on the second level, they answer whether they are confident or not about their classification and why. Then, we aggregate their answers using the majority vote. Finally, we test state-of-the-art machine learning classifiers on these reviews. From these steps, we quantify the amount of attribute noise in polarity classification of movie reviews and provide empirical evidence about the need to pay attention to such problematic instances, as they are much harder to classify, for both machine and human classifiers. Our proposed methodology is simple and can be easily applied to other classification tasks. To the best of our knowledge, this is the first systematic analysis of the impact of attribute noise in polarity detection from well-formed textual reviews.pt_BR
dc.languageengpt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃOpt_BR
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computaçãopt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Restritopt_BR
dc.subjectAttribute noisept_BR
dc.subjectDeep Learningpt_BR
dc.subjectExplainabilitypt_BR
dc.subjectOpinion reviewspt_BR
dc.subjectOpinion miningpt_BR
dc.subjectMovie reviewspt_BR
dc.subject.otherComputação – Tesespt_BR
dc.subject.otherAprendizado profundo – Tesespt_BR
dc.subject.otherMineração de opinião – Tesespt_BR
dc.subject.otherCrítica cinematográfica – Tesespt_BR
dc.titleOn the impact of attribute noise on movie review polarity classificationpt_BR
dc.title.alternativeO impacto do ruído de atributo na classificação da polaridade de críticas de filmespt_BR
dc.typeDissertaçãopt_BR
dc.description.embargo2021-10-16-
dc.identifier.orcidhttps://orcid.org/0000-0001-7949-4573pt_BR
Appears in Collections:Dissertações de Mestrado



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.