Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/ESBF-9XZFT4
Type: Tese de Doutorado
Title: Uma abordagem multi-visão para a estimativa automática da qualidade de conteúdo colaborativo na Web 2.0
Authors: Daniel Hasan Dalip
First Advisor: Jose Palazzo Moreira de Oliveira
First Co-advisor: Marco Antonio Pinheiro de Cristo
First Referee: Marco Antonio Pinheiro de Cristo
Second Referee: Alberto Henrique Frade Laender
Third Referee: Estevam Rafael Hruschka Júnior
metadata.dc.contributor.referee4: Fabricio Benevenuto de Souza
metadata.dc.contributor.referee5: Pavel Pereira Calado
Abstract: A Web contitui um novo tipo de repositório do conhecimento humano em que o usuário não é apenas consumidor mas também produtor de conteúdo. Porém, tal liberdade traz consigo uma importante questão: como o usuário pode determinar a qualidade da informação que ele acessa? Nesta tese, propomos uma abordagem multi-visão para a estimativa da qualidade de conteúdo colaborativo, ou seja, aplicamos técnicas de aprendizado de máquina para combinar avaliações independentes de qualidade realizadas por diferentes conjuntos de indicadores semanticamente relacionados (visões) em um único valor representando a qualidade do conteúdo. Com isso, foi realizada uma análise profunda de nossa abordagem em dois domínios (Fórum de Perguntas e Respostas e Enciclopédias Colaborativas), na qual foi possível uma maior compreensão de quando e como nossa abordagem consegue melhorar a predição automática da qualidade do conteúdo. Também estudamos o impacto das visões e de seus atributos em cada domínio, além de propor novos atributos. As principais contribuições desta tese são: (1) proposta de uma abordagem multi-visão que utiliza-se de grupos (i.e., visões) de indicadores de qualidade; (2) proposta de indicadores para estimativa da qualidade em Fóruns de Perguntas e Respostas; (3) aplicação desta abordagem em Fóruns de Perguntas e Respostas e Enciclopédias Colaborativas onde obtemos uma melhoria de até 30% da estimativa da qualidade em comparação com os melhores baselines encontrados na literatura; (4) uma análise profunda do impacto, informatividade e correlação dos atributos e das visões dos domínios estudados.
Abstract: The Web contains a new type of repository for the human knowledge where users are able not only to consume, but also to produce content in a much faster and easier manner. However, such freedom also carries concerns about the quality of this content. In this thesis, we propose an automatic quality approach to assess the quality of collaborative generated content. To accomplish this, we adopt a multi-view approach to assess the quality of content, in other words, we apply machine learning (ML) techniques to combine independent assessments regarding di erent sets of semantically related quality indicators (i.e., views) into a single quality value. Then, we perform a thorough analysis of our approach in two di erent domains (Questions and Answer Forums and Collaborative Encyclopedias), which allowed us to better understand when and how the proposed multi-view approach is supposed to improve quality assessment. We also study the impact of the views and the features that compose them in each domain. To summarize, our main contributions include: (1) the proposal of a general multi-view approach that takes advantage of groups (i.e., views) of quality indicators;(2) the proposal of new features in Q&A Forum domain; (3) the application of this approach in 2 domains where we could achieve an improvement of up to 30% in quality assessment over the best baselines methods found in the literature; (4) a throughout feature and view analysis regarding impact, informativeness and correlatedness, considering both domains.
Subject: Computação
Aprendizado do computador
World Wide Web (Sistema de recuperação da informação)
language: Inglês
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/ESBF-9XZFT4
Issue Date: 19-Jun-2015
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
danielhasandalip.pdf16.92 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.