Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/ESBF-9XZFT4
Tipo: Tese de Doutorado
Título: Uma abordagem multi-visão para a estimativa automática da qualidade de conteúdo colaborativo na Web 2.0
Autor(es): Daniel Hasan Dalip
Primeiro Orientador: Jose Palazzo Moreira de Oliveira
Primeiro Coorientador: Marco Antonio Pinheiro de Cristo
Primeiro membro da banca : Marco Antonio Pinheiro de Cristo
Segundo membro da banca: Alberto Henrique Frade Laender
Terceiro membro da banca: Estevam Rafael Hruschka Júnior
Quarto membro da banca: Fabricio Benevenuto de Souza
Quinto membro da banca: Pavel Pereira Calado
Resumo: A Web contitui um novo tipo de repositório do conhecimento humano em que o usuário não é apenas consumidor mas também produtor de conteúdo. Porém, tal liberdade traz consigo uma importante questão: como o usuário pode determinar a qualidade da informação que ele acessa? Nesta tese, propomos uma abordagem multi-visão para a estimativa da qualidade de conteúdo colaborativo, ou seja, aplicamos técnicas de aprendizado de máquina para combinar avaliações independentes de qualidade realizadas por diferentes conjuntos de indicadores semanticamente relacionados (visões) em um único valor representando a qualidade do conteúdo. Com isso, foi realizada uma análise profunda de nossa abordagem em dois domínios (Fórum de Perguntas e Respostas e Enciclopédias Colaborativas), na qual foi possível uma maior compreensão de quando e como nossa abordagem consegue melhorar a predição automática da qualidade do conteúdo. Também estudamos o impacto das visões e de seus atributos em cada domínio, além de propor novos atributos. As principais contribuições desta tese são: (1) proposta de uma abordagem multi-visão que utiliza-se de grupos (i.e., visões) de indicadores de qualidade; (2) proposta de indicadores para estimativa da qualidade em Fóruns de Perguntas e Respostas; (3) aplicação desta abordagem em Fóruns de Perguntas e Respostas e Enciclopédias Colaborativas onde obtemos uma melhoria de até 30% da estimativa da qualidade em comparação com os melhores baselines encontrados na literatura; (4) uma análise profunda do impacto, informatividade e correlação dos atributos e das visões dos domínios estudados.
Abstract: The Web contains a new type of repository for the human knowledge where users are able not only to consume, but also to produce content in a much faster and easier manner. However, such freedom also carries concerns about the quality of this content. In this thesis, we propose an automatic quality approach to assess the quality of collaborative generated content. To accomplish this, we adopt a multi-view approach to assess the quality of content, in other words, we apply machine learning (ML) techniques to combine independent assessments regarding di erent sets of semantically related quality indicators (i.e., views) into a single quality value. Then, we perform a thorough analysis of our approach in two di erent domains (Questions and Answer Forums and Collaborative Encyclopedias), which allowed us to better understand when and how the proposed multi-view approach is supposed to improve quality assessment. We also study the impact of the views and the features that compose them in each domain. To summarize, our main contributions include: (1) the proposal of a general multi-view approach that takes advantage of groups (i.e., views) of quality indicators;(2) the proposal of new features in Q&A Forum domain; (3) the application of this approach in 2 domains where we could achieve an improvement of up to 30% in quality assessment over the best baselines methods found in the literature; (4) a throughout feature and view analysis regarding impact, informativeness and correlatedness, considering both domains.
Assunto: Computação
Aprendizado do computador
World Wide Web (Sistema de recuperação da informação)
Idioma: Inglês
Editor: Universidade Federal de Minas Gerais
Sigla da Instituição: UFMG
Tipo de Acesso: Acesso Aberto
URI: http://hdl.handle.net/1843/ESBF-9XZFT4
Data do documento: 19-Jun-2015
Aparece nas coleções:Teses de Doutorado

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
danielhasandalip.pdf16.92 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.