Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/ESBF-9GMQRL
Type: Dissertação de Mestrado
Title: Automatic Query expansion based on tag recommendation
Authors: Vitor Campos de Oliveira
First Advisor: Marcos Andre Goncalves
First Referee: Jussara Marques de Almeida
Second Referee: Nivio Ziviani
Third Referee: Viviane Pereira Moreira
Abstract: Expansão de consulta é o processo de adição de novos termos às consultas feitas pelos usuários com o objetivo de melhorar os resultados de busca. Isto é especialmente útil quando a consulta original não é capaz de univocamente expressar a necessidade de informação do usuário. Tradicionalmente, os métodos de expansão de consultas são baseados em pseudo-relevance feedback. Os termos de expansão são selecionados entre os melhores documentos recuperados como resultado da consulta original, assumindo-se que estes documentos contêm termos úteis para a expansão da consulta. Entretanto, tal premissa pode nem sempre ser verdadeira, especialmente para consultas consideradas 'difíceis'. Recentemente, algumas técnicas de expansão de consultas começaram a explorar fontes externas de informação encontradas na Web, como enciclopédias on-line e sistemas colaborativos de anotação, com o objetivo de selecionartermos semanticamente ricos. Neste trabalho nós apresentamos um novo método para expansão de consultas relacionadas à entidades (ou conceitos bem definidos). Mais especialmente, nós apresentamos um método que automaticamente filtra, pondera e ordena termos extraídos de artigos da Wikipedia relacionados ás consultas originais (submetidas pelos usuários). Nosso técnica é baseada em métodos estado-da-arte para recomendação de tags que exploram métricas baseadas em heurísticas para estimar a capacidade descritiva de um dado termo. Originalmente proposto no contexto de tags, nós aplicamos estes métodos de recomendação para ponderar e ordenar termos extraídos de múltiplos campos de artigos da Wikipedia conforme a relevância deles para com o artigo. Nós avaliamos nosso método comparando-o com três técnicas do estado-da-arte em três coleções. Nossos resultados indicam que o método proposto supera todos em todas as coleções, com ganhos relativos em precisão média (Mean Average Precision) de 15% sobre a melhor das técnicas alternativas.
Abstract: Query expansion is the process of adding new terms to queries posed by users in an attempt to improve search results. This is especially useful when the original query is not able to unequivocally express the user information need. Traditional query expansion approaches are based on pseudo-relevance feedback. They select expansion terms from highly ranked documents retrieved as result of the original query, assuming that these documents contain useful terms for query expansion. However, this might not always be the case, especially for queries considered 'difficult'. Recently, some query expansion techniques exploit external sources of information found on the Web, such as on-line encyclopedias and collaborative social annotation systems, to select semantically rich expansion terms. We here propose a new method for expanding queries related to entities (or narrow concepts). More specifically, we propose a method for automatically filtering, weighting and ranking terms extracted from Wikipedia articles related to the original query. Our method is based on state-of-the-art tag recommendation methods that exploit heuristic metrics to estimate the descriptive capacity of a given term. Originally proposed for the context of tags, we here apply these recommendation methods to weight and rank terms extracted from multiple fields of Wikipedia articles according to their relevance for the article. We evaluate our method comparing it against three state-of-the-art baselines in three collections. Our results indicate that our proposed method outperforms all baselines in all collections, with relative gains in MAP of up to 15% over the best baselines.
Subject: Computação
Banco de dados Busca
language: Inglês
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/ESBF-9GMQRL
Issue Date: 27-Aug-2013
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
vitorcamposdeoliveira.pdf1.66 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.