Automatic Query expansion based on tag recommendation

dc.creatorVitor Campos de Oliveira
dc.date.accessioned2019-08-10T22:02:37Z
dc.date.accessioned2025-09-08T23:48:08Z
dc.date.available2019-08-10T22:02:37Z
dc.date.issued2013-08-27
dc.description.abstractQuery expansion is the process of adding new terms to queries posed by users in an attempt to improve search results. This is especially useful when the original query is not able to unequivocally express the user information need. Traditional query expansion approaches are based on pseudo-relevance feedback. They select expansion terms from highly ranked documents retrieved as result of the original query, assuming that these documents contain useful terms for query expansion. However, this might not always be the case, especially for queries considered 'difficult'. Recently, some query expansion techniques exploit external sources of information found on the Web, such as on-line encyclopedias and collaborative social annotation systems, to select semantically rich expansion terms. We here propose a new method for expanding queries related to entities (or narrow concepts). More specifically, we propose a method for automatically filtering, weighting and ranking terms extracted from Wikipedia articles related to the original query. Our method is based on state-of-the-art tag recommendation methods that exploit heuristic metrics to estimate the descriptive capacity of a given term. Originally proposed for the context of tags, we here apply these recommendation methods to weight and rank terms extracted from multiple fields of Wikipedia articles according to their relevance for the article. We evaluate our method comparing it against three state-of-the-art baselines in three collections. Our results indicate that our proposed method outperforms all baselines in all collections, with relative gains in MAP of up to 15% over the best baselines.
dc.identifier.urihttps://hdl.handle.net/1843/ESBF-9GMQRL
dc.languageInglês
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectComputação
dc.subjectBanco de dados Busca
dc.subject.otherExpansão de consultas
dc.subject.otherRecuperação de Informação
dc.subject.otherFormulação de Consulta
dc.subject.otherRecomendação de Tags
dc.titleAutomatic Query expansion based on tag recommendation
dc.typeDissertação de mestrado
local.contributor.advisor1Marcos Andre Goncalves
local.contributor.referee1Jussara Marques de Almeida
local.contributor.referee1Nivio Ziviani
local.contributor.referee1Viviane Pereira Moreira
local.description.resumoExpansão de consulta é o processo de adição de novos termos às consultas feitas pelos usuários com o objetivo de melhorar os resultados de busca. Isto é especialmente útil quando a consulta original não é capaz de univocamente expressar a necessidade de informação do usuário. Tradicionalmente, os métodos de expansão de consultas são baseados em pseudo-relevance feedback. Os termos de expansão são selecionados entre os melhores documentos recuperados como resultado da consulta original, assumindo-se que estes documentos contêm termos úteis para a expansão da consulta. Entretanto, tal premissa pode nem sempre ser verdadeira, especialmente para consultas consideradas 'difíceis'. Recentemente, algumas técnicas de expansão de consultas começaram a explorar fontes externas de informação encontradas na Web, como enciclopédias on-line e sistemas colaborativos de anotação, com o objetivo de selecionartermos semanticamente ricos. Neste trabalho nós apresentamos um novo método para expansão de consultas relacionadas à entidades (ou conceitos bem definidos). Mais especialmente, nós apresentamos um método que automaticamente filtra, pondera e ordena termos extraídos de artigos da Wikipedia relacionados ás consultas originais (submetidas pelos usuários). Nosso técnica é baseada em métodos estado-da-arte para recomendação de tags que exploram métricas baseadas em heurísticas para estimar a capacidade descritiva de um dado termo. Originalmente proposto no contexto de tags, nós aplicamos estes métodos de recomendação para ponderar e ordenar termos extraídos de múltiplos campos de artigos da Wikipedia conforme a relevância deles para com o artigo. Nós avaliamos nosso método comparando-o com três técnicas do estado-da-arte em três coleções. Nossos resultados indicam que o método proposto supera todos em todas as coleções, com ganhos relativos em precisão média (Mean Average Precision) de 15% sobre a melhor das técnicas alternativas.
local.publisher.initialsUFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
vitorcamposdeoliveira.pdf
Tamanho:
1.62 MB
Formato:
Adobe Portable Document Format