Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/ESBF-9GMQRL
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Marcos Andre Goncalvespt_BR
dc.contributor.referee1Jussara Marques de Almeidapt_BR
dc.contributor.referee2Nivio Zivianipt_BR
dc.contributor.referee3Viviane Pereira Moreirapt_BR
dc.creatorVitor Campos de Oliveirapt_BR
dc.date.accessioned2019-08-10T22:02:37Z-
dc.date.available2019-08-10T22:02:37Z-
dc.date.issued2013-08-27pt_BR
dc.identifier.urihttp://hdl.handle.net/1843/ESBF-9GMQRL-
dc.description.abstractQuery expansion is the process of adding new terms to queries posed by users in an attempt to improve search results. This is especially useful when the original query is not able to unequivocally express the user information need. Traditional query expansion approaches are based on pseudo-relevance feedback. They select expansion terms from highly ranked documents retrieved as result of the original query, assuming that these documents contain useful terms for query expansion. However, this might not always be the case, especially for queries considered 'difficult'. Recently, some query expansion techniques exploit external sources of information found on the Web, such as on-line encyclopedias and collaborative social annotation systems, to select semantically rich expansion terms. We here propose a new method for expanding queries related to entities (or narrow concepts). More specifically, we propose a method for automatically filtering, weighting and ranking terms extracted from Wikipedia articles related to the original query. Our method is based on state-of-the-art tag recommendation methods that exploit heuristic metrics to estimate the descriptive capacity of a given term. Originally proposed for the context of tags, we here apply these recommendation methods to weight and rank terms extracted from multiple fields of Wikipedia articles according to their relevance for the article. We evaluate our method comparing it against three state-of-the-art baselines in three collections. Our results indicate that our proposed method outperforms all baselines in all collections, with relative gains in MAP of up to 15% over the best baselines.pt_BR
dc.description.resumoExpansão de consulta é o processo de adição de novos termos às consultas feitas pelos usuários com o objetivo de melhorar os resultados de busca. Isto é especialmente útil quando a consulta original não é capaz de univocamente expressar a necessidade de informação do usuário. Tradicionalmente, os métodos de expansão de consultas são baseados em pseudo-relevance feedback. Os termos de expansão são selecionados entre os melhores documentos recuperados como resultado da consulta original, assumindo-se que estes documentos contêm termos úteis para a expansão da consulta. Entretanto, tal premissa pode nem sempre ser verdadeira, especialmente para consultas consideradas 'difíceis'. Recentemente, algumas técnicas de expansão de consultas começaram a explorar fontes externas de informação encontradas na Web, como enciclopédias on-line e sistemas colaborativos de anotação, com o objetivo de selecionartermos semanticamente ricos. Neste trabalho nós apresentamos um novo método para expansão de consultas relacionadas à entidades (ou conceitos bem definidos). Mais especialmente, nós apresentamos um método que automaticamente filtra, pondera e ordena termos extraídos de artigos da Wikipedia relacionados ás consultas originais (submetidas pelos usuários). Nosso técnica é baseada em métodos estado-da-arte para recomendação de tags que exploram métricas baseadas em heurísticas para estimar a capacidade descritiva de um dado termo. Originalmente proposto no contexto de tags, nós aplicamos estes métodos de recomendação para ponderar e ordenar termos extraídos de múltiplos campos de artigos da Wikipedia conforme a relevância deles para com o artigo. Nós avaliamos nosso método comparando-o com três técnicas do estado-da-arte em três coleções. Nossos resultados indicam que o método proposto supera todos em todas as coleções, com ganhos relativos em precisão média (Mean Average Precision) de 15% sobre a melhor das técnicas alternativas.pt_BR
dc.languageInglêspt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectExpansão de consultaspt_BR
dc.subjectRecuperação de Informaçãopt_BR
dc.subjectFormulação de Consultapt_BR
dc.subjectRecomendação de Tagspt_BR
dc.subject.otherComputaçãopt_BR
dc.subject.otherBanco de dados Buscapt_BR
dc.titleAutomatic Query expansion based on tag recommendationpt_BR
dc.typeDissertação de Mestradopt_BR
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
vitorcamposdeoliveira.pdf1.66 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.