Exploiting entities for query expansion

Wladmir Cardoso Brandao

Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/ESBF-9GMJW2

Full metadata record

DC Field	Value	Language
dc.contributor.advisor1	Nivio Ziviani	pt_BR
dc.contributor.referee1	Adriano Alonso Veloso	pt_BR
dc.contributor.referee2	Edleno Silva de Moura	pt_BR
dc.contributor.referee3	Mariano P Consens	pt_BR
dc.contributor.referee4	Rodrygo Luis Teodoro Santos	pt_BR
dc.contributor.referee5	Viviane Pereira Moreira	pt_BR
dc.creator	Wladmir Cardoso Brandao	pt_BR
dc.date.accessioned	2019-08-10T07:19:13Z	-
dc.date.available	2019-08-10T07:19:13Z	-
dc.date.issued	2013-11-18	pt_BR
dc.identifier.uri	http://hdl.handle.net/1843/ESBF-9GMJW2	-
dc.description.abstract	A substantial fraction of web search queries contain references to entities, such as persons, organizations, and locations. In this work, we propose entity-oriented query expansion approaches that exploit semantic sources of evidence devising discriminative term features and machine learning techniques that effectively combines these features to rank candidate expansion terms. Particularly, our unsupervised approach (UQEE) uses taxonomic features devised by the semantic structure implicitly provided by infobox templates, while our learning to rank approach (L2EE) considers semantic evidence encoded in the content of Wikipedia article fields to automatically labels training examples proportionally to their observed retrieval effectiveness. Lastly, we propose a self-supervised approach to autonomously generate infoboxes for Wikipedia articles (WAVE). Experiments attest the effectiveness of our approaches, with significantly gains compared to state-of-the-art PRF and ePRF approaches.	pt_BR
dc.description.resumo	Uma fração substancial de consultas submetidas às máquinas de busca na web fazem referência a entidades, como pessoas, organizações e locais. No presente trabalho, nós propomos abordagens orientadas a entidade para expansão de consulta que exploram aspectos semânticos em bases de conhecimento para derivar evidências discriminativas de termos e técnicas de aprendizagem de máquina, com o intuito de combinar de maneira efetiva as evidências a fim de se obter um ranking de termos candidatos para expansão. Particularmente, nossa abordagem supervisionada (UQEE) utiliza-se de evidências derivadas da estrutura semântica implícita em templates de infoboxes em artigos da Wikipedia, enquanto nossa abordagem de aprendizagem para ranking (L2EE) considera evidências semânticas derivadas do conteúdo de campos de artigos da Wikipedia para automaticamente rotular exemplos de treino proporcionalmente à efetividade observada na recuperação. Além disso, nós propomos uma abordagem auto-supervisionada para geração automática de infoboxes para artigos da Wikipedia (WAVE). Experimentos comprovam a efetividade de nossas abordagens, com ganhos significativos comparados às abordagens estado-da-arte em pseudo-relevance feedback (PRF) e PRF baseados em entidades.	pt_BR
dc.language	Inglês	pt_BR
dc.publisher	Universidade Federal de Minas Gerais	pt_BR
dc.publisher.initials	UFMG	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Expansão de consultas	pt_BR
dc.subject	Aprendizagem para ranqueamento	pt_BR
dc.subject	Wikipédia	pt_BR
dc.subject	Feedback de relevância	pt_BR
dc.subject	Reconhecimento de entidades	pt_BR
dc.subject.other	Aprendizado por computador	pt_BR
dc.subject.other	Computação	pt_BR
dc.subject.other	Sistemas de recuperação de informação	pt_BR
dc.title	Exploiting entities for query expansion	pt_BR
dc.type	Tese de Doutorado	pt_BR
Appears in Collections:	Teses de Doutorado

Files in This Item:

File	Description	Size	Format
wladmircardosobrandao.pdf		1.78 MB	Adobe PDF	View/Open

Show simple item record