Estratégias para busca do texto completo de artigos catalogados em uma biblioteca digital

Allan Jones Costa e Silva

Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/RVMR-794QAJ

Full metadata record

DC Field	Value	Language
dc.contributor.advisor1	Alberto Henrique Frade Laender	pt_BR
dc.contributor.advisor-co1	Marcos Andre Goncalves	pt_BR
dc.contributor.referee1	Edleno Silva de Moura	pt_BR
dc.contributor.referee2	Nivio Ziviani	pt_BR
dc.creator	Allan Jones Costa e Silva	pt_BR
dc.date.accessioned	2019-08-14T22:14:20Z	-
dc.date.available	2019-08-14T22:14:20Z	-
dc.date.issued	2007-03-26	pt_BR
dc.identifier.uri	http://hdl.handle.net/1843/RVMR-794QAJ	-
dc.description.abstract	This dissertation proposes a process that uses results from queries submitted to search engines for finding the URL of the corresponding full-text, or of any relevant related material, for those articles cataloged in a digital library for which this information is missing. We present a comprehensive study of this process in different situations by investigating different query strategies applied to three general purpose search engines (Google, Yahoo!, MSN) and two specialized ones (Scholar and CiteSeer), considering five user scenarios characterized by distinct requirement levels. Specifically, we have conducted a set of experiments focused on articles taken from BDBComp - Brazilian Digital Library of Computing and DBLP - Digital Bibliography & Library Project. According to the results of these experiments, Scholar has shown to be more effective than the other tested search engines for this task in all considered scenarios. Moreover, our experiments show that a simple combination Scholar-Google with a re-ranking strategy provides even better results. Our study also presents an analysis of the impact of different factors on the likelihood of finding the full-text of the searched articles.	pt_BR
dc.description.resumo	Esta dissertação propõe um processo que utiliza resultados de consultas submetidas a máquinas de busca para encontrar a URL do texto completo correspondente, ou de qualquer outro material relacionado, a artigos catalogados em uma biblioteca digital que não possuem tal informação registrada. Apresentamos um estudo desse processo para investigar diferentes estratégias de consultas aplicadas a três máquinas de busca de propósito geral (Google, Yahoo!, MSN) e a duas especializadas (Scholar e CiteSeer) considerando vários cenários caracterizados por usuários com diferentes níveis de exigências. Especificamente, conduzimos um conjunto de experimentos com artigos provenientes da BDBComp - Biblioteca Digital Brasileira de Computação e da DBLP - Digital Bibliography & Library Project. De acordo com os resultados, Scholar mostrou-se mais eficaz nesta tarefa do que as outras máquinas de busca testadas em todos os cenários estudados. Além disso, nossos experimentos mostraram que estratégias simples para combinação e reordenação fornecem resultados ainda melhores. Nosso estudo também apresenta uma análise do impacto de diferentes fatores na chance de se encontrar o texto completo dos artigos procurados.	pt_BR
dc.language	Português	pt_BR
dc.publisher	Universidade Federal de Minas Gerais	pt_BR
dc.publisher.initials	UFMG	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	busca em texto	pt_BR
dc.subject	biblioteca digital	pt_BR
dc.subject.other	Recuperação da informação	pt_BR
dc.subject.other	Bibliotecas digitais	pt_BR
dc.subject.other	World Wide Web (Sistema de recuperação da informação)	pt_BR
dc.subject.other	Computação	pt_BR
dc.subject.other	Sistemas de recuperação da informação	pt_BR
dc.title	Estratégias para busca do texto completo de artigos catalogados em uma biblioteca digital	pt_BR
dc.type	Dissertação de Mestrado	pt_BR
Appears in Collections:	Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format
allanjonescostasilva.pdf		561.51 kB	Adobe PDF	View/Open

Show simple item record