Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/RVMR-7L6J36
Type: Dissertação de Mestrado
Title: Impacto do comportamento dinâmico dos pares na eficácia de máquinas de busca par-a-par
Authors: Fabiano Magalhaes Atalla da Fonseca
First Advisor: Virgilio Augusto Fernandes Almeida
First Referee: Jussara Marques de Almeida
Second Referee: Marcos Andre Goncalves
Third Referee: Nivio Ziviani
metadata.dc.contributor.referee4: Wagner Meira Junior
Abstract: Na tentativa de ampliar o espectro de busca e atenuar problemas de escalabilidade, redes Par-a-Par (P2P) têm sido apontadas como alternativa para novas gerações de máquinas de busca na Web. No entanto, a eficácia da busca por conteúdo em ambientes P2P pode ser gravemente limitada por características observadas em sistemas P2P reais, tais como a entrada e saída dinâmica de pares no sistema. Nosso estudo analisa o impacto desse aspecto na eficácia de máquinas de busca P2P. De forma a estimar os limites da eficácia, focamos nossa análise em modelos de rede P2P com níveis extremos de conhecimento dos pares sobre os documentos da rede. Nossos resultados revelam que o comportamento dinâmico dos pares pode afetar consideravelmente a eficácia da busca mesmo em cenários otimistas: em redes com altos níveis de conhecimento dos pares sobre os documentos da rede, uma fração significativa de consultas sofre um impacto na qualidade das respostas de pelo menos 26% ainda em cenários muito estáveis. Também confirmamos que o impacto desse aspecto em redes com baixos níveis de conhecimento dos pares pode ser ainda mais grave (75%). Também avaliamos a replicação de conteúdo como possível forma de atenuar os efeitos do comportamento dinâmico dos pares na eficácia de máquinas de busca P2P. Para tanto, analisamos o efeito de os usuários baixarem algumas páginas listadas na resposta à consulta e as adicionarem à sua coleção local. Observamos que essa estratégia pode melhorar significativamente a eficácia de máquinas de busca P2P. De fato, a qualidade das respostas em redes com níveis muito baixos de nhecimento dos pares sobre os documentos da rede pode melhorar significativamente mesmo em cenários pouco estáveis. Também discutimos os desafios existentes para adoção dessa solução. De fato, considerando a grande autonomia dos pares e a ausência dos benefícios da replicação comuns em sistemas P2P de compartilhamento de arquivos, o desenvolvimento das futuras máquinas de busca P2P pode depender amplamente de novos mecanismos de incentivo que considerem aspectos específicos desse tipo de aplicação.
Abstract: In an attempt to increase the spectrum of searchable information while attenuating scalability issues, Peer-to-Peer (P2P) networks have been viewed as an alternative way to design new Web search engines. However, the effectiveness of P2P Web searching may be severely limited by characteristics commonly observed in real P2P systems such as the dynamics of peer participation (churn). This study analyzes the impact of such issue on the effectiveness of P2P Web search engines. In order to estimate effectiveness boundaries, we focus our analysis on P2P network models with very high and low levels of peer knowledge about documents on the network. Our findings reveal that peer dynamic behavior could strongly affect search effectiveness even in optimistic scenarios: in networks where peers have a high knowledge about documents on the network, a significant fraction of queries suffer an impact on the quality of search of at least 26% still in highly stable scenarios. We also confirm that the impact of such issue in networks where peers have a lower level of knowledge can be even more intense (75%). We also evaluate content replication as a possible way to attenuate the effects of peer dynamic behavior on the effectiveness of P2P search engines. To this end, we analyze the effect of users downloading some ranked Web pages and adding them to their local collection. We observe that such strategy can significantly improve the effectiveness of P2P Web searching. In fact, the quality of results of networks with a very low level of peer knowledge about documents on the network can be significantly improved even in lowly stable scenarios. We then discuss some imposed challenges for the adoption of such solution. Actually, together with the high autonomy of peers and the absence of file-sharing benefits in replicating documents into the network, effectiveness of P2P Web search engines may strongly depend on new, application-specific incentive mechanisms for the users.
Subject: Sistemas de recuperação da informação Redes de computação
Computadores digitais Avaliação
Ferramentas de busca na Web
Computação
Redes de computação
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/RVMR-7L6J36
Issue Date: 1-Jul-2008
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
dissertacao_fabianomagalhaesatalladafonseca.pdf713.79 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.