Exploração da popularidade para busca de informação em blogs

dc.creatorLuiz Guilherme Pais dos Santos
dc.date.accessioned2019-08-13T05:36:12Z
dc.date.accessioned2025-09-09T01:00:30Z
dc.date.available2019-08-13T05:36:12Z
dc.date.issued2009-07-13
dc.description.abstractThe blogosphere is a highly dynamic and interconnected subset of the Web that has triggered a lot of interest due to its social and personal nature. In this dissertation, we present a study of an important social aspect of these blogs, namely popularity. The most popular blogs from four important blog domains in Brazil were crawled for a considerable period of time in order to collect information about the most popular blogs. The experiments, conducted with several volunteers, show that despite the blogosphere being a social network, popularity has been underexplored by at least the most popular search engines in the context of blog search. In the experiments, queries specifically formulated for retrieving these popular blogs were not capable of ranking them in the top positions (top 100) of the most popular search engines, and their page ranks, as measured by the typical web graph topology of links, are very low. It is also shown that explicitly incorporating popularity in the search engine algorithm produces rankings which were considered by volunteers, in general, very relevant.
dc.identifier.urihttps://hdl.handle.net/1843/SLSS-7WMGFM
dc.languagePortuguês
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectBanco de dados
dc.subjectRecuperação de informação
dc.subjectSistemas de recuperação da informação
dc.subjectBlogs Dissertação
dc.subject.otherweb
dc.subject.otherblogs
dc.titleExploração da popularidade para busca de informação em blogs
dc.typeDissertação de mestrado
local.contributor.advisor-co1Alberto Henrique Frade Laender
local.contributor.advisor1Marcos Andre Goncalves
local.contributor.referee1Edleno Silva de Moura
local.contributor.referee1Clodoveu Augusto Davis Junior
local.description.resumoA blogosfera é um subconjunto da Web altamente dinâmico e conectado que despertou um grande interesse devido à sua natureza social. Nesta dissertação, é apresentado um estudo de um importante aspecto dos blogs, a popularidade. Os blogs mais populares de quatro importantes domínios brasileiros foram coletados por um período de tempo considerável para obter informações sobre aqueles mais populares. Os experimentos realizados, com a ajuda de vários voluntários, mostram que apesar de a blogosfera ser uma rede social, a popularidade tem sido subutilizada, pelo menos pelas máquinas de busca mais importantes no contexto de busca de blogs. Nos experimentos, consultas especificamente formuladas para recuperar esses blogs populares não foram capazes de trazê-los entre as primeiras posições (100 primeiros) nas principais máquinas de busca. Mais ainda, os valores de PageRank desses blogs populares são também muito baixos. É mostrado, ainda, que incorporar explicitamente a popularidade ao algoritmo de ordenação de consultas de uma máquina de busca produz resultados que foram considerados pelos voluntários, de modo geral, bastante relevantes.
local.publisher.initialsUFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
luizguilhermepaissantos.pdf
Tamanho:
715.27 KB
Formato:
Adobe Portable Document Format