Utilização da estrutura de ligações da Web em problemas de recuperação de informação

dc.creatorPavel Pereira Calado
dc.date.accessioned2019-08-12T15:21:06Z
dc.date.accessioned2025-09-09T00:14:04Z
dc.date.available2019-08-12T15:21:06Z
dc.date.issued2004-03-03
dc.identifier.urihttps://hdl.handle.net/1843/SLBS-645J3Y
dc.languagePortuguês
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectRecuperação da informação
dc.subjectWorld Wide Web (Sistema de recuperação da informação)
dc.subjectComputação
dc.subject.otherLigações da Web
dc.subject.otherRecuperação
dc.titleUtilização da estrutura de ligações da Web em problemas de recuperação de informação
dc.typeTese de doutorado
local.contributor.advisor1Berthier Ribeiro de Araujo Neto
local.contributor.referee1Henrique Pacca Loureiro Luna
local.contributor.referee1Nivio Ziviani
local.contributor.referee1Arlindo Manuel Limede de Oliveira
local.contributor.referee1Ilmério Reis da Silva
local.description.resumoA popularidade e o crescimento da World Wide Web oferecem uma oportunidade única para a experimentação em larga escala, o que tem afetado de sobremaneira a pesquisa em várias áreas do conhecimento, particularmente, a área de Recuperação de Informação (RI). Por exemplo, entre as muitas novas técnicas criadas no contexto da Web, análise de ligações (links) é uma que tem atraído grande atenção. A razão é que informação sobre as ligações entre páginas e pode ser usada para melhorar a qualidade das respostas de uma consulta do usuário. Neste trabalho, estudamos como ligações entre páginas e podem ser aplicadas na resolução de dois problemas distintos: (a) ordenação de respostas a uma consulta e (b) classificação de documentos da Web. Para isso modelos formais baseados em redes Bayesianas são propostos. Estes modelos são validados através de testes executados numa coleção extraída da Web brasileira. Os resultados mostram que, efetivamente, ligações entre páginas Web são umas fontes de evidência importantes, tanto para ordenar como para classificar documentos. Em ambos os caso, combinação de informação de ligações entre páginas Web com informação sobre o conteúdo das páginas produz resultados melhores do que aqueles obtidos com o uso de cada fonte de evidência isoldamente. Para o problema de ordenação das respostas, informação sobre as ligações entre páginas Web produz resultados de alta precisão no topo do conjunto ordenado de documentos. Na tarefa de classificação, as ligações entre as páginas demonstraram ser uma fonte de evidência mais confiável que o próprio texto dos documentos.
local.publisher.initialsUFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
pavel_calado.pdf
Tamanho:
924.03 KB
Formato:
Adobe Portable Document Format