Please use this identifier to cite or link to this item:
http://hdl.handle.net/1843/RVMR-6EAG2L
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor1 | Nivio Ziviani | pt_BR |
dc.contributor.advisor-co1 | Edleno Silva de Moura | pt_BR |
dc.contributor.referee1 | Berthier Ribeiro de Araujo Neto | pt_BR |
dc.contributor.referee2 | Renato Antonio Celso Ferreira | pt_BR |
dc.creator | Charles Ornelas Almeida | pt_BR |
dc.date.accessioned | 2019-08-13T00:30:23Z | - |
dc.date.available | 2019-08-13T00:30:23Z | - |
dc.date.issued | 2005-07-07 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/1843/RVMR-6EAG2L | - |
dc.description.resumo | O crescimento inexorável do volume de documentos na World Wide Web coloca um grande desafio para as máquinas de busca, não apenas com relação a eficácia as também com relação a eficiência de espaço e de tempo. Esta dissertação apresenta um novo método de compressão com perda (poda) para arquivos invertidos que considera o aspecto eficiência sem desconsiderar a eficácia. O método proposto é baseado na análise de 'logs' de consultas passadas para obter uma grande redução no espaço ocupado pelo índice. O método pode ser utilizado em qualquer máquina de busca para melhorar sua eficiência em termos de tempo de processamento e espaço ocupado pelo índice, praticamente sem perdas na qualidade dos resultados da consulta. Experimentos utilizando uma máquina de busca real mostram que a técnica apresentada reduz os custos de armazenamento do índice em até 50% com relação ao índice sem compressão. Uma consequência dessa redução no tamanho do índice é que o tempo de processamento de uma consulta pode ser reduzido a aproximadamente 45% do tempo original, sem perda na precisão média. Considerando a qualidade do 'ranking' produzido, o espaço ocupado pelo índice e o tempo de resposta a consultas, estudos comparativos com os dois melhores algoritmos de compressão de índices conhecidos na literatura mostram que o algoritmo proposto é bastante competitivo. Por exemplo, tanto a curva de similaridade entre os 'rankings' quanto a precisão média das respostas do algoritmo proposto e o melhor algoritmo dentre os dois considerados na comparação se mantêm aproximadamente iguais para os diferentes níveis de poda. Quanto ao tempo de resposta o algoritmo proposto é mais rápido do que o melhor algoritmo dentre os dois considerados na comparação. | pt_BR |
dc.language | Português | pt_BR |
dc.publisher | Universidade Federal de Minas Gerais | pt_BR |
dc.publisher.initials | UFMG | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | recuperação de informação | pt_BR |
dc.subject.other | Recuperação da informação | pt_BR |
dc.subject.other | World Wide Web (Sistema de recuperação da informação) | pt_BR |
dc.subject.other | Computação | pt_BR |
dc.subject.other | Sistema de recuperação da informação | pt_BR |
dc.title | Poda estática para índices invertidos baseada em logs | pt_BR |
dc.type | Dissertação de Mestrado | pt_BR |
Appears in Collections: | Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
charlesornelaalmeida.pdf | 354.12 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.