Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/RVMR-7AAQQJ
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Nivio Zivianipt_BR
dc.contributor.advisor-co1Edleno Silva de Mourapt_BR
dc.contributor.referee1Ilmério Reis da Silvapt_BR
dc.contributor.referee2Carlos Alberto Heuserpt_BR
dc.contributor.referee3Alberto Henrique Frade Laenderpt_BR
dc.contributor.referee4Marcos Andre Goncalvespt_BR
dc.creatorThierson Couto Rosapt_BR
dc.date.accessioned2019-08-10T11:26:53Z-
dc.date.available2019-08-10T11:26:53Z-
dc.date.issued2007-12-12pt_BR
dc.identifier.urihttp://hdl.handle.net/1843/RVMR-7AAQQJ-
dc.description.abstractIn this work, we show how information derived from links among Web documents can be used in the solutions of the problem of document classification. The most obvious form of link between two Web documents is a hyperlink connecting them. But links can also be derived from references among documents of digital collections hosted in the Web, for instance, from citations among articles of digital libraries and encyclopedias. Specifically, we study how the use of measures derived from link information, namedbibliometric measures can improve the accuracy of classification systems. As bibliometric measures, we used co-citation, bibliographic coupling and Amsler. We obtained distinct classifiers by applying bibliometric and text-based measures to the traditional k-nearest neighbors (kNN) and Support Vector Machine (SVM) classification methods. Bibliometric measures were shown to be effective for document classification whenever some characteristics of link distribution is present in the collection. Most of the documents where the classifier based on bibliometric measures failed were shown to be difficult ones even for human classification. We also propose a new alternative way of combining results of bibliometric-measurebased classifiers and text based classifiers. In the experiments performed with three distinct collections, the combination approach adopted achieved results better than the results of each classifier in isolation.pt_BR
dc.description.resumoEste trabalho mostra como informações derivadas de apontadores entre documentos da Web podem ser utilizadas na solução do problema de classificação de documentos. A forma mais comum de apontadores entre documentos da Web corresponde aos hyperlinks entre documentos. Entretanto, apontadores também podem ser derivados a partir de referências entre documentos de coleções digitais hospedadas na Web, por exemplo, a partir de referências entre artigos de bibliotecas digitais ou de enciclopedias. Especificamente, investigamos como a utilização de medidas derivadas de informação de apontadores, denominadas medidas bibliometricas, podem ser utilizadas para melhorar a qualidade de sistemas de classificação de documentos. As medidas bibliometricas utilizadas foram: co-citação, acoplamento bibliográfico e Amsler. Obtivemos classificadores com estas medidas e classificadores com informações de texto, utilizando os seguintes métodos de classificação: o método dos vizinhos mais próximos (kNN) e o método Suport Vector Machine (SVM). Classificadores com medidas bibliométricas mostraram ser eficazes sempre que a distribuição de apontadores na coleção possui determinadas características. Além disto, os documentos para os quais classificadores baseados nestas medidas falham mostraram-se difíceis também na classificação feita por pessoas.Propomos, ainda, um modo alternativo de combinar resultados de classificadores que usam medidas bibliométricas com resultados de classificadores que usam informações de texto. Experimentos mostram que a combinação de resultados é superior ao resultados individuais em todas as coleções de teste.pt_BR
dc.languagePortuguêspt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectbibliotecas digitaispt_BR
dc.subject.otherCiencia da informação Metodos estatisticospt_BR
dc.subject.otherWorld Wide Web (Sistema de recuperação da informação)pt_BR
dc.subject.otherComputaçãopt_BR
dc.subject.otherSistemas especialistas (Computação)pt_BR
dc.subject.otherProcessamento de textos (Computação)pt_BR
dc.subject.otherSistemas de recuperação da informaçãopt_BR
dc.subject.otherBibliometriapt_BR
dc.titleUso de apontadores na classificação de documentos em coleções digitaispt_BR
dc.typeTese de Doutoradopt_BR
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
thiersoncoutorosa.pdf579.18 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.