Uma estratégia para remoção de ambiguidades na identificação de autoria de objetos bibliográficos
| dc.creator | Jean Wanderlei Alves de Oliveira | |
| dc.date.accessioned | 2019-08-11T16:54:18Z | |
| dc.date.accessioned | 2025-09-09T00:40:23Z | |
| dc.date.available | 2019-08-11T16:54:18Z | |
| dc.date.issued | 2005-04-01 | |
| dc.description.abstract | The problem of informational overload generated by the success of the Web has led to the emergence of services that congregate information in specific contexts, known as digital libraries. Digital libraries combine digital information and metadata that frequently are collected from diverse sources. The lack of standardization of metadata deriving from these sources brings as consequence the ambiguity in determined fields. In this dissertation we present a strategy for the disambiguation in fields referring to names of authors in digital libraries. Our strategy uses Information Retrieval techniques associated to a clustering algorithm that allows the creation of unified indexes. We demonstrate the effectiveness of our strategy through a set of experiments conducted on two test collections derived from the Biblioteca Digital Brasileira de Computação (BDBComp) and the Digital Bibliography of Library Project (DBLP). For the BDBComp collection, the average between the quality of the generated groups and its fragmentation was over the mark of 95%, and for the collection of the DBLP, this average was over 65%. | |
| dc.identifier.uri | https://hdl.handle.net/1843/RVMR-6EAGQK | |
| dc.language | Português | |
| dc.publisher | Universidade Federal de Minas Gerais | |
| dc.rights | Acesso Aberto | |
| dc.subject | Catalogo de autoridade | |
| dc.subject | Bibliotecas digitais | |
| dc.subject | Metadados | |
| dc.subject | Computação | |
| dc.subject | Sistemas de recuperação da informação | |
| dc.subject.other | identificação de autoria | |
| dc.title | Uma estratégia para remoção de ambiguidades na identificação de autoria de objetos bibliográficos | |
| dc.type | Dissertação de mestrado | |
| local.contributor.advisor1 | Alberto Henrique Frade Laender | |
| local.contributor.referee1 | Marcello Peixoto Bax | |
| local.contributor.referee1 | Marcos André Gonçalves | |
| local.contributor.referee1 | Osvaldo Sergio Farhat de Carvalho | |
| local.description.resumo | O problema de sobrecarga informacional gerado pelo sucesso da Web provocou o surgimento de serviços que reúnem informações em contextos específicos, conhecidos como bibliotecas digitais. Bibliotecas digitais reúnem informações digitais e metadados que freqüentemente são obtidos a partir de fontes diversas. A não padronização dos metadados oriundos dessas fontes traz como consequência a ambiguidade em determinados campos. Nesta dissertação apresentamos uma estratégia para o tratamento de ambiguidades encontradas em campos referentes a nomes de autores em bibliotecas digitais. Nossa estratégia utiliza técnicas de recuperação de informação associadas a um algoritmo de agrupamento que permite a criação de arquivos de autoridade. Demonstramos a eficácia de nossa estratégia através da realização de experimentos sobre duas coleções de teste derivadas da Biblioteca Digital Brasileira de Computação (BDBComp) e Digital Bibliography of Library Project (DBLP). Para a coleção da BDBComp, a média entre a qualidade dos grupos gerados e sua fragmentação foi superior à marca de 90%, e para a coleção da DBLP, essa média foi superior a 65%. | |
| local.publisher.initials | UFMG |
Arquivos
Pacote original
1 - 1 de 1
Carregando...
- Nome:
- jeanwanderleialvesoliveira.pdf
- Tamanho:
- 482.52 KB
- Formato:
- Adobe Portable Document Format