Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/ESBF-9XYHQL
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Clodoveu Augusto Davis Juniorpt_BR
dc.contributor.referee1Claudio de Souza Baptistapt_BR
dc.contributor.referee2Frederico Torres Fonsecapt_BR
dc.contributor.referee3Rodrygo Luis Teodoro Santospt_BR
dc.creatorTiago Henrique Valadares Mendes de Mourapt_BR
dc.date.accessioned2019-08-10T14:51:24Z-
dc.date.available2019-08-10T14:51:24Z-
dc.date.issued2015-06-11pt_BR
dc.identifier.urihttp://hdl.handle.net/1843/ESBF-9XYHQL-
dc.description.abstractGazetteers are instrumental in recognizing place names in documents such as Web pages, news, and social media messages. However, creating and maintaining gazetteers is still a complex and demanding task. We propose using Linked Data sources to put together gazetteer data that can be both broad (e.g. planetary) and deep (e.g., down to urban detail). Linked data sources also allow enriching the resulting gazetteer with a set of geographic and semantic relationships involving place names, other geographic and non-geographic terms, thus expanding the possibilities for solving typical GIR problems such as disambiguation and filtering. This work shows the results of efforts to compose and maintain an ontological gazetteer, in which places and their names are connected to other places and to non-geographic entities through geographic and semantic relationships. The objective of this proposal is to create, organize and populate a large ontological gazetteer with information obtained from the Web of Data, to be exposed as a Web service to applications and research initiatives on geographic information retrieval, text processing, named entity recognition and others. The resulting gazetteer contains more than 13 million places, extracted from the four datasets used in this work: GeoNames, Freebase, DBPedia and LinkedGeoData. In addition, we present an analysis of how the datasets overlap one another.pt_BR
dc.description.resumoGazetteers são ferramentas comumente utilizadas para reconhecimento de nomes de lugares em documentos como páginas da Web, notícias e mensagens em redes sociais. A utilização de fontes de dados que seguem o padrão Linked Data é uma forma de se obter informações para se criar um gazetteer mundialmente amplo e com detalhamento de informações em um nível intra-urbano. Nesse trabalho é apresentado o Linked OntoGazetteer, um gazetteer ontológico que utiliza informações da Web of Data como fonte de dados, além de obter evidências extras como relacionamento de entidades geográficas com outras entidades, que enriquecem a base de conhecimento resultante, aumentando a capacidade de resolução de problemas típicos em Recuperação de Informação Geográfica (RIG) como a desambiguação de topônimos. Os dados armazenados pelo gazetteer são disponibilizados através de Web Services para que aplicações e iniciativas de pesquisa em diversas outras áreas possam utilizar.O gazetteer resultante deste trabalho possui mais de 13 milhões de lugares extraídos de quatro fontes de dados: GeoNames, Freebase, DBPedia e LinkedGeoData. Também é apresentada uma análise de como essas fontes de dados se sobrepõem, levando em consideração as entidades armazenadas em cada uma delas.pt_BR
dc.languagePortuguêspt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectRecuperação de informação geográficapt_BR
dc.subjectLinked datapt_BR
dc.subjectIntegração de dadospt_BR
dc.subjectGazetteerpt_BR
dc.subject.otherComputaçãopt_BR
dc.subject.otherSistemas de informação geograficapt_BR
dc.subject.otherSistemas de recuperação da informaçãopt_BR
dc.titleEnriquecimento de dados de referência para recuperação de informação geográfica utilizando linked datapt_BR
dc.typeDissertação de Mestradopt_BR
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
tiagohenriquevaladares.pdf2.7 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.