Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/36251
Type: Tese
Title: Usage of focused gazetteers in geoparsing
Other Titles: Uso de gazetteers focados para geoparsing
Authors: Bruno Rabello Monteiro
First Advisor: Clodoveu Augusto Davis Junior
First Referee: Frederico Torres Fonseca
Second Referee: Jugurta Lisboa Filho
Third Referee: Cláudio de Souza Baptista
metadata.dc.contributor.referee4: Mirella Moura Moro
Abstract: Geoparsing is the geographic information retrieval task that deals with the recognition of references to places contained in texts. Besides geoparsing, two other tasks are used to solve the Geographic Scope Resolution Problem (GSRP), the reference resolution and the grounding references tasks. The GSRP aims to determine the geographic scope of documents, i.e., the locations or regions relevant, considering the document content. Several works that deal with the GSRP or with its tasks focus mainly on the solution method itself. Also, each work test the algorithm using different datasets and external knowledge sources, such as a gazetteer. This thesis proposes a methodology to evaluate the gazetteers instead of the algorithm. Our approach varies gazetteer size and coverage, delimiting it geographically, while keeping the dataset and algorithms fixed. We show that focused gazetteers can increase precision (with low recall loss) in geoparsing compared to generalist gazetteers. We also show that focused gazetteers considerably reduce the number of ambiguous candidates to each toponym found on geoparsing.
Abstract: Geoparsing é a tarefa de recuperação de informação geográfica que lida com o reconhecimento das referências a lugares contidas nos textos. Além do geoparsing, duas outras tarefas são usadas para resolver o Problema de Resolução de Escopo Geográfico (PREG), as tarefas de resolução das referências e determinação das referências. O PREG visa determinar o escopo geográfico de documentos, ou seja, os locais ou regiões relevantes, considerando o conteúdo do documento. Vários trabalhos que tratam do PREG ou de suas tarefas focam principalmente o método de solução em si. Além disso, cada trabalho testa o algoritmo usando diferentes conjuntos de dados e fontes de conhecimento externas, como os gazetteers. Esta tese propõe uma metodologia para avaliar os gazetteers ao invés dos algoritmos. A abordagem varia o tamanho e a cobertura dos gazetteers, delimitando-os geograficamente, enquanto mantém o conjunto de dados e os algoritmos fixos. Gazetteers focados podem aumentar a precisão (com baixa perda de recall) na tarefa de geoparsing em comparação com os gazetteers generalistas. Além disso, os gazetteers focados reduzem consideravelmente o número de candidatos ambíguos para cada topônimo encontrado no geoparsing.
Subject: Computação – Teses.
Sistemas de informação geográfica – Teses.
Geoparsing – Teses.
Problema de resolução de escopo geográfico – Teses
language: eng
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
metadata.dc.publisher.program: Programa de Pós-Graduação em Ciência da Computação
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI: http://hdl.handle.net/1843/36251
Issue Date: 26-Mar-2021
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
Thesis-Usage of Focused Gazetteers in Geoparsing.pdf7.24 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons