Usage of focused gazetteers in geoparsing

dc.creatorBruno Rabello Monteiro
dc.date.accessioned2021-06-02T15:30:16Z
dc.date.accessioned2025-09-09T00:06:30Z
dc.date.available2021-06-02T15:30:16Z
dc.date.issued2021-03-26
dc.description.abstractGeoparsing é a tarefa de recuperação de informação geográfica que lida com o reconhecimento das referências a lugares contidas nos textos. Além do geoparsing, duas outras tarefas são usadas para resolver o Problema de Resolução de Escopo Geográfico (PREG), as tarefas de resolução das referências e determinação das referências. O PREG visa determinar o escopo geográfico de documentos, ou seja, os locais ou regiões relevantes, considerando o conteúdo do documento. Vários trabalhos que tratam do PREG ou de suas tarefas focam principalmente o método de solução em si. Além disso, cada trabalho testa o algoritmo usando diferentes conjuntos de dados e fontes de conhecimento externas, como os gazetteers. Esta tese propõe uma metodologia para avaliar os gazetteers ao invés dos algoritmos. A abordagem varia o tamanho e a cobertura dos gazetteers, delimitando-os geograficamente, enquanto mantém o conjunto de dados e os algoritmos fixos. Gazetteers focados podem aumentar a precisão (com baixa perda de recall) na tarefa de geoparsing em comparação com os gazetteers generalistas. Além disso, os gazetteers focados reduzem consideravelmente o número de candidatos ambíguos para cada topônimo encontrado no geoparsing.
dc.identifier.urihttps://hdl.handle.net/1843/36251
dc.languageeng
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/pt/
dc.subjectComputação – Teses.
dc.subjectSistemas de informação geográfica – Teses.
dc.subjectGeoparsing – Teses.
dc.subjectProblema de resolução de escopo geográfico – Teses
dc.subject.otherGeographic Information Retrieval
dc.subject.otherGeographic Scope Resolution Problem
dc.subject.otherGeoparsing
dc.subject.otherFocused Gazetteers
dc.subject.otherAmbiguity
dc.subject.otherPrecision
dc.titleUsage of focused gazetteers in geoparsing
dc.title.alternativeUso de gazetteers focados para geoparsing
dc.typeTese de doutorado
local.contributor.advisor1Clodoveu Augusto Davis Junior
local.contributor.advisor1Latteshttp://lattes.cnpq.br/0471595469074043
local.contributor.referee1Frederico Torres Fonseca
local.contributor.referee1Jugurta Lisboa Filho
local.contributor.referee1Cláudio de Souza Baptista
local.contributor.referee1Mirella Moura Moro
local.creator.Latteshttp://lattes.cnpq.br/7297809559220807
local.description.resumoGeoparsing is the geographic information retrieval task that deals with the recognition of references to places contained in texts. Besides geoparsing, two other tasks are used to solve the Geographic Scope Resolution Problem (GSRP), the reference resolution and the grounding references tasks. The GSRP aims to determine the geographic scope of documents, i.e., the locations or regions relevant, considering the document content. Several works that deal with the GSRP or with its tasks focus mainly on the solution method itself. Also, each work test the algorithm using different datasets and external knowledge sources, such as a gazetteer. This thesis proposes a methodology to evaluate the gazetteers instead of the algorithm. Our approach varies gazetteer size and coverage, delimiting it geographically, while keeping the dataset and algorithms fixed. We show that focused gazetteers can increase precision (with low recall loss) in geoparsing compared to generalist gazetteers. We also show that focused gazetteers considerably reduce the number of ambiguous candidates to each toponym found on geoparsing.
local.identifier.orcidhttps://orcid.org/0000-0002-0376-3287
local.publisher.countryBrasil
local.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Ciência da Computação

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Thesis-Usage of Focused Gazetteers in Geoparsing.pdf
Tamanho:
7.07 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: