Use este identificador para citar o ir al link de este elemento:
http://hdl.handle.net/1843/SLSS-8KDPKG
Registro completo de metadatos
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor1 | Clodoveu Augusto Davis Junior | pt_BR |
dc.contributor.referee1 | Mirella Moura Moro | pt_BR |
dc.contributor.referee2 | Altigran Soares da Silva | pt_BR |
dc.creator | Rafael Odon de Alencar | pt_BR |
dc.date.accessioned | 2019-08-11T00:10:53Z | - |
dc.date.available | 2019-08-11T00:10:53Z | - |
dc.date.issued | 2011-07-29 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/1843/SLSS-8KDPKG | - |
dc.description.abstract | Obtaining or approximating a geographic location for search results often motivates users to include place names and other geography-related terms in their queries. Previous work shows that queries that include geography-related terms correspond to a significant share of the users demand. Therefore, it is important to recognize the association of documents to places in order to adequately respond to such queries. This dissertation describes strategies for the geographic scope computation, using Wikipedia as an alternative source of direct and indirect geographic references. First we propose to perform a text classification task on geography-related classes, using textual evidence extracted from Wikipedia. We use terms that correspond to articles titles and the connections between articles in Wikipedias graph to establish a semantic network from which classification features are generated. Results of experiments using a news data-set, classified over Brazilian states, show that such terms constitute a valid evidence set for the geographic classification of documents, and demonstrate the potential of this technique for text classification. Another proposal describes a strategy for tagging documents with multiple place names, according to the geographic context of their textual content, using a topic indexing technique that considers Wikipedia articles as a controlled vocabulary. By identifying those topics in the text, we connect documents with the Wikipedia semantic network of articles, allowing us to perform operations on Wikipedias graph and find related places. We present an experimental evaluation on documents tagged as Brazilian states, demonstrating the feasibility of our proposal and opening the way to further research on geotagging based on semantic networks. Our results demonstrates the feasibility of using Wikipedia as an alternative source of geographical references. The method\\\'s main advantage is the use of free, up-to-date and wide knowledge and information from the digital encyclopedia. Finally, the Wikipedia introduction to the geographic text analysis can be faced as both, an alternative and a extension to use of geographical dictionaries (i. e. gazetteers). | pt_BR |
dc.description.resumo | Dado que uma parcela significativa de buscas na Web apresenta alguma intenção geográfica, é importante conceber formas automáticas de associar recursos a lugares (geotagging). O presente trabalho propõe duas estratégias para geotagging de textos usando a Wikipedia como fonte de evidência geográfica. Primeiro, propõe-se a classificação automática de textos com base na ocorrência de palavras-chave extraídas da Wikipedia para um conjunto de lugares. Em seguida, é proposto basear-se numa técnica de identificação de tópicos auxiliada pela Wikipedia, onde os tópicos encontrados conectam textos ao grafo da Wikipedia, permitindo a busca por lugares relacionados. Experimentos avaliaram a precisão do geotagging em uma coleção de documentos associados a estados brasileiros. Demonstrou-se a viabilidade do uso da Wikipedia como fonte de evidência geográfica, beneficiando-se de seu conhecimento livre, amplo e atualizado e apresentando uma alternativa ou extensão aos dicionários geográficos(gazetteers) em tarefas de recuperação de informação geográfica. | pt_BR |
dc.language | Inglês | pt_BR |
dc.publisher | Universidade Federal de Minas Gerais | pt_BR |
dc.publisher.initials | UFMG | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Geotagging | pt_BR |
dc.subject | Automatic Text Classification | pt_BR |
dc.subject | Recuperação de Informação Geográfica | pt_BR |
dc.subject | Wikipedia | pt_BR |
dc.subject.other | Computação | pt_BR |
dc.subject.other | Sistemas de informação geografica | pt_BR |
dc.subject.other | Sistemas de recuperação da informação | pt_BR |
dc.title | Utilizando Evidência da wikipedia para relacionar textos a lugares | pt_BR |
dc.type | Dissertação de Mestrado | pt_BR |
Aparece en las colecciones: | Dissertações de Mestrado |
archivos asociados a este elemento:
archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
rafaelodonalencar.pdf | 3.09 MB | Adobe PDF | Visualizar/Abrir |
Los elementos en el repositorio están protegidos por copyright, con todos los derechos reservados, salvo cuando es indicado lo contrario.