Spatial product partition model through spanning trees

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Fabio Gagliardi Cozman
Pedro Olmo Stancioli Vaz de Melo
Rosangela Helena Loschi

Resumo

Ao analisar dados espaciais, muitas vezes há a necessidade de agregar áreas geográficas em regiões maiores, um processo chamado de regionalização ou agrupamento com restrições espaciais. Este tipo de agregação pode ser útil para tornar a análise de dados tratável, reduzir o efeito de diferentes populações levando a uma melhor manipulação estatística dos dados ou até mesmo para facilitar a visualização.Neste trabalho, apresentamos um novo método de regionalização que incorpora o conceito de árvores geradoras a um modelo estatístico, formando um novo tipo de modelo partição produto espacial. Ao condicionar as partições em quebras de árvores geradoras, reduz-se o espaço de busca, possibilitando a construção de um algoritmo eficaz para amostragem da distribuição a posteriori das partições.Nós mostramos que, ao usar um modelo estatístico Bayesiano, é possível acomodar melhor a variação natural dos dados e diminuir o efeito de valores extremos, produzindo assim melhores resultados quando comparado com as abordagens tradicionais. Nós também mostramos como nosso modelo é flexível o suficiente para acomodar dados com diferentes distribuições. Finalmente, nós avaliamos o nosso método através de experimentos com dados simulados, bem como através de dois estudos de caso.

Abstract

When performing analysis of spatial data, there is often the need to aggregate geographical areas into larger regions, a process called regionalization or spatially constrained clustering. This type of aggregation can be useful to make data analysis tractable, reduce the effect of different populations for a better statistical handling of the data or even to facilitate the visualization.In this work we present a new regionalization method which incorporates the concept of spanning trees into a statistical framework, forming a new type of spatial product partition model. By conditioning the partitions to splits of spanning trees we reduce the search space and enable the construction of an effective sampling algorithm.We show how using a Bayesian statistical framework we are able to better accommodate the natural variation of the data and to diminish the effect of outliers, producing better results when compared with the traditional approaches. We also show how our model is flexible enough to accommodate distinct distributions of data. Finally, we evaluate our method through experiments with simulated data as well as with two distinct case studies.

Assunto

Computação, Variaveis latentes  , Teoria bayesiana de decisão estatistica

Palavras-chave

Latent Models, Bayesian Structure Learning, Spatial Clustering, Partition Models

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por