Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/56421
Type: Artigo de Periódico
Title: Bayesian space-time partitioning by sampling and pruning spanning trees
Other Titles: Partição bayesiana do espaço-tempo por amostragem e poda de árvores geradoras
Authors: Leonardo Vilela Teixeira
Renato Martins Assunção
Rosangela Helena Loschi
Abstract: A typical problem in spatial data analysis is regionalization or spatially constrained clustering, which consists of aggregating small geographical areas into larger regions. A major challenge when partitioning a map is the huge number of possible partitions that compose the search space. This is compounded if we are partitioning spatio-temporal data rather than purely spatial data. We introduce a spatio-temporal product partition model that deals with the regionalization problem in a probabilistic way. Random spanning trees are used as a tool to tackle the problem of searching the space of possible partitions making feasible this exploration. Based on this framework, we propose an efficient Gibbs sampler algorithm to sample from the posterior distribution of the parameters, specially the random partition. The proposed Gibbs sampler scheme carries out a random walk on the space of the spanning trees and the partitions induced by deleting tree edges. In the purely spatial situation, we compare our proposed model with other state-of-art regionalization techniques to partition maps using simulated and real social and health data. To illustrate how the temporal component is handled by the algorithm and to show how the spatial clusters vary along the time we presented an application using human development index data. The analysis shows that our proposed model is better than state-of-art alternatives. Another appealing feature of the method is that the prior distribution for the partition is interpretable with a trivial coin flipping mechanism allowing its easy elicitation.
Abstract: Um problema típico na análise de dados espaciais é a regionalização ou clusterização espacialmente restrita, que consiste em agregar pequenas áreas geográficas em regiões maiores. Um grande desafio ao particionar um mapa é o grande número de partições possíveis que compõem o espaço de busca. Isso é agravado se estivermos particionando dados espaço-temporais em vez de dados puramente espaciais. Introduzimos um modelo de partição de produto espaço-temporal que lida com o problema de regionalização de forma probabilística. Árvores geradoras aleatórias são utilizadas como uma ferramenta para resolver o problema de busca no espaço de possíveis partições tornando viável essa exploração. Com base neste arcabouço, propomos um algoritmo amostrador de Gibbs eficiente para amostrar a partir da distribuição posterior dos parâmetros, especialmente a partição aleatória. O esquema amostrador de Gibbs proposto realiza um passeio aleatório no espaço das árvores geradoras e nas partições induzidas pela exclusão das arestas da árvore. Na situação puramente espacial, comparamos nosso modelo proposto com outras técnicas de regionalização de última geração para particionar mapas usando dados sociais e de saúde simulados e reais. Para ilustrar como o componente temporal é tratado pelo algoritmo e mostrar como os agrupamentos espaciais variam ao longo do tempo, apresentamos uma aplicação usando dados do índice de desenvolvimento humano. A análise mostra que nosso modelo proposto é melhor do que as alternativas do estado da arte. Outra característica atraente do método é que a distribuição a priori para a partição é interpretável com um mecanismo trivial de lançamento de moeda, permitindo sua fácil elicitação.
Subject: Estatística
Análise espacial (Estatística)
Teoria bayesiana de decisão estatistica
language: eng
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
ICX - DEPARTAMENTO DE ESTATÍSTICA
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/56421
Issue Date: 2019
metadata.dc.url.externa: https://www.jmlr.org/papers/v20/
metadata.dc.relation.ispartof: Journal of Machine Learning Research
Appears in Collections:Artigo de Periódico

Files in This Item:
File Description SizeFormat 
Bayesian space-time partitioning by sampling and pruning spanning trees.pdf5.44 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.