Structure learning and parameter estimation of probabilistic context neighborhoods
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Marcos Oliveira Prates
Rodrigo Lambert
Caio Teodoro de Magalhães Alves
Rodrigo Lambert
Caio Teodoro de Magalhães Alves
Resumo
Probabilistic context trees offer a more efficient representation of the dependency of a Markov Chain, both in terms of the computational effort needed as well as its easy interpretability. This model has been extensively utilized and its properties have been studied by various authors. The present thesis aims to study an extension of the probabilistic context tree model to lattices in Z^2, called probabilistic context neighborhood (PCN) model, introduced by Piroutek (2013). The PCN model proposes a tree representation for the spatial dependency of a two-dimensional Markov random field. It allows the sites of a region to depend on a variable neighborhood size, called context. This Markov random field variation is known in the literature as variable-neighborhood random field and it drastically reduces the number of free parameters to be estimated. In the PCN model, the neighborhood geometry is set to frames which allows us to calculate the cardinality of contexts of a given tree. Therefore, unlike the work of Csiszár and Talata (2006a), an algorithm is proposed to select the optimal model based on the pseudo-Bayesian information criterion (PIC). Our work seeks to validate the PCN algorithm through a simulation study. In addition, we exemplify the use of such methodology through a real-world data application. The results presented here confirm the adequacy of the algorithm, and suggest that the quota for the maximum depth of the tree could be further improved. Furthermore, an empirical study of the estimated transition probabilities indicate adequate estimates.
Abstract
As árvores probabilísticas de contexto oferecem uma representação mais eficiente para a dependência de uma Cadeia de Markov, tanto do ponto de vista computacional como em sua fácil interpretação. Essas vantagens permitiram que esses modelos fossem amplamente utilizados e suas propriedades, estudadas. A presente dissertação busca estudar a extensão
desse modelo para reticulados em Z 2
introduzida por Piroutek (2013) e denominada modelo de contexto de vizinhança probabilística, ou em inglês, probabilistic context neighborhood (PCN). O modelo PCN propõe uma representação em forma de árvore para a dependência espacial de um campo aleatório de Markov bidimimensional, permitindo que cada site dependa de uma vizinhança de tamanho variável, denominada contexto. Essa variação de campos aleatórios de Markov permite uma redução significativa dos parâmetros livres a serem estimados. No PCN, a estrutura de vizinhança é fixada em frames, diferentemente do trabalho feito em Csiszár e Talata (2006a), o que permite o cálculo da cardinalidade dos diferentes contextos de uma árvore e a proposta de um algoritmo que seleciona o melhor modelo baseado no critério PIC (pseudoBayesian information criterion). Nosso trabalho procura também validar o algoritmo PCN através de um estudo de simulações, além de exemplificar a aplicação do modelo para dados reais. Os resultados confirmam a adequação do algoritmo e sugerem que a cota do tamanho máximo da árvore permitida pode ser melhorada. Além disso, os resultados empíricos fornecem estimativas para as probabilidades de transição do processo
Assunto
Estatística - Teses., Markov, campos aleatórios - Teses., Algoritmo de contexto - Teses., Árvores probabilísticas de contexto - Teses.
Palavras-chave
Markov random field, Variable-neighborhood random field, Context algorithm, Probabilistic context tree, pseudo-Bayesian information criterion, Model selection