Mistura markoviana oculta: detecção de pontos de mudança em séries com espaçamento irregular
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Hidden markovian mixture: detection of change points in irregularly spaced series
Primeiro orientador
Membros da banca
Rosangela Helena Loschi
Flávio Bambirra Gonçalves
Guilherme Lopes de Oliveira
Daiane Aparecida Zuanetti
Flávio Bambirra Gonçalves
Guilherme Lopes de Oliveira
Daiane Aparecida Zuanetti
Resumo
Este trabalho aborda problemas de detecção de pontos de mudança em dados sequenciais, uma área de pesquisa com aplicações diversas, como genética, finanças, processamento de sinais entre outras. O foco está na análise de séries com espaçamento irregular, ou seja, quando o espaçamento entre os instantes ou locais de observações consecutivas não é fixo. Os modelos aqui desenvolvidos para identificação de mudanças são extensões de um modelo de Mistura Markoviana Oculta publicado em 2020, construído para identificar observações atípicas, e carregam sua capacidade em lidar com o distanciamento irregular. Os modelos consideram dependência (Markoviana) ou independência entre observações com base nas distâncias entre os locais. A inferência Bayesiana é conduzida por meio de amostragem indireta via Gibbs Sampling. Especificações a priori informativas para a estrutura de dependência são essenciais para identificar clusters. Os modelos desenvolvidos adaptam essas distribuições a priori a fim de permitir a identificação de mudanças em um problema geral. Dois modelos de mistura são formulados: um para mudanças na média e outro para mudanças multiparamétricas na média ou variância. Métodos pós-processamento são sugeridos para categorizar as observações entre as componentes a fim de viabilizar a identificação de mudanças pelas misturas propostas. Esses métodos
são baseados na máxima probabilidade a posteriori e consideram a incerteza associada às classificações. O desempenho dos modelos e métodos de agrupamento são avaliados em simulações Monte Carlo, com séries artificiais de distanciamento irregular, e em aplicações reais. A abordagem proposta é comparada a métodos existentes na literatura para agrupamento e detecção de mudanças.
Abstract
This work addresses change-point detection problems in sequential data, a research area with various applications, such as genetics, finance, signal processing, among others. The focus lies in analyzing unevenly spaced time series, that is, when the distance between
time instants or locations of consecutive observations is not fixed. The models developed here for change detection are extensions of a Hidden Markov Mixture model published in 2020, originally designed for identifying atypical observations, and carry its capability
to handle irregular spacing. These models consider dependence (Markovian) or independence between observations based on the distances between locations. Bayesian inference is carried out through indirect sampling via Gibbs Sampling. Informative prior specifications for the dependency structure are crucial to identify clusters. The developed models adapt these prior distributions to enable change identification in a general problem setting. Two mixture models are formulated: one for changes in the mean and another for multiparametric changes in the mean or variance. Post-processing methods are suggested to categorize observations among the components in order to facilitate change identification by the proposed mixtures. These methods are based on maximum posterior probability and consider the uncertainty associated with classifications. The performance of the models and clustering methods is evaluated through Monte Carlo simulations, using artificially irregularly spaced series, as well as in real-world applications. The proposed approach is compared to existing methods in the literature for clustering and change detection.
Assunto
Estatística - Teses, Markov Swiching - Modelos econométricos - Teses, Inferência bayesiana - Teses, Pontos de quebra - Teses
Palavras-chave
Agrupamento, Dados seriais, Inferência Bayesiana, Modelo Markov-swiching, Ponto de quebra