A Bayesian repulsive mixture model for multivariate functional data

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Tese de doutorado

Título alternativo

Um modelo Bayesiano de mistura repulsivo para dados funcionais multivariados

Primeiro orientador

Membros da banca

Fabio Nogueira Demarqui
Marcos Oliveira Prates
Garritt L. Page
Luís Maurício Castro Cepero

Resumo

The main objective of this thesis is to propose a new Bayesian mixture model for identifying clusters of multivariate functional data. As an alternative to the usual hypothesis of independence between the probabilistic models associated with each mixture component, we propose that there be repulsiveness between the locations of these components. To this end, we adapted the class of repulsive density functions proposed by Petralia et al. (2012) to the case of multivariate functional data. Clusters are identified based on the similarity of the shape of functional curves, and the repulsive characteristic of the model favors the identification of better differentiated clusters, thus avoiding the formation of redundant clusters. The identification of clusters can also be influenced by covariates associated with each individual. Our model was motivated by the study conducted by Hopkins et al. (2019), which applied a random partition model to identify clusters of individual represented by functional curves that indicated different types of chronic ankle injuries. In that study, some clusters were considered very similar in terms of curve shape, characterizing a redundancy problem that could affect the specification of appropriate treatments to each type of injury. The proposed model is estimated using an MCMC algorithm that contains a split-merge step, which contributes significantly to the appropriate identification of clusters. The proposed split-merge step is an adaptation of the original proposal by Jain and Neal (2007) to our case of a finite mixture model with dependence between components. The effects of repulsiveness, as well as covariates, on cluster identification are shown through simulation studies and applications with real data, including an application of the model to the same data analyzed in Hopkins et al. (2019).

Abstract

Esta tese tem como principal objetivo propor um novo modelo Bayesiano de mistura para identificação de clusters de dados funcionais multivariados. Como alternativa à usual hipótese de independência entre os modelos probabilísticos associados a cada componente da mistura, propomos que haja repulsividade entre as localizações dessas componentes. Para isso, adaptamos a classe funções de densidade repulsiva proposta por Petralia et al. (2012) para o caso de dados funcionais multivariados. A identificação dos clusters é feita com base na similaridade do formato de curvas funcionais, e a característica repulsiva do modelo favorece a identificação de clusters melhor diferenciados, evitando-se assim a formação de clusters redundantes. A identificação dos clusters pode ser também influenciada por covariáveis associadas a cada indivíduo. Nosso modelo foi motivado pelo estudo realizado por Hopkins et al. (2019), que aplicou um modelo de partição aleatória para identificar clusters de indivíduos representados por curvas funcionais que indicavam diferentes tipos de lesão crônica de tornozelo. Naquele estudo, alguns clusters foram considerados muito similares com relação ao formato das curvas, caracterizando um problema de redundância que poderia afetar a especificação de tratamentos apropriados específicos para cada tipo de lesão. A estimação do modelo proposto é feita através de um algoritmo MCMC que contem um passo split-merge que contribui significativamente para uma identificação apropriada dos clusters, adaptado da proposta original de Jain and Neal (2007) para o nosso caso de mistura finita, com dependência entre as componentes. Os efeitos da repulsividade, e também das covariáveis, na identificação dos clusters são mostrados através de estudos de simulação e aplicações com dados reais, incluindo uma aplicação do modelo aos mesmos dados analisados em Hopkins et al. (2019)

Assunto

Estatística – Teses, Teoria bayesiana de decisão estatistica – Teses, Amostragem (Estatística) – Teses, Markov, Processos de – Teses, Análise multivariada – Teses

Palavras-chave

Repulsive mixture model, Multivariate functional data, Markov chain Monte Carlo

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso restrito