A Bayesian repulsive mixture model for multivariate functional data
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Um modelo Bayesiano de mistura repulsivo para dados funcionais multivariados
Primeiro orientador
Membros da banca
Fabio Nogueira Demarqui
Marcos Oliveira Prates
Garritt L. Page
Luís Maurício Castro Cepero
Marcos Oliveira Prates
Garritt L. Page
Luís Maurício Castro Cepero
Resumo
The main objective of this thesis is to propose a new Bayesian mixture model for identifying clusters of multivariate functional data. As an alternative to the usual hypothesis of
independence between the probabilistic models associated with each mixture component, we propose that there be repulsiveness between the locations of these components. To this end, we adapted the class of repulsive density functions proposed by Petralia et al. (2012) to the case of multivariate functional data. Clusters are identified based on the similarity of the shape of functional curves, and the repulsive characteristic of the model favors the identification of better differentiated clusters, thus avoiding the formation of redundant clusters. The identification of clusters can also be influenced by covariates associated with each individual. Our model was motivated by the study conducted by Hopkins et al. (2019), which applied a random partition model to identify clusters of individual represented by functional curves that indicated different types of chronic ankle injuries. In that study, some clusters were considered very similar in terms of curve shape, characterizing a redundancy problem that could affect the specification of appropriate treatments to each type of injury. The proposed model is estimated using an MCMC algorithm that contains a split-merge step, which contributes significantly to the appropriate identification of clusters. The proposed split-merge step is an adaptation of the original proposal by Jain and Neal (2007) to our case of a finite mixture model with dependence between components. The effects of repulsiveness, as well as covariates,
on cluster identification are shown through simulation studies and applications with real data, including an application of the model to the same data analyzed in Hopkins et al. (2019).
Abstract
Esta tese tem como principal objetivo propor um novo modelo Bayesiano de mistura para identificação de clusters de dados funcionais multivariados. Como alternativa à usual hipótese de independência entre os modelos probabilísticos associados a cada componente da mistura, propomos que haja repulsividade entre as localizações dessas componentes. Para isso, adaptamos a classe funções de densidade repulsiva proposta por Petralia et al. (2012) para o caso de dados funcionais multivariados. A identificação dos clusters é feita com base na similaridade do formato de curvas funcionais, e a característica repulsiva do modelo favorece a identificação de clusters melhor diferenciados, evitando-se assim a formação de clusters redundantes. A identificação dos clusters pode ser também influenciada por covariáveis associadas a cada indivíduo. Nosso modelo foi motivado pelo estudo realizado por Hopkins et al. (2019), que aplicou um modelo de partição aleatória para identificar clusters de indivíduos representados por curvas funcionais que indicavam diferentes tipos de lesão crônica de tornozelo. Naquele estudo, alguns clusters foram considerados muito similares com relação ao formato das curvas, caracterizando um problema de redundância que poderia afetar a especificação de tratamentos apropriados específicos para cada tipo de lesão. A estimação do modelo proposto é feita através de um algoritmo MCMC que contem um passo split-merge que contribui significativamente para uma identificação apropriada dos clusters, adaptado da proposta original de Jain and Neal (2007) para o nosso caso de mistura finita, com dependência entre as componentes. Os efeitos da repulsividade, e também das covariáveis, na identificação dos clusters são mostrados através de estudos de simulação e aplicações com dados reais, incluindo uma aplicação do modelo aos mesmos dados analisados em Hopkins et al. (2019)
Assunto
Estatística – Teses, Teoria bayesiana de decisão estatistica – Teses, Amostragem (Estatística) – Teses, Markov, Processos de – Teses, Análise multivariada – Teses
Palavras-chave
Repulsive mixture model, Multivariate functional data, Markov chain Monte Carlo
Citação
Departamento
Endereço externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso restrito
