Joint modeling longitudinal and survival data via Bernstein polynomials
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Modelagem conjunta de dados longitudinais e de sobrevivência via polinômios de Bernstein
Primeiro orientador
Membros da banca
Enrico Antônio Colosimo
Dani Gamerman
Leila Denise Alves Ferreira Amorim
Antônio Eduardo Gomes
Dani Gamerman
Leila Denise Alves Ferreira Amorim
Antônio Eduardo Gomes
Resumo
The essence of present work is composed of two main topics, namely: (i) to jointly model longitudinal and survival data; and (ii) to use Bernstein Polynomials (BP) to approximate important and unknown functions in this framework. Considering the joint models, we have, essentially, two main variables: survival times and a variable that is repeatedly measured over time - this latter being called longitudinal variable. We expect that these two variables are related. The structure of the joint model is composed of two sub-models (one for each response variable) that are somehow linked. This type of modeling approach have been used for presenting more precise estimates, since it uses all data information altogether. In turn, Bernstein Polynomials are a very flexible approach and they are used to approximate continuous and smooth functions. Then, our proposal consists of using the BP to approximate the baseline hazard function / cumulative baseline hazard function, as well as the time-varying part of the longitudinal variable. In addition to that, we came up with a solution to the challenge of the choice of the degree. In theory, the larger the degree the better is the approximation. However, in practice, we should consider other aspects, such as the estimation procedure and the concept of parsimony. Thus, the optimal value would be the minimum degree that approximates the main characteristics of the target function. We derived a probabilistic method that indicates a minimum degree, and we also proposed two criteria for the choice of the optimal value. In order to show the benefits of our propositions, we discuss results of two simulation studies. In the first one, we focused on the degree selection method. Then, in the second one, we verified the good performance of joint modeling via BP.
Abstract
O trabalho proposto se baseia em dois pontos principais: (i) modelar conjuntamente dados longitudinais e de sobrevivência; e (ii) utilizar os Polinômios de Bernstein (BP) para aproximar funções desconhecidas e de interesse. No contexto de modelagem conjunta, considera-se essencialmente duas variáveis: tempos de sobrevivência e uma variável que é medida repetidas vezes ao longo do tempo - esta última sendo chamada de variável longitudinal. Assim, supõe-se que essas duas informações são relacionadas, e a estrutura dessa modelagem se dá por dois submodelos (um para cada variável) que são ligados de alguma forma. A modelagem conjunta de dados longitudinais e de sobrevivência vem sendo utilizada por apresentar melhorias na estimação, uma vez que explora toda a informação disponível simultaneamente. Por sua vez, os Polinômios de Bernstein se destacam por serem bastante flexíveis, podendo ser uma boa aproximação para qualquer função suave. Nossa proposta é modelar as funções taxa de falha basal / taxa de falha basal acumulada e o comportamento temporal da variável longitudinal através dessa ferramenta. Ainda nesse contexto, foram desenvolvidos critérios para contornar um desafio que consiste na escolha do grau desse polinômio. De forma teórica, quanto maior for o grau, melhor será a aproximação. No entanto, levando em consideração o conceito de parcimônia e a estimação, deseja-se obter um grau mínimo que contemple as características principais da função alvo. Propusemos formas de escolher um grau mínimo a partir de informações a priori do comportamento da função de interesse, assim como um grau máximo. Para mostrar os benefícios de utilizar os métodos propostos, foram feitos dois estudos de simulação com réplicas Monte Carlo. O primeiro foca em mostrar o bom funcionamento dos métodos de escolha do grau. Por sua vez, o objetivo do segundo estudo foi verificar a performance da modelagem conjunta via BP.
Assunto
Estatística - Teses., Análise de sobrevivência (Biometria) - Teses., Métodos de simulação - Teses., Markov, Processos de - Teses., Método de Monte Carlo - Teses., Estudos longitudinais - Teses.
Palavras-chave
Baseline hazard function, Degree selection, MCMC, Stan, Time-dependent variable