Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/41685
Type: Tese
Title: Semiparametric modeling for multivariate survival data via copulas
Other Titles: Modelagem semiparamétrica para dados de sobrevivência multivariados via cópulas
Authors: Walmir dos Reis Miranda Filho
First Advisor: Fábio Nogueira Demarqui
First Referee: Antônio Carlos Pedroso de Lima
Second Referee: Leonardo Soares Bastos
Third Referee: Dani Gamerman
metadata.dc.contributor.referee4: Marcos Oliveira Prates
Abstract: Clustered survival data can arise if the event of interest (the failure) is recurrent and more than one observed time is registered for each subject (which forms a cluster) under study, and the number of observed times is fixed for all subjects. Since survival data associated with the same cluster is expected to be correlated, it should be modeled in order to account for that dependence. Copula models became an appropriate framework to model clustered survival data, linking marginal survival functions to form a joint survival distribution. Much of the literature on survival copula models is concentrated on results marginally using only the Weibull model as the baseline distribution and the Proportional Hazards model as the regression structure when working with clustered survival data or supposing an informative censoring model for univariate survival data. This work proposes new survival copula models under a random and independent right-censoring assumption, addressing a variety of marginal baseline distributions (Weibull, Bernstein Polynomials, and Piecewise Exponential models) and regression model classes (Proportional Hazards, Proportional Odds, and Yang-Prentice models). Concerning the copulas themselves, each one among those treated in this work belongs to the Archimedean copula class, a family of copulas widely used in survival analysis due to some important properties. Five Archimedean copula models were addressed in this work: Ali-Mikhail-Haq; Clayton; Frank; Gumbel-Hougaard, and Joe. To evaluate and compare the proposed survival copula models, results for an extensive simulation study and a real data application were obtained. For the simulated data, variations can occur on the copula function and on the marginal baseline distribution or regression model class used for generation. Also, simulation scenarios were divided by true Kendall's tau correlation values for the copula model chosen for generation. When fitting the simulated data, better results are obtained for fitted models with the correct copula, given a specification of baseline distribution and regression structure. Moreover, even generating marginally from the Weibull model, results for fitted semiparametric models follow closely those obtained when fitting the Weibull model, being better (in general) for marginally generated data from the Exponentiated Weibull distribution, among the models fitted with the correct copula. For all survival copula models presented in this work, an R package is currently in development, containing specific functions for fitting and analysis.
Abstract: Dados de sobrevivência clusterizados podem surgir se o evento de interesse (a falha) é recorrente e mais de um tempo observado é registrado para cada indivíduo (o qual forma um cluster) sob estudo, e a quantidade de tempos observados é fixa para todos os indivíduos. Como se espera que dados de sobrevivência associados a um mesmo cluster estejam correlacionados, a modelagem dos mesmos deve considerar esta dependência. Modelos de cópula se tornaram uma estrutura útil para a modelagem de dados de sobrevivência clusterizados, conectando funções de sobrevivência marginais para construir uma distribuição conjunta de sobrevivência. Muito da literatura sobre modelos de cópula de sobrevivência está restrita a resultados para o uso do modelo Weibull como a distribuição marginal da linha de base e do modelo de Riscos Proporcionais como a estrutura marginal de regressão ao se trabalhar com dados de sobrevivência clusterizados, ou a resultados para modelos de censura informativa aplicados a dados de sobrevivência univariados. Este trabalho propõe, sob o pressuposto de censura à direita aleatória e independente, novos modelos de cópula de sobrevivência abordando uma variedade de distribuições para a linha de base marginal (modelos Weibull, Polinômios de Bernstein e Exponencial por Partes) e de classes de modelos de regressão (Riscos Proporcionais, de Chances Proporcionais e Yang-Prentice). Com respeito às cópulas, cada uma dentre as tratadas neste trabalho pertence à classe de cópulas arquimedianas, uma família de cópulas amplamente utilizada em análise de sobrevivência devido a propriedades importantes. Cinco cópulas arquimedianas foram abordadas neste trabalho: Ali-Mikhail-Haq; Clayton; Frank; Gumbel-Hougaard e Joe. Para avaliar e comparar os modelos de cópula de sobrevivência propostos, foram obtidos resultados para um estudo extensivo de simulação, bem como para uma aplicação de dados reais. Para os dados simulados, variações podem ocorrer na cópula e na classe de modelos de regressão marginal. Além disso, os cenários para simulação foram divididos por valores verdadeiros supostos para a correlação tau de Kendall, dado o modelo de cópula escolhido para a geração. Ao ajustar os dados simulados, resultados melhores são obtidos para modelos ajustados com a cópula correta, dada uma especificação da distribuição para a linha de base e da estrutura de regressão. Além disso, mesmo gerando do modelo Weibull, resultados para ajustes de modelos semiparamétricos seguem de perto os obtidos ao ajustar o modelo Weibull, dentre os modelos ajustados com a cópula correta, sendo melhores (em geral) para dados marginalmente gerados da distribuição Weibull Exponenciada. Para todos os modelos de cópula de sobrevivência apresentados neste trabalho, um pacote R está atualmente em desenvolvimento, contendo funções específicas para ajuste e análise.
Subject: Estatística – Teses
Análise de sobrevivência (Biometria) – Teses
Análise funcional – Teses
Análise de regressão – Teses
language: eng
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICX - DEPARTAMENTO DE ESTATÍSTICA
metadata.dc.publisher.program: Programa de Pós-Graduação em Estatística
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/41685
Issue Date: 24-Mar-2022
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
Tese - Walmir dRMF - Versão Final.pdf2.82 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.