Imputation of missing data using gaussian linear Cluster-Weighted Modeling

Luis Alejandro Masmela Caita

Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/38120

Full metadata record

DC Field	Value	Language
dc.contributor.advisor1	Thaís Paiva Galleti	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/6313658269652848	pt_BR
dc.contributor.advisor-co1	Marcos Oliveira Prates	pt_BR
dc.contributor.referee1	Lourdes Coral Contreras Montenegro	pt_BR
dc.contributor.referee2	Rosangela Helena Loschi	pt_BR
dc.contributor.referee3	Camila Borelli Zeller	pt_BR
dc.contributor.referee4	Daniel Manrique-Vallier	pt_BR
dc.creator	Luis Alejandro Masmela Caita	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/2531123939464084	pt_BR
dc.date.accessioned	2021-09-22T00:18:25Z	-
dc.date.available	2021-09-22T00:18:25Z	-
dc.date.issued	2021-03-26	-
dc.identifier.uri	http://hdl.handle.net/1843/38120	-
dc.description.abstract	Dados ausentes ocorrem quando alguns valores não são armazenados ou observados para variáveis de interesse. No entanto, a maior parte da teoria estatística assume que os dados são totalmente observados. Uma alternativa para lidar com bases de dados incompletas é preencher os espaços correspondentes às informações faltantes com base em alguns critérios, essa técnica é chamada de imputação. Apresentamos uma nova metodologia de imputação para bancos de dados com unidades de não resposta usando informações adicionais de variáveis auxiliares totalmente observadas. Assumimos que as variáveis não observadas são contínuas e que as variáveis auxiliares ajudam a melhorar a capacidade de imputação do modelo. Em uma estrutura totalmente Bayesiana, nosso método usa uma mistura flexível de distribuições normais multivariadas para modelar a resposta e as variáveis auxiliares em conjunto. Sob essa estrutura, usamos as propriedades da modelagem Gaussian Cluster-Weighted para construir um modelo preditivo para imputar os valores ausentes usando as informações das covariáveis. Estudos de simulação e uma ilustração de dados reais são apresentados para mostrar a capacidade de imputação do método sob uma variedade de cenários e em comparação com outros métodos da literatura.	pt_BR
dc.description.resumo	Missing data occurs when some values are not stored or observed for variables of interest. However, most of the statistical theory assumes that data is fully observed. An alternative to deal with incomplete databases is to fill in the spaces corresponding to the missing information based on some criteria, this technique is called imputation. We introduce a new imputation methodology for databases with non-response units using additional information from fully observed auxiliary variables. We assume that the non-observed variables are continuous, and that auxiliary variables assist to improve the imputation capacity of the model. In a fully Bayesian framework, our method uses a flexible mixture of multivariate normal distributions to model the response and the auxiliary variables jointly. Under this framework, we use the properties of Gaussian Cluster-Weighted modeling to construct a predictive model to impute the missing values using the information from the covariates. Simulations studies and a real data illustration are presented to show the method imputation capacity under a variety of scenarios and in comparison to other literature methods.	pt_BR
dc.description.sponsorship	CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior	pt_BR
dc.language	eng	pt_BR
dc.publisher	Universidade Federal de Minas Gerais	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	ICX - DEPARTAMENTO DE ESTATÍSTICA	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Estatística	pt_BR
dc.publisher.initials	UFMG	pt_BR
dc.relation	Programa Institucional de Internacionalização – CAPES - PrInt	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Cluster-Weighted Modeling	pt_BR
dc.subject	Gaussian mixture models	pt_BR
dc.subject	Imputation method	pt_BR
dc.subject	Missing data	pt_BR
dc.subject.other	Estatística – Teses.	pt_BR
dc.subject.other	Correlação (Estatistica) – Teses.	pt_BR
dc.subject.other	Crítica de imputação de dados (Estatística) – Teses.	pt_BR
dc.subject.other	Ausência de dados (Estatística) – Teses.	pt_BR
dc.subject.other	Processos gaussianos – Teses	pt_BR
dc.title	Imputation of missing data using gaussian linear Cluster-Weighted Modeling	pt_BR
dc.title.alternative	Imputação de dados faltantes usando Cluster-Weighted Modeling linear gausiana	pt_BR
dc.type	Tese	pt_BR
Appears in Collections:	Teses de Doutorado

Files in This Item:

File	Description	Size	Format
Thesis Imputation of Missing Data Using Gaussian Linear Cluster-Weighted Modeling SHB .pdf		16.49 MB	Adobe PDF	View/Open

Show simple item record