Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/38120
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Thaís Paiva Galletipt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6313658269652848pt_BR
dc.contributor.advisor-co1Marcos Oliveira Pratespt_BR
dc.contributor.referee1Lourdes Coral Contreras Montenegropt_BR
dc.contributor.referee2Rosangela Helena Loschipt_BR
dc.contributor.referee3Camila Borelli Zellerpt_BR
dc.contributor.referee4Daniel Manrique-Vallierpt_BR
dc.creatorLuis Alejandro Masmela Caitapt_BR
dc.creator.Latteshttp://lattes.cnpq.br/2531123939464084pt_BR
dc.date.accessioned2021-09-22T00:18:25Z-
dc.date.available2021-09-22T00:18:25Z-
dc.date.issued2021-03-26-
dc.identifier.urihttp://hdl.handle.net/1843/38120-
dc.description.abstractDados ausentes ocorrem quando alguns valores não são armazenados ou observados para variáveis de interesse. No entanto, a maior parte da teoria estatística assume que os dados são totalmente observados. Uma alternativa para lidar com bases de dados incompletas é preencher os espaços correspondentes às informações faltantes com base em alguns critérios, essa técnica é chamada de imputação. Apresentamos uma nova metodologia de imputação para bancos de dados com unidades de não resposta usando informações adicionais de variáveis auxiliares totalmente observadas. Assumimos que as variáveis não observadas são contínuas e que as variáveis auxiliares ajudam a melhorar a capacidade de imputação do modelo. Em uma estrutura totalmente Bayesiana, nosso método usa uma mistura flexível de distribuições normais multivariadas para modelar a resposta e as variáveis auxiliares em conjunto. Sob essa estrutura, usamos as propriedades da modelagem Gaussian Cluster-Weighted para construir um modelo preditivo para imputar os valores ausentes usando as informações das covariáveis. Estudos de simulação e uma ilustração de dados reais são apresentados para mostrar a capacidade de imputação do método sob uma variedade de cenários e em comparação com outros métodos da literatura.pt_BR
dc.description.resumoMissing data occurs when some values are not stored or observed for variables of interest. However, most of the statistical theory assumes that data is fully observed. An alternative to deal with incomplete databases is to fill in the spaces corresponding to the missing information based on some criteria, this technique is called imputation. We introduce a new imputation methodology for databases with non-response units using additional information from fully observed auxiliary variables. We assume that the non-observed variables are continuous, and that auxiliary variables assist to improve the imputation capacity of the model. In a fully Bayesian framework, our method uses a flexible mixture of multivariate normal distributions to model the response and the auxiliary variables jointly. Under this framework, we use the properties of Gaussian Cluster-Weighted modeling to construct a predictive model to impute the missing values using the information from the covariates. Simulations studies and a real data illustration are presented to show the method imputation capacity under a variety of scenarios and in comparison to other literature methods.pt_BR
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorpt_BR
dc.languageengpt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentICX - DEPARTAMENTO DE ESTATÍSTICApt_BR
dc.publisher.programPrograma de Pós-Graduação em Estatísticapt_BR
dc.publisher.initialsUFMGpt_BR
dc.relationPrograma Institucional de Internacionalização – CAPES - PrIntpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectCluster-Weighted Modelingpt_BR
dc.subjectGaussian mixture modelspt_BR
dc.subjectImputation methodpt_BR
dc.subjectMissing datapt_BR
dc.subject.otherEstatística – Teses.pt_BR
dc.subject.otherCorrelação (Estatistica) – Teses.pt_BR
dc.subject.otherCrítica de imputação de dados (Estatística) – Teses.pt_BR
dc.subject.otherAusência de dados (Estatística) – Teses.pt_BR
dc.subject.otherProcessos gaussianos – Tesespt_BR
dc.titleImputation of missing data using gaussian linear Cluster-Weighted Modelingpt_BR
dc.title.alternativeImputação de dados faltantes usando Cluster-Weighted Modeling linear gausianapt_BR
dc.typeTesept_BR
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
Thesis Imputation of Missing Data Using Gaussian Linear Cluster-Weighted Modeling SHB .pdf16.49 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.