Imputação múltipla e análise de casos completos no contexto da saúde pública: uma avaliação prática do impacto das perdas nas análises

dc.creatorVitor Passos Camargos
dc.date.accessioned2019-08-12T03:22:58Z
dc.date.accessioned2025-09-09T01:01:04Z
dc.date.available2019-08-12T03:22:58Z
dc.date.issued2011-02-18
dc.description.abstractResearchers in the health field often deal with the problem of incomplete databases. Complete Case Analysis (CCA), which restricts the analysis to subjects with complete data, reduces the sample size and may result in biased estimates. Based on statistical grounds, the Multiple Imputation (MI) method uses all collected data and is recommended as an alternative to CCA. Data from the study Saúde em Beagá, attended by 4048 adults from two of nine health districts in the city of Belo Horizonte in 2008-2009, were used to evaluate CCA and different MI approaches in the context of logistic models with incomplete covariates. The Body Mass Index (BMI), an indicator of high public health relevance, was obtained through self-reported measures, and subsequently by direct measurements of height and weight of participants. The self-reported measures showed high percentage of missing data, which have spread to BMI based on them. However the minimum losses in direct measurements allowed BMI calculation for virtually entire sample. Given this peculiarity of the study, a hypothetical situation in which the missing data for BMI based on self-reported measures are recovered could be approached by a simple procedure. The methods of ACC and different approaches to IM were applied in a context where the BMI, with missing data, is one of the covariates in a logistic regression. The results of these methods were then compared with the results after the missing data recovery. It was found that even the more simplistic MI approach performed better than CCA since it was closer to the post-recovery results.
dc.identifier.urihttps://hdl.handle.net/1843/BUBD-9FVDWB
dc.languagePortuguês
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectAnálise de regressão
dc.subjectBrasil
dc.subjectÍndice de massa corporal
dc.subjectModelos logísticos
dc.subjectInterpretação estatística de dados
dc.subjectBases de dados factuais
dc.subjectInqueritos epidemiólogicos
dc.subjectDados estatísticos
dc.subjectFatores sexuais
dc.subject.otherAnálise estatística
dc.subject.otherModelos logísticos
dc.subject.otherÍndice de massa corporal
dc.subject.otherMétodos
dc.titleImputação múltipla e análise de casos completos no contexto da saúde pública: uma avaliação prática do impacto das perdas nas análises
dc.typeDissertação de mestrado
local.contributor.advisor-co1Cibele Comini Cesar
local.contributor.advisor1Fernando Augusto Proietti
local.contributor.referee1Ilka Afonso Reis
local.contributor.referee1Waleska Teixeira Caiaffa
local.description.resumoPesquisadores da área da saúde lidam frequentemente com o problema das bases de dados incompletas. A Análise de Casos Completos (ACC), que restringe as análises aos indivíduos com dados completos, reduz o tamanho da amostra e pode produzir estimativas viciadas. Baseado em fundamentos estatísticos, o método de Imputação Múltipla (IM) utiliza todos os dados coletados e é recomendado como alternativa a ACC. Dados do estudo Saúde em Beagá, inquérito domiciliar em que participaram 4048 adultos de dois dos nove distritos sanitários da cidade de Belo Horizonte no biênio 2008-2009, foram utilizados para avaliar a ACC e diferentes abordagens de IM no contexto de modelos logísticos com covariáveis incompletas. O Índice de Massa Corporal (IMC), um indicador de grande relevância na saúde pública, foi obtido por meio de medidas auto-referidas e posteriormente também por aferições diretas do peso e altura dos participantes. As medidas auto-referidas apresentaram um elevado percentual de perdas, que se propagaram para o IMC baseado nas mesmas. No entanto, perdas mínimas nas medidas aferidas permitiram o calculo do IMC para praticamente toda a amostra. Dada essa particularidade do estudo, a situação hipotética em que os dados ausentes do IMC, baseado nas medidas auto-referidas, são recuperados pôde ser aproximada por um procedimento simples. Os métodos de ACC e diferentes abordagens de IM foram aplicados no contexto em que o IMC, ainda com perdas, é uma das covariáveis de uma regressão logística. Os resultados desses métodos foram então comparados com os resultados posteriores à recuperação dos dados ausentes. Verificou-se que mesmo a abordagem mais simplista de IM obteve melhor desempenho que a ACC, já que se aproximou mais aos resultados pós-recuperação.
local.publisher.initialsUFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
v_tor_passos_camargos.pdf
Tamanho:
2.13 MB
Formato:
Adobe Portable Document Format