Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/74818
Type: Tese
Title: Características clínicas e fatores de risco que afetam a mortalidade de crianças e adolescentes com COVID-19: um estudo de coorte retrospectivo de âmbito nacional utilizando aprendizado de máquina
Other Titles: Clinical characteristics and risk factors affecting mortality of children and adolescents with COVID-19: a nationwide retrospective cohort study using machine learning
Authors: Adriano Lages dos Santos
First Advisor: Eduardo Araújo de Oliveira
First Co-advisor: Ana Cristina Simões e Silva
First Referee: Paulo Augusto Moreira Camargos
Second Referee: Ana Paula Couto da Silva
Third Referee: Lilian Martins Oliveira Diniz
metadata.dc.contributor.referee4: Cristiane dos Santos Dias
metadata.dc.contributor.referee5: Eduardo Araújo de Oliveira
Abstract: A pandemia de COVID-19 impulsionou a aplicação de tecnologias digitais avançadas, como a inteligência artificial (IA), para prever a mortalidade em pacientes adultos. No entanto, o desenvolvimento de modelos de aprendizado de máquina (ML) para prever desfechos em crianças e adolescentes com COVID-19 ainda é limitado. Este estudo teve como objetivo avaliar o desempenho de múltiplos modelos de aprendizado de máquina na previsão de mortalidade entre pacientes pediátricos hospitalizados com COVID-19 e analisar sua viabilidade quando aplicados a grandes bases de dados. Neste estudo de coorte, utilizamos o banco de dados SIVEP-Gripe, um recurso público mantido pelo Ministério da Saúde, para monitorar a síndrome respiratória aguda grave (SRAG) no Brasil. Para criar subconjuntos destinados ao treinamento e teste dos modelos de aprendizado de máquina (ML), dividimos o banco de dados primário em três partes. Com esses subconjuntos, desenvolvemos e treinamos 12 algoritmos de ML para prever os desfechos. Avaliamos o desempenho desses modelos utilizando diversas métricas, como acurácia, precisão, sensibilidade, revocação e a área sob a curva característica de operação do receptor (AUC). Entre as 37 variáveis examinadas, 24 foram identificadas como potenciais indicadoras de mortalidade, conforme determinado pelo teste de independência do qui-quadrado. O algoritmo de regressão logística (LR) obteve o maior desempenho, com uma acurácia de 92,5% e uma AUC de 80,1% no conjunto de dados otimizado. Os algoritmos de Gradient Boosting Classifier (GBC) e Adaptive Boosting (ADA) apresentaram resultados semelhantes aos do algoritmo LR. Nosso estudo também revelou que a saturação de oxigênio reduzida na linha de base, a presença de comorbidades e a idade avançada foram os fatores mais relevantes na previsão de mortalidade em crianças e adolescentes hospitalizados. O uso de modelos de ML pode ser uma ferramenta valiosa na tomada de decisões clínicas e na implementação de estratégias de gestão de pacientes baseadas em evidências, o que pode melhorar os desfechos dos pacientes e a qualidade geral dos cuidados médicos. Os modelos LR, GBC e ADA demonstraram eficiência na previsão precisa de mortalidade em pacientes pediátricos com COVID-19.
Abstract: The COVID-19 pandemic has catalyzed the application of advanced digital technologies such as artificial intelligence (AI) to predict mortality in adult patients. However, the development of machine learning (ML) models for predicting outcomes in children and adolescents with COVID-19 remains limited. This study aimed to evaluate the performance of multiple machine learning models in forecasting mortality among hospitalized pediatric COVID-19 patients and assess their feasibility when applied to large-scale datasets. In this cohort study, we used the SIVEP-Gripe dataset, a public resource maintained by the Ministry of Health, to track severe acute respiratory syndrome (SARS) in Brazil. To create subsets for training and testing the machine learning (ML) models, we divided the primary dataset into three parts. Using these subsets, we developed and trained 12 ML algorithms to predict the outcomes. We assessed the performance of these models using various metrics such as accuracy, precision, sensitivity, recall, and area under the receiver operating characteristic curve (AUC). Among the 37 variables examined, 24 were found to be potential indicators of mortality, as determined by the chi-square test of independence. The LR algorithm achieved the highest performance, with an accuracy of 92.5% and an AUC of 80.1%, on the optimized dataset. GBC and ADA closely followed the LR algorithm, producing similar results. Our study also revealed that baseline reduced oxygen saturation, presence of comorbidities, and older age were the most relevant factors in predicting mortality in hospitalized children and adolescents. The use of ML models can be an asset in making clinical decisions and implementing evidence-based patient management strategies, which can enhance patient outcomes and overall quality of medical care. LR, GBC, and ADA models have demonstrated efficiency in accurately predicting mortality in COVID-19 pediatric patients.
Subject: COVID-19
Inteligência Artificial
Aprendizado de Máquina
Criança
Adolescente
Morte
Fatores de risco
Dissertação Acadêmica
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: MED - DEPARTAMENTO DE PEDIATRIA
metadata.dc.publisher.program: Programa de Pós-Graduação em Ciências da Saúde - Saúde da Criança e do Adolescente
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI: http://hdl.handle.net/1843/74818
Issue Date: 10-Jul-2024
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
Tese_Adriano_completa-EAO_ALS_220824_apos_revisaoRepoIns.pdf4.62 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons