Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/74818
Tipo: Tese
Título: Características clínicas e fatores de risco que afetam a mortalidade de crianças e adolescentes com COVID-19: um estudo de coorte retrospectivo de âmbito nacional utilizando aprendizado de máquina
Título(s) alternativo(s): Clinical characteristics and risk factors affecting mortality of children and adolescents with COVID-19: a nationwide retrospective cohort study using machine learning
Autor(es): Adriano Lages dos Santos
Primeiro Orientador: Eduardo Araújo de Oliveira
Primeiro Coorientador: Ana Cristina Simões e Silva
Primeiro membro da banca : Paulo Augusto Moreira Camargos
Segundo membro da banca: Ana Paula Couto da Silva
Terceiro membro da banca: Lilian Martins Oliveira Diniz
Quarto membro da banca: Cristiane dos Santos Dias
Quinto membro da banca: Eduardo Araújo de Oliveira
Resumo: A pandemia de COVID-19 impulsionou a aplicação de tecnologias digitais avançadas, como a inteligência artificial (IA), para prever a mortalidade em pacientes adultos. No entanto, o desenvolvimento de modelos de aprendizado de máquina (ML) para prever desfechos em crianças e adolescentes com COVID-19 ainda é limitado. Este estudo teve como objetivo avaliar o desempenho de múltiplos modelos de aprendizado de máquina na previsão de mortalidade entre pacientes pediátricos hospitalizados com COVID-19 e analisar sua viabilidade quando aplicados a grandes bases de dados. Neste estudo de coorte, utilizamos o banco de dados SIVEP-Gripe, um recurso público mantido pelo Ministério da Saúde, para monitorar a síndrome respiratória aguda grave (SRAG) no Brasil. Para criar subconjuntos destinados ao treinamento e teste dos modelos de aprendizado de máquina (ML), dividimos o banco de dados primário em três partes. Com esses subconjuntos, desenvolvemos e treinamos 12 algoritmos de ML para prever os desfechos. Avaliamos o desempenho desses modelos utilizando diversas métricas, como acurácia, precisão, sensibilidade, revocação e a área sob a curva característica de operação do receptor (AUC). Entre as 37 variáveis examinadas, 24 foram identificadas como potenciais indicadoras de mortalidade, conforme determinado pelo teste de independência do qui-quadrado. O algoritmo de regressão logística (LR) obteve o maior desempenho, com uma acurácia de 92,5% e uma AUC de 80,1% no conjunto de dados otimizado. Os algoritmos de Gradient Boosting Classifier (GBC) e Adaptive Boosting (ADA) apresentaram resultados semelhantes aos do algoritmo LR. Nosso estudo também revelou que a saturação de oxigênio reduzida na linha de base, a presença de comorbidades e a idade avançada foram os fatores mais relevantes na previsão de mortalidade em crianças e adolescentes hospitalizados. O uso de modelos de ML pode ser uma ferramenta valiosa na tomada de decisões clínicas e na implementação de estratégias de gestão de pacientes baseadas em evidências, o que pode melhorar os desfechos dos pacientes e a qualidade geral dos cuidados médicos. Os modelos LR, GBC e ADA demonstraram eficiência na previsão precisa de mortalidade em pacientes pediátricos com COVID-19.
Abstract: The COVID-19 pandemic has catalyzed the application of advanced digital technologies such as artificial intelligence (AI) to predict mortality in adult patients. However, the development of machine learning (ML) models for predicting outcomes in children and adolescents with COVID-19 remains limited. This study aimed to evaluate the performance of multiple machine learning models in forecasting mortality among hospitalized pediatric COVID-19 patients and assess their feasibility when applied to large-scale datasets. In this cohort study, we used the SIVEP-Gripe dataset, a public resource maintained by the Ministry of Health, to track severe acute respiratory syndrome (SARS) in Brazil. To create subsets for training and testing the machine learning (ML) models, we divided the primary dataset into three parts. Using these subsets, we developed and trained 12 ML algorithms to predict the outcomes. We assessed the performance of these models using various metrics such as accuracy, precision, sensitivity, recall, and area under the receiver operating characteristic curve (AUC). Among the 37 variables examined, 24 were found to be potential indicators of mortality, as determined by the chi-square test of independence. The LR algorithm achieved the highest performance, with an accuracy of 92.5% and an AUC of 80.1%, on the optimized dataset. GBC and ADA closely followed the LR algorithm, producing similar results. Our study also revealed that baseline reduced oxygen saturation, presence of comorbidities, and older age were the most relevant factors in predicting mortality in hospitalized children and adolescents. The use of ML models can be an asset in making clinical decisions and implementing evidence-based patient management strategies, which can enhance patient outcomes and overall quality of medical care. LR, GBC, and ADA models have demonstrated efficiency in accurately predicting mortality in COVID-19 pediatric patients.
Assunto: COVID-19
Inteligência Artificial
Aprendizado de Máquina
Criança
Adolescente
Morte
Fatores de risco
Dissertação Acadêmica
Idioma: por
País: Brasil
Editor: Universidade Federal de Minas Gerais
Sigla da Instituição: UFMG
Departamento: MED - DEPARTAMENTO DE PEDIATRIA
Curso: Programa de Pós-Graduação em Ciências da Saúde - Saúde da Criança e do Adolescente
Tipo de Acesso: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI: http://hdl.handle.net/1843/74818
Data do documento: 10-Jul-2024
Aparece nas coleções:Teses de Doutorado

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Tese_Adriano_completa-EAO_ALS_220824_apos_revisaoRepoIns.pdf4.62 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons