Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/49573
Type: Tese
Title: Regularização de modelos para predição precoce: um estudo na predição de complicações na UTI
Authors: Tiago Amador Coelho
First Advisor: Adriano Alonso Veloso
First Referee: Renato Vimieiro
Second Referee: Saulo Fernandes Saturnino
Third Referee: Wagner Meira Júnior
metadata.dc.contributor.referee4: Leandro Balby Marinho
metadata.dc.contributor.referee5: Soraia Raupp Musse
Abstract: Modelos de predição estão se mostrando importantes para a tomada de decisão na UTI, porém eles geralmente apresentam o problema da caixa preta porque não fornecem a informação da lógica envolvidas nas previsões específicas do paciente. Já existem técnicas capazes de analisar os modelos e gerar explicações valiosas sobre o seu funcionamento. Porém, uma vez que o modelo é gerado, é importante garantir que ele continuará a mesma lógica de predição originalmente pretendida. Sabendo que complicações podem ocorrer a qualquer momento durante a permanência do paciente na UTI, construímos nossos modelos de aprendizado de máquina utilizando atributos obtidas a partir dos dados administrativos, resultados laboratoriais e sinais vitais do paciente, disponíveis na primeira hora após a sua admissão na UTI. Para construir modelos que continuem a funcionar como originalmente projetados, primeiro propomos medir (i) como as explicações fornecidas variam para diferentes entradas (ou seja, robustez) e (ii) como as explicações fornecidas mudam com modelos construídos a partir de diferentes subpopulações de pacientes (isto é, estabilidade). Posteriormente, empregamos essas medidas como termos de regularização que são acoplados a um procedimento de seleção de atributos de modo que o modelo final forneça previsões com explicações mais robustas e estáveis. Os experimentos foram conduzidos em um conjunto de dados contendo 6.000 internações na UTI de 5474 pacientes. Os resultados obtidos em uma coorte de validação externa de 1069 pacientes com 1086 internações em UTI mostraram que a seleção de atributos com base na robustez levou a ganhos em termos de poder preditivo que variaram de 6,8% a 9,4%, enquanto a seleção de atributos com base na estabilidade levou a ganhos que variaram de 7,2% a 11,5%, dependendo da complicação. Nossos resultados são de importância prática, pois nossos modelos preveem complicações com grande antecipação, facilitando intervenções oportunas e protetoras.
Abstract: Predictive models are proving to be important for decision-making in the ICU, but they often present the black box problem because they do not provide the information from the logic involved in patient-specific predictions. There are already techniques capable of analyzing the models and generating valuable explanations about their functioning. However, once the model is generated, it is important to ensure that it will continue with the same prediction logic originally intended. Knowing that complications can occur at any time during a patient’s ICU stay, we built our machine learning models using features obtained from the patient’s administrative data, laboratory results, and vital signs, available within the first hour after admission to the ICU.This enables our models to provide great anticipation because complications can occur at any moment during ICU stay. To build models that continue to work as originally designed we first propose to measure (i) how the provided explanations vary for different inputs (that is, robustness), and (ii) how the provided explanations change with models built from different patient sub-populations (that is, stability). Second, we employ these measures as regularization terms that are coupled with a feature selection procedure such that the final model provides predictions with more robust and stable explanations. Experiments were conducted on a data set containing 6000 ICU admissions of 5474 patients. Results obtained on an external validation cohort of 1069 patients with 1086 ICU admissions showed that selecting features based on robustness led to gains in terms of predictive power that varied from 6.8% to 9.4%, whereas selecting features based on stability led to gains that varied from 7.2% to 11.5%, depending on the target complication. Our results are of practical importance as our models predict complications with great anticipation, thus facilitating timely and protective interventions.
Subject: Computação – Teses
Aprendizado de máquina – Teses
Ciência de dados - Medicina – Teses
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.program: Programa de Pós-Graduação em Ciência da Computação
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/49573
Issue Date: 30-Aug-2022
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
Tese_Final (1).pdfTese final no formato PDF/A com as alterações pedidas2.23 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.