Regularização de modelos para predição precoce: um estudo na predição de complicações na UTI
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Primeiro orientador
Membros da banca
Renato Vimieiro
Saulo Fernandes Saturnino
Wagner Meira Júnior
Leandro Balby Marinho
Soraia Raupp Musse
Saulo Fernandes Saturnino
Wagner Meira Júnior
Leandro Balby Marinho
Soraia Raupp Musse
Resumo
Modelos de predição estão se mostrando importantes para a tomada de decisão na UTI, porém eles geralmente apresentam o problema da caixa preta porque não fornecem a informação da lógica envolvidas nas previsões específicas do paciente. Já existem técnicas capazes de analisar os modelos e gerar explicações valiosas sobre o seu funcionamento. Porém, uma vez que o modelo é gerado, é importante garantir que ele continuará a mesma lógica de predição originalmente pretendida. Sabendo que complicações podem ocorrer a qualquer momento durante a permanência do paciente na UTI, construímos nossos modelos de aprendizado de máquina utilizando atributos obtidas a partir dos dados administrativos, resultados laboratoriais e sinais vitais do paciente, disponíveis na primeira hora após a sua admissão na UTI. Para construir modelos que continuem a funcionar como originalmente projetados, primeiro propomos medir (i) como as explicações fornecidas variam para diferentes entradas (ou seja, robustez) e (ii) como as explicações fornecidas mudam com modelos construídos a partir de diferentes subpopulações de pacientes (isto é, estabilidade). Posteriormente, empregamos essas medidas como termos de regularização que são acoplados a um procedimento de seleção de atributos de modo que o modelo final forneça previsões com explicações mais robustas e estáveis. Os experimentos foram conduzidos em um conjunto de dados contendo 6.000 internações na UTI de 5474 pacientes. Os resultados obtidos em uma coorte de validação externa de 1069 pacientes com 1086 internações em UTI mostraram que a seleção de atributos com base na robustez levou a ganhos em termos de poder preditivo que variaram de 6,8% a 9,4%, enquanto a seleção de atributos com base na estabilidade levou a ganhos que variaram de 7,2% a 11,5%, dependendo da complicação. Nossos resultados são de importância prática, pois nossos modelos preveem complicações com grande antecipação, facilitando intervenções oportunas e protetoras.
Abstract
Predictive models are proving to be important for decision-making in the ICU, but they
often present the black box problem because they do not provide the information from
the logic involved in patient-specific predictions. There are already techniques capable
of analyzing the models and generating valuable explanations about their functioning.
However, once the model is generated, it is important to ensure that it will continue with
the same prediction logic originally intended. Knowing that complications can occur at
any time during a patient’s ICU stay, we built our machine learning models using features
obtained from the patient’s administrative data, laboratory results, and vital signs, available within the first hour after admission to the ICU.This enables our models to provide
great anticipation because complications can occur at any moment during ICU stay. To
build models that continue to work as originally designed we first propose to measure (i)
how the provided explanations vary for different inputs (that is, robustness), and (ii) how
the provided explanations change with models built from different patient sub-populations
(that is, stability). Second, we employ these measures as regularization terms that are
coupled with a feature selection procedure such that the final model provides predictions
with more robust and stable explanations. Experiments were conducted on a data set
containing 6000 ICU admissions of 5474 patients. Results obtained on an external validation cohort of 1069 patients with 1086 ICU admissions showed that selecting features
based on robustness led to gains in terms of predictive power that varied from 6.8% to
9.4%, whereas selecting features based on stability led to gains that varied from 7.2% to
11.5%, depending on the target complication. Our results are of practical importance
as our models predict complications with great anticipation, thus facilitating timely and
protective interventions.
Assunto
Computação – Teses, Aprendizado de máquina – Teses, Ciência de dados - Medicina – Teses
Palavras-chave
Aprendizado de máquina, Ciência de Dados Médicos, Explicabilidade do modelo, Regularização