Improved genetic algorithm for Bayesian Network structure learning applied to diagnostic of coronary arterial diseases

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Frederico Gadelha Guimarães
Michel Bessani

Resumo

In this study, we developed a new Genetic Algorithm for training Bayesian Networks (GATFBN). Using synthetic datasets like ASIA and Alarm, we validated this algorithm by comparing it with other BN training algorithms, such as TABU and Hill Climbing (HC). The comparison of network structures obtained by the GATFBN indicated that, on average, the GATFBN achieved better results. Subsequently, we trained two BN models using TABU and GATFBN with real medical data, and an XGBoost model for baseline comparison. The BN model obtained with the GATFBN achieved a higher AUC on the test data compared to the model trained with TABU but was lower than the XGBoost model. However, the BN model trained with the GATFBN demonstrated better sensitivity than the XGBoost model. Additionally, we conducted a sensitivity analysis of the variables present in the BN trained by GATFBN . We concluded that the GATFBN produces better structures for BNs and that the model obtained through it could achieve AUCs comparable to XGBoost while offering superior data interpretability.

Abstract

Neste estudo, desenvolvemos um novo Algoritmo Gen´ etico para treinar Redes Bayesianas (GATFBN). Usando conjuntos de dados sint´eticos como ASIA e Alarm, validamos os GATFBN comparando-o com outros algoritmos de treinamento de BN, como TABU e Hill Climbing (HC). A compara¸ c˜ ao das estruturas de rede obtidas pelo GATFBN indicou que, em m´edia, o GATFBN alcan¸cou melhores resultados. Subsequentemente, treinamos dois modelos de BN usando TABU e GATFBN com dados m´edicos reais e um modelo XGBoost para compara¸c˜ao de base. O modelo de BN obtido com o GATFBN alcan¸cou uma AUC mais alta nos dados de teste em compara¸c˜ao com o modelo treinado com TABU, mas foi inferior ao modelo XGBoost. No entanto, o modelo de BN treinado com o GATFBN demonstrou melhor sensibilidade do que o modelo XGBoost. Al´em disso, realizamos uma an´alise de sensibilidade das vari´aveis presentes na BN-GA. Conclu´ımos que o GATFBN produz melhores estruturas para BNs e que o modelo obtido por meio dele pode alcan¸car AUCs compar´aveis ao XGBoost, oferecendo, ao mesmo tempo, uma melhor interpretabilidade dos dados.

Assunto

Engenharia elétrica, Algoritmos genéticos, Teoria bayesiana de decisão estatística, Processamento de dados, Coronárias - Doenças

Palavras-chave

Genetic algorithm, Bayesian network structure learning

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Aberto