Improved genetic algorithm for Bayesian Network structure learning applied to diagnostic of coronary arterial diseases
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Frederico Gadelha Guimarães
Michel Bessani
Michel Bessani
Resumo
In this study, we developed a new Genetic Algorithm for training Bayesian Networks
(GATFBN). Using synthetic datasets like ASIA and Alarm, we validated this algorithm
by comparing it with other BN training algorithms, such as TABU and Hill Climbing
(HC). The comparison of network structures obtained by the GATFBN indicated that, on
average, the GATFBN achieved better results. Subsequently, we trained two BN models
using TABU and GATFBN with real medical data, and an XGBoost model for baseline
comparison. The BN model obtained with the GATFBN achieved a higher AUC on the
test data compared to the model trained with TABU but was lower than the XGBoost
model. However, the BN model trained with the GATFBN demonstrated better sensitivity
than the XGBoost model. Additionally, we conducted a sensitivity analysis of the variables
present in the BN trained by GATFBN . We concluded that the GATFBN produces
better structures for BNs and that the model obtained through it could achieve AUCs
comparable to XGBoost while offering superior data interpretability.
Abstract
Neste estudo, desenvolvemos um novo Algoritmo Gen´ etico para treinar Redes Bayesianas (GATFBN). Usando conjuntos de dados sint´eticos como ASIA e Alarm, validamos os GATFBN comparando-o com outros algoritmos de treinamento de BN, como TABU e Hill Climbing (HC). A compara¸ c˜ ao das estruturas de rede obtidas pelo GATFBN indicou que, em m´edia, o GATFBN alcan¸cou melhores resultados. Subsequentemente, treinamos dois modelos de BN usando TABU e GATFBN com dados m´edicos reais e um modelo XGBoost para compara¸c˜ao de base. O modelo de BN obtido com o GATFBN alcan¸cou uma AUC mais alta nos dados de teste em compara¸c˜ao com o modelo treinado com TABU, mas foi inferior ao modelo XGBoost. No entanto, o modelo de BN treinado com o GATFBN demonstrou melhor sensibilidade do que o modelo XGBoost. Al´em disso, realizamos uma an´alise de sensibilidade das vari´aveis presentes na BN-GA. Conclu´ımos que o GATFBN produz melhores estruturas para BNs e que o modelo obtido por meio dele pode alcan¸car AUCs compar´aveis ao XGBoost, oferecendo, ao mesmo tempo, uma melhor interpretabilidade dos dados.
Assunto
Engenharia elétrica, Algoritmos genéticos, Teoria bayesiana de decisão estatística, Processamento de dados, Coronárias - Doenças
Palavras-chave
Genetic algorithm, Bayesian network structure learning
Citação
Departamento
Endereço externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Aberto
