Investigação da programação genética para explicabilidade em modelos de aprendizado de máquina
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Primeiro orientador
Membros da banca
Michel Bessani
Aurora Trinidad Ramirez Pozo
Carlos Alberto Severiano Junior
Gisele Lobo Pappa
Aurora Trinidad Ramirez Pozo
Carlos Alberto Severiano Junior
Gisele Lobo Pappa
Resumo
Os avanços em Machine Learning (ML) estão transformando a forma como os pesquisadores conduzem a ciência em domínios sensíveis como saúde, educação, justiça e investigação criminal. Em resposta a essa transformação, a Inteligência Artificial Explicável (XAI) emergiu como um tópico de pesquisa crucial. Este artigo apresenta um método inovador denominado GPX (Genetic Programming Explainer), baseado em Programação Genética para regressão simbólica, com o objetivo de fornecer explicações claras e locais para decisões geradas por sistemas de IA.
A GPX gera um conjunto de amostras na vizinhança da previsão a ser explicada e cria um modelo de explicação local. A estrutura de árvore gerada pela GPX fornece uma expressão simbólica, analiticamente compreensível e possivelmente não linear, que reflete o comportamento local do modelo complexo. A utilização de derivadas parciais dos resultados da Programação Genética permite à GPX comunicar efetivamente a importância das características, produzindo explicações fáceis de entender. Além disso, o método é capaz de formular explicações contrafactuais, oferecendo uma visão mais profunda sobre o comportamento dos modelos.
Através de experimentos abrangentes em diversos conjuntos de dados, a GPX demonstrou excelência em quatro aspectos cruciais da XAI: fornecimento de argumentos compreensíveis, manutenção da fidelidade em tarefas de classificação e regressão, garantia de estabilidade das explicações e promoção de novas explicações. Comparada a técnicas existentes, como o LIME, a GPX rivaliza ou supera essas abordagens, conforme demonstrado pelas métricas de fidelidade.
Um aspecto inovador deste trabalho é a introdução da similaridade cosseno como uma estratégia XAI, que aumenta a confiança nas explicações fornecidas. Apesar da natureza estocástica da Programação Genética, as explicações geradas pela GPX mantêm-se estáveis, conforme validado pela métrica de estabilidade.
Em resumo, a GPX se mostra promissora na entrega de argumentos informativos, assegurando a fidelidade e a estabilidade das explicações, além de potencializar a geração de novas explicações. Este trabalho representa um avanço nos métodos de XAI e encoraja a exploração da regressão simbólica via Programação Genética para aprimorar a explicabilidade.
Abstract
Advances in Machine Learning (ML) are transforming how researchers conduct science in sensitive domains such as healthcare, education, justice, and criminal investigation. In response to this transformation, Explainable Artificial Intelligence (XAI) has emerged as a crucial research topic. This paper presents an innovative method called GPX (Genetic Programming Explainer), based on Genetic Programming for symbolic regression, aiming to provide clear and local explanations for decisions made by AI systems. GPX generates a set of samples in the neighborhood of the prediction to be explained and creates a local explanation model. The tree structure generated by GPX provides a symbolically, analytically comprehensible, and possibly non-linear expression that reflects the local behavior of the complex model. The use of partial derivatives from Genetic Programming results allows GPX to effectively communicate feature importance, producing user-friendly explanations. Additionally, the method can formulate counterfactual explanations, offering deeper insights into model behavior. Through comprehensive experiments on diverse datasets, GPX demonstrated excellence in four crucial aspects of XAI: providing understandable arguments, maintaining fidelity in classification and regression tasks, ensuring explanation stability, and promoting novel explanations. Compared to existing techniques such as LIME, GPX rivals or surpasses these approaches, as demonstrated by fidelity metrics. An innovative aspect of this work is the introduction of cosine similarity as an XAI strategy, which increases trust in the provided explanations. Despite the stochastic nature of Genetic Programming, the explanations generated by GPX remain stable, as validated by the stability metric. In summary, GPX shows promise in delivering informative arguments, ensuring fidelity and stability of explanations, and fostering the generation of novel explanations. This work represents an advance in XAI methods and encourages the exploration of symbolic regression via Genetic Programming to enhance explainability.
Assunto
Engenharia elétrica, Aprendizado do computador, Inteligência artificial, Programação genética (Computação)
Palavras-chave
Interpretabilidade, Aprendizado de Máquina, Programação Genética, Explicabilidade