Understanding model performance

Daniel de Moura e Almeida

Understanding model performance

Arquivos

Primário DissertacaoMestradoAjustadaPDFA.pdf (1.52 MB)

Data

2025-03-13

Autor(es)

Daniel de Moura e Almeida

Editor

Universidade Federal de Minas Gerais

Tipo

Dissertação de mestrado

Título alternativo

Compreendendo o desempenho do modelo

Primeiro orientador

Renato Vimieiro

Membros da banca

Ricardo Bastos Cavalcante Prudencio
Wagner Meira Júnior

Resumo

This work introduces a novel evaluation pipeline for supervised machine learning models, designed to identify and describe regions within a dataset where models exhibit exceptional predictive errors. By integrating Subgroup Discovery and Data Visualization techniques, the pipeline provides a more granular understanding of model performance, uncovering non-trivial error patterns that conventional global metrics may obscure. The approach is model-agnostic and interpretable, offering valuable insights into data sub groups that disproportionately contribute to overall error rates. Experimental results demonstrate the pipeline’s effectiveness in enhancing model evaluation, by applying it to well-known datasets. This work contributes to Explainable AI (xAI) by providing an open source, practical tool for targeted model improvements and performance analysis.

Abstract

Este trabalho introduz um novo pipeline de avaliação de modelos de aprendizado de máquina supervisionado, construído para identificar e descrever regiões em um conjunto de dados nas quais os modelos exibem um erro excepcional em suas previsões. Por meio da integração de técnicas de descoberta de subgrupos e visualização de dados, o pipeline fornece um entendimento mais granular sobre a performance preditiva do modelo, de tectando padrões de erros não triviais, que métricas globais mais tradicionais podem não elucidar. A abordagem é agnóstica ao tipo de modelo e interpretável, oferecendo insights valiosos sobre os subgrupos dos dados que contribuem desproporcionalmente para as taxas de erro globais. Resultados experimentais demonstram a efetividade do método em contribuir com a avaliação de modelos, ao aplicá-lo a conjuntos de dados bem conhecidos. Este trabalho contribui para o campo de explicabilidade em IA ao fornecer uma ferramenta prática e open-source para análise de performance e identificação de melhorias em modelos preditivos.

Assunto

Computação – Teses, Aprendizado do computador – Teses, Ciência de dados – Teses, Controle preditivo – Teses, Inteligência artificial – Teses

Palavras-chave

Machine learning, Data science, Subgroup discovery, Explainable AI

URI

https://hdl.handle.net/1843/1751

Departamento

ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO

Curso

Programa de Pós-Graduação em Ciência da Computação

Coleções

Pós-Graduação em Ciência da Computação - Dissertações

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso aberto

Página do item completo

Understanding model performance

Arquivos

Data

Autor(es)

Título da Revista

ISSN da Revista

Título de Volume

Editor

Descrição

Tipo

Título alternativo

Primeiro orientador

Membros da banca

Resumo

Abstract

Assunto

Palavras-chave

Citação

URI

Departamento

Curso

Endereço externo

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons