Understanding model performance
| dc.creator | Daniel de Moura e Almeida | |
| dc.date.accessioned | 2026-02-24T17:34:22Z | |
| dc.date.issued | 2025-03-13 | |
| dc.description.abstract | Este trabalho introduz um novo pipeline de avaliação de modelos de aprendizado de máquina supervisionado, construído para identificar e descrever regiões em um conjunto de dados nas quais os modelos exibem um erro excepcional em suas previsões. Por meio da integração de técnicas de descoberta de subgrupos e visualização de dados, o pipeline fornece um entendimento mais granular sobre a performance preditiva do modelo, de tectando padrões de erros não triviais, que métricas globais mais tradicionais podem não elucidar. A abordagem é agnóstica ao tipo de modelo e interpretável, oferecendo insights valiosos sobre os subgrupos dos dados que contribuem desproporcionalmente para as taxas de erro globais. Resultados experimentais demonstram a efetividade do método em contribuir com a avaliação de modelos, ao aplicá-lo a conjuntos de dados bem conhecidos. Este trabalho contribui para o campo de explicabilidade em IA ao fornecer uma ferramenta prática e open-source para análise de performance e identificação de melhorias em modelos preditivos. | |
| dc.identifier.uri | https://hdl.handle.net/1843/1751 | |
| dc.language | eng | |
| dc.publisher | Universidade Federal de Minas Gerais | |
| dc.rights | Acesso aberto | |
| dc.rights | Attribution 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | Computação – Teses | |
| dc.subject | Aprendizado do computador – Teses | |
| dc.subject | Ciência de dados – Teses | |
| dc.subject | Controle preditivo – Teses | |
| dc.subject | Inteligência artificial – Teses | |
| dc.subject.other | Machine learning | |
| dc.subject.other | Data science | |
| dc.subject.other | Subgroup discovery | |
| dc.subject.other | Explainable AI | |
| dc.title | Understanding model performance | |
| dc.title.alternative | Compreendendo o desempenho do modelo | |
| dc.type | Dissertação de mestrado | |
| local.contributor.advisor1 | Renato Vimieiro | |
| local.contributor.advisor1Lattes | http://lattes.cnpq.br/5736183954752317 | |
| local.contributor.referee1 | Ricardo Bastos Cavalcante Prudencio | |
| local.contributor.referee1 | Wagner Meira Júnior | |
| local.creator.Lattes | http://lattes.cnpq.br/4765336782081981 | |
| local.description.resumo | This work introduces a novel evaluation pipeline for supervised machine learning models, designed to identify and describe regions within a dataset where models exhibit exceptional predictive errors. By integrating Subgroup Discovery and Data Visualization techniques, the pipeline provides a more granular understanding of model performance, uncovering non-trivial error patterns that conventional global metrics may obscure. The approach is model-agnostic and interpretable, offering valuable insights into data sub groups that disproportionately contribute to overall error rates. Experimental results demonstrate the pipeline’s effectiveness in enhancing model evaluation, by applying it to well-known datasets. This work contributes to Explainable AI (xAI) by providing an open source, practical tool for targeted model improvements and performance analysis. | |
| local.publisher.country | Brasil | |
| local.publisher.department | ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO | |
| local.publisher.initials | UFMG | |
| local.publisher.program | Programa de Pós-Graduação em Ciência da Computação | |
| local.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO |