Understanding model performance

Daniel de Moura e Almeida

Understanding model performance

dc.creator	Daniel de Moura e Almeida
dc.date.accessioned	2026-02-24T17:34:22Z
dc.date.issued	2025-03-13
dc.description.abstract	Este trabalho introduz um novo pipeline de avaliação de modelos de aprendizado de máquina supervisionado, construído para identificar e descrever regiões em um conjunto de dados nas quais os modelos exibem um erro excepcional em suas previsões. Por meio da integração de técnicas de descoberta de subgrupos e visualização de dados, o pipeline fornece um entendimento mais granular sobre a performance preditiva do modelo, de tectando padrões de erros não triviais, que métricas globais mais tradicionais podem não elucidar. A abordagem é agnóstica ao tipo de modelo e interpretável, oferecendo insights valiosos sobre os subgrupos dos dados que contribuem desproporcionalmente para as taxas de erro globais. Resultados experimentais demonstram a efetividade do método em contribuir com a avaliação de modelos, ao aplicá-lo a conjuntos de dados bem conhecidos. Este trabalho contribui para o campo de explicabilidade em IA ao fornecer uma ferramenta prática e open-source para análise de performance e identificação de melhorias em modelos preditivos.
dc.identifier.uri	https://hdl.handle.net/1843/1751
dc.language	eng
dc.publisher	Universidade Federal de Minas Gerais
dc.rights	Acesso aberto
dc.rights	Attribution 4.0 International	en
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/
dc.subject	Computação – Teses
dc.subject	Aprendizado do computador – Teses
dc.subject	Ciência de dados – Teses
dc.subject	Controle preditivo – Teses
dc.subject	Inteligência artificial – Teses
dc.subject.other	Machine learning
dc.subject.other	Data science
dc.subject.other	Subgroup discovery
dc.subject.other	Explainable AI
dc.title	Understanding model performance
dc.title.alternative	Compreendendo o desempenho do modelo
dc.type	Dissertação de mestrado
local.contributor.advisor1	Renato Vimieiro
local.contributor.advisor1Lattes	http://lattes.cnpq.br/5736183954752317
local.contributor.referee1	Ricardo Bastos Cavalcante Prudencio
local.contributor.referee1	Wagner Meira Júnior
local.creator.Lattes	http://lattes.cnpq.br/4765336782081981
local.description.resumo	This work introduces a novel evaluation pipeline for supervised machine learning models, designed to identify and describe regions within a dataset where models exhibit exceptional predictive errors. By integrating Subgroup Discovery and Data Visualization techniques, the pipeline provides a more granular understanding of model performance, uncovering non-trivial error patterns that conventional global metrics may obscure. The approach is model-agnostic and interpretable, offering valuable insights into data sub groups that disproportionately contribute to overall error rates. Experimental results demonstrate the pipeline’s effectiveness in enhancing model evaluation, by applying it to well-known datasets. This work contributes to Explainable AI (xAI) by providing an open source, practical tool for targeted model improvements and performance analysis.
local.publisher.country	Brasil
local.publisher.department	ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initials	UFMG
local.publisher.program	Programa de Pós-Graduação em Ciência da Computação
local.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1

Nome:: DissertacaoMestradoAjustadaPDFA.pdf
Tamanho:: 1.52 MB
Formato:: Adobe Portable Document Format

Baixar

Licença do pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 2.07 KB
Formato:: Item-specific license agreed to upon submission
Descrição:

Baixar

Coleções

Pós-Graduação em Ciência da Computação - Dissertações