Ensemble pruning via an integer programming approach with diversity constraints

dc.creatorMarcelo Antônio Mendes Bastos
dc.date.accessioned2022-10-05T23:53:50Z
dc.date.accessioned2025-09-09T01:20:12Z
dc.date.available2022-10-05T23:53:50Z
dc.date.issued2021-03-29
dc.description.abstractAprendizagem por ensemble utiliza múltiplos classificadores na expectativa de obter um melhor desempenho preditivo. Estudos empíricos vem mostrando que a poda de ensembles, isto é, a escolha de um subconjunto apropriado dos classificadores disponíveis, pode levar a previsões comparáveis ou melhores do que usar todos os classificadores. Nesta dissertação, consideramos um problema de classificação binária e propomos uma abordagem de programação inteira (PI) para selecionar subconjuntos de classificadores ótimos. Propomos uma função objetivo flexível para se adaptar aos critérios desejados de diferentes conjuntos de dados. Também propomos restrições para garantir níveis mínimos de diversidade no conjunto. Apesar do caso geral de PI ser NP-Difícil, os solvers de última geração são capazes de obter rapidamente boas soluções para conjuntos de dados com até 60.000 pontos de dados. Nossa abordagem produz resultados competitivos quando comparados a outros algoritmos de poda na literatura.
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico
dc.identifier.urihttps://hdl.handle.net/1843/46005
dc.languageeng
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Restrito
dc.subjectComputação – Teses
dc.subjectAprendizagem por Ensemble – Teses
dc.subjectAprendizado do computador – Teses
dc.subjectProgramação Inteira – Teses
dc.subject.otherInteger Programming
dc.subject.otherEnsemble Pruning
dc.subject.otherEnsemble Selection
dc.subject.otherClassification
dc.titleEnsemble pruning via an integer programming approach with diversity constraints
dc.title.alternativePoda de Ensemble via uma abordagem de programação inteira com restrições de diversidade
dc.typeDissertação de mestrado
local.contributor.advisor-co1Humberto César Brandão de Oliveira
local.contributor.advisor1Cristiano Arbex Valle
local.contributor.advisor1Latteshttp://lattes.cnpq.br/0174881389877841
local.contributor.referee1Gisele Lobo Pappa
local.contributor.referee1Túlio Ângelo Machado Toffolo
local.creator.Latteshttp://lattes.cnpq.br/5590452083187247
local.description.embargo2023-03-29
local.description.resumoEnsemble learning uses multiple classifiers in the hope of obtaining better predictive performance. Empirical studies have shown that ensemble pruning, that is, choosing an appropriate subset of the available classifiers, can lead to comparable or better predictions than using all classifiers. In this thesis, we consider a binary classification problem and propose an integer programming (IP) approach for selecting optimal classifier subsets. We propose a flexible objective function to adapt to desired criteria of different datasets. We also propose constraints to ensure minimum diversity levels in the ensemble. Despite the general case of IP being NP-Hard, state-of-the-art solvers are able to quickly obtain good solutions for datasets with up to 60000 data points. Our approach yields competitive results when compared to others pruning algorithms in literature.
local.publisher.countryBrasil
local.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Ciência da Computação

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertacao_de_mestrado_final.pdf
Tamanho:
1.02 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: