Comparative analysis of variable selection techniques

dc.creatorGustavo Macedo Miranda
dc.date.accessioned2024-12-17T16:51:54Z
dc.date.accessioned2025-09-09T00:02:49Z
dc.date.available2024-12-17T16:51:54Z
dc.date.issued2024-06-25
dc.description.abstractEste estudo avalia alguns métodos de seleção de variáveis através de simulações em 19 cenários distintos, variando em tamanho da amostra \(n\), número de variáveis \(p\), níveis de significância, forças dos coeficientes beta e tipos de variáveis (discretas e contínuas). Métodos tradicionais como Backward e Stepwise demonstraram desempenho robusto em diferentes valores de \(n\), enquanto abordagens mais recentes como SSGL mostraram maior eficácia em cenários com maior \(p\) ou coeficientes beta mais fortes. Todos os métodos apresentaram alta performance na maioria dos cenários devido à sua capacidade de identificar variáveis relevantes, ou seja, através da métrica de sensibilidade. Além disso, a análise de eficiência computacional revelou que o LASSO exigiu tempo de processamento pequeno em todos os cenários em comparação com os métodos Backward e Stepwise. Já o SSGL, apresentou tempos de processamento variáveis influenciados pela força beta, \(n\) e \(p\). Tanto os métodos Backward quanto Stepwise exibiram comportamento computacional semelhante, com Stepwise consistentemente requerendo mais tempo à medida que \(p\) aumentava. A aplicação a dados do mundo real sublinhou a utilidade prática desses métodos, apoiando sua seleção com base nas características específicas dos dados e nos objetivos de desempenho. Esta pesquisa contribui com insights cruciais para a otimização de estratégias de seleção de variáveis em modelagem estatística e análises preditivas.
dc.identifier.urihttps://hdl.handle.net/1843/78733
dc.languageeng
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/pt/
dc.subjectEstatística
dc.subjectAnálise de regressão
dc.subjectVariedades (Matemática)
dc.subjectLASSO (Estatística)
dc.subjectAprendizado do Computador
dc.subject.otherVariable
dc.subject.otherSensitivity
dc.subject.otherLasso
dc.subject.otherSelection methods
dc.titleComparative analysis of variable selection techniques
dc.title.alternativeAnálise comparativa de métodos de seleção de variáveis
dc.typeMonografia de especialização
local.contributor.advisor1Marcos Oliveira Prates
local.contributor.advisor1Latteshttp://lattes.cnpq.br/7893235207392165
local.contributor.referee1Marcelo Azevedo Costa
local.description.resumoThis study rigorously assesses various methods for selecting variables through simulation across 19 distinct scenarios, varying in sample size \(n\), number of variables \(p\), significance levels, beta coefficient strengths, and variable types (discrete and continuous). Traditional methods like Backward and Stepwise consistently demonstrated robust performance across different \(n\) values, whereas newer approaches such as SSGL showed enhanced efficacy in scenarios with larger \(p\) or stronger beta coefficients. All methods demonstrated high performance in most scenarios due to their ability to identify relevant variables, as evidenced by the sensitivity metric. Moreover, computational efficiency analysis revealed that LASSO required minimal processing time across all scenarios, contrasting with SSGL, which showed variable computation times influenced by beta strength, \(n\), and \(p\). Both Backward and Stepwise methods exhibited similar computational behavior, with Stepwise consistently requiring more time as \(p\) increased. Application to real-world data underscored the practical utility of these methods, supporting their selection based on specific data characteristics and performance objectives. This research contributes crucial insights for optimizing variable selection strategies in statistical modeling and predictive analytics.
local.publisher.countryBrasil
local.publisher.departmentICEX - INSTITUTO DE CIÊNCIAS EXATAS
local.publisher.initialsUFMG
local.publisher.programCurso de Especialização em Estatística

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Comparative Analysis of Variable Selection Techniques.pdf
Tamanho:
1.31 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: