Estudos em estimação de densidade por Kernel: métodos de seleção de características e estimação do parâmetro suavizador

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Tese de doutorado

Título alternativo

Primeiro orientador

Membros da banca

Carlos Humberto Llanos Quintero
Eduardo Mazoni Andrade Marcal Mendes
Felipe Maia Galvão França
Marcelo Azevedo Costa

Resumo

Problemas de indução de funções são muitas vezes representados por meio de medidas de afinidade entre os elementos do conjunto indutivo de amostras, sendo as matrizes de kernel um método bastante difundido. O presente trabalho tem como objetivo obter informação das relações de afinidade entre os dados a partir da matriz de kernel calculada, partindo da hipótese que tais relações geométricas seriam coerentes com os rótulos conhecidos. Foram propostos métodos univariados e multivariados de seleção de características utilizando estimação de densidade por kernel (KDE), bem como métodos para estimar a largura do kernel baseados na coerência dos rótulos com a geometria do problema. Para avaliar a relação da estrutura dos dados com os rótulos foi utilizado um classificador baseado em estimação de densidade por kernel (KDE) e comparou-se o desempenho dos métodos propostos com outros conhecidos na literatura. Para as bases de dados testadas, o desempenho dos métodos propostos mostrou-se semelhante aos utilizados como base de comparação. Tais resultados indicam que é viável selecionar modelos através do cálculo direto das densidades e da geometria do problema de separação em questão.

Abstract

Function induction problems are frequently represented by affinity measures between the elements of the inductive sample set, being kernel matrices a well known one. This work have as objective obtain information of the relations between data from the calculated kernel matrix, starting from the hypothesis that those geometric relations are coherent with known labels. Univariate and multivariate feature selection methods that use kernel density estimation (KDE) were proposed. Methods for perform estimation of kernel width, based at the geometric coherence between label and problem geometry, were also proposed. To assess the relation of data structure with the labels, a classifier based on kernel density estimation (KDE) was used and the performance of the proposed methods was compared with others known from literature. To the databases tested, the performance of the proposed methods were similar to the ones in the literature. Results indicates that is practicable selecting models through the direct calculation of densities and the geometry from the class separation.

Assunto

Engenharia elétrica, Kernel, Funções de

Palavras-chave

Estimação não-paramétrica de densidades, Seleção de características, Estimação da largura do Kernel

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por