Monte Carlo Evaluation of Classification Algorithms Based on Fisher's Linear Function in Classification of Patients With CHD
Carregando...
Data
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Artigo de periódico
Título alternativo
Avaliação Monte Carlo de Algoritmos de Classificação Baseados na Função Linear de Fisher na Classificação de Pacientes com CC
Primeiro orientador
Membros da banca
Resumo
Classification comprises a variety of problems, which are solved in several ways. The need for automatic classification methods arises in a number of areas, from voice recognition, to modern automobiles, to the recognition of tumors through x-rays to assist doctors, by classifying emails as legitimate or spam. Due to the importance and complexity of such problems, there is a need for methods that provide greater accuracy and interpretability of the results. Among them the Boosting methods, which have emerged in the field of computation, work by sequentially applying a classification algorithm to reweighted versions of the training data set, giving greater weight to erroneous observations. The aim of this study was to study the Fisher Linear Discriminant Analysis (LDA) model and the same one using Boosting algorithm (AdaBoost) in the presence / absence of coronary heart disease (CHD) problem in patients. The criteria used to make the comparisons were sensitivity, specificity, false positive rate and false negative rate. In addition, Monte Carlo simulation was performed to calculate these rates in different partitions of the training set. The Boosting method was successfully applied in LDA and provided a higher sensitivity than the conventional LDA.
Abstract
A classificação compreende uma variedade de problemas, que são resolvidos de várias maneiras. A necessidade de métodos automáticos de classificação surge em diversas áreas, desde o reconhecimento de voz, até automóveis modernos, até o reconhecimento de tumores através de radiografias para auxiliar médicos, classificando e-mails como legítimos ou spam. Devido à importância e complexidade de tais problemas, há a necessidade de métodos que proporcionem maior precisão e interpretabilidade dos resultados. Dentre eles, os métodos Boosting, que surgiram no campo da computação, funcionam aplicando sequencialmente um algoritmo de classificação a versões reponderadas do conjunto de dados de treinamento, dando maior peso às observações errôneas. O objetivo deste estudo foi estudar o modelo de Análise Discriminante Linear de Fisher (LDA) e o mesmo utilizando o algoritmo Boosting (AdaBoost) na presença/ausência de problema de doença coronariana (DAC) em pacientes. Os critérios utilizados para fazer as comparações foram sensibilidade, especificidade, taxa de falsos positivos e taxa de falsos negativos. Além disso, a simulação de Monte Carlo foi realizada para calcular essas taxas em diferentes partições do conjunto de treinamento. O método Boosting foi aplicado com sucesso na LDA e proporcionou uma sensibilidade maior que a LDA convencional.
Assunto
Coronary Heart Disease, AdaBoost, Machine Learning, Sensibility
Palavras-chave
Citação
Departamento
Curso
Endereço externo
http://www.iosrjournals.org/iosr-jm/pages/v13(1)Version-4.html