Monte Carlo Evaluation of Classification Algorithms Based on Fisher's Linear Function in Classification of Patients With CHD

Descrição

Tipo

Artigo de periódico

Título alternativo

Avaliação Monte Carlo de Algoritmos de Classificação Baseados na Função Linear de Fisher na Classificação de Pacientes com CC

Primeiro orientador

Membros da banca

Resumo

Classification comprises a variety of problems, which are solved in several ways. The need for automatic classification methods arises in a number of areas, from voice recognition, to modern automobiles, to the recognition of tumors through x-rays to assist doctors, by classifying emails as legitimate or spam. Due to the importance and complexity of such problems, there is a need for methods that provide greater accuracy and interpretability of the results. Among them the Boosting methods, which have emerged in the field of computation, work by sequentially applying a classification algorithm to reweighted versions of the training data set, giving greater weight to erroneous observations. The aim of this study was to study the Fisher Linear Discriminant Analysis (LDA) model and the same one using Boosting algorithm (AdaBoost) in the presence / absence of coronary heart disease (CHD) problem in patients. The criteria used to make the comparisons were sensitivity, specificity, false positive rate and false negative rate. In addition, Monte Carlo simulation was performed to calculate these rates in different partitions of the training set. The Boosting method was successfully applied in LDA and provided a higher sensitivity than the conventional LDA.

Abstract

A classificação compreende uma variedade de problemas, que são resolvidos de várias maneiras. A necessidade de métodos automáticos de classificação surge em diversas áreas, desde o reconhecimento de voz, até automóveis modernos, até o reconhecimento de tumores através de radiografias para auxiliar médicos, classificando e-mails como legítimos ou spam. Devido à importância e complexidade de tais problemas, há a necessidade de métodos que proporcionem maior precisão e interpretabilidade dos resultados. Dentre eles, os métodos Boosting, que surgiram no campo da computação, funcionam aplicando sequencialmente um algoritmo de classificação a versões reponderadas do conjunto de dados de treinamento, dando maior peso às observações errôneas. O objetivo deste estudo foi estudar o modelo de Análise Discriminante Linear de Fisher (LDA) e o mesmo utilizando o algoritmo Boosting (AdaBoost) na presença/ausência de problema de doença coronariana (DAC) em pacientes. Os critérios utilizados para fazer as comparações foram sensibilidade, especificidade, taxa de falsos positivos e taxa de falsos negativos. Além disso, a simulação de Monte Carlo foi realizada para calcular essas taxas em diferentes partições do conjunto de treinamento. O método Boosting foi aplicado com sucesso na LDA e proporcionou uma sensibilidade maior que a LDA convencional.

Assunto

Coronary Heart Disease, AdaBoost, Machine Learning, Sensibility

Palavras-chave

Citação

Curso

Endereço externo

http://www.iosrjournals.org/iosr-jm/pages/v13(1)Version-4.html

Avaliação

Revisão

Suplementado Por

Referenciado Por