Aprendizado de máquinas na identificação de fenótipos de obesidade em mulheres brasileiras
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Resumo
O Índice de Massa Corporal (IMC) tem sido apontado como ferramenta com limitações para determinação do diagnóstico de obesidade, por não diferenciar aspectos de composição corporal. Adicionalmente, discussões sobre a existência de diferentes fenótipos de obesidade têm emergido nos últimos anos. Neste trabalho, que consiste em um estudo exploratório direcionado pelos dados, objetivamos o desenvolvimento de uma estratégia baseada em aprendizado de máquinas não supervisionado para identificar fenótipos de obesidade que não seriam identificados pelo IMC. Secundariamente, objetivamos verificar a acurácia de fórmulas de estimativa de taxa metabólica de repouso (TMR) para os fenótipos observados. Dados da linha de base de estudos conduzidos pelo grupo Imunometabolismo foram utilizados. A população de estudo foi composta por 446 mulheres não atletas, majoritariamente saudáveis e com IMC entre 18,5 e 40,0 kg/m2. Algoritmos de clusterização foram aplicados para a identificação de clusters, com diferentes combinações de 22 variáveis como valores de entrada. As variáveis consideradas nos modelos foram: informações de composição corporal obtidas por bioimpedância, peso, altura e circunferência de cintura, assim como índices calculados a partir destas. Testes paramétricos e não paramétricos foram realizados para caracterização dos clusters e nove fórmulas de estimativa de TMR foram testadas para verificação de sua acurácia entre os fenótipos observados. Foi definida a formação de 4 clusters, sendo estes nomeados, a partir de características do acúmulo de gordura corporal, como: Adiposidade Normal (AN), Adiposidade Moderada (AM), Adiposidade de Risco (AR) e Adiposidade de Risco Elevado (ARE). Aumento nas concentrações de leptina e reduções nas de adiponectina ajustada por quilo de gordura corporal e na razão adiponectina/leptina também foram observados ao longo dos clusters. A acurácia máxima atingida pelas fórmulas foi de 63,5% entre os fenótipos e todas apresentaram sub e superestimações da TMR medida, com valores superestimados para até 65,8% das mulheres. Em conclusão, foram identificados 4 clusters de adiposidade, com fenótipos físicos e marcadores endócrinos distintos, independentemente do IMC. O uso de ferramentas de aprendizado de máquinas pode, portanto, ser uma ferramenta promissora para a identificação de indivíduos com maior risco metabólico associado ao acúmulo de adiposidade contribuindo, consequentemente, para o rastreamento da obesidade. Ainda, sugere-se que estes fenótipos sejam considerados para a proposição de novas fórmulas de predição da taxa metabólica de repouso, na busca pela maior acurácia destas.
Abstract
Body Mass Index (BMI) has been identified as a tool with limitations for determining
the diagnosis of obesity, as it does not differentiate aspects of body composition.
Additionally, discussions about the existence of different obesity phenotypes have
emerged in recent years. In this data-driven exploratory study, we aimed to develop a
strategy based on unsupervised machine learning to identify obesity phenotypes that
would not be identified by BMI. Secondarily, we aimed to verify the accuracy of
formulas for estimating resting metabolic rate (RMR) for the observed phenotypes.
Baseline data from 8 studies conducted by the Immunometabolism research group
were used. Study population consisted of 446 non-athlete women, free of major
diseases and with BMI between 18.5 and 40.0 kg/m2. K-means clustering and
hierarchical clustering algorithms were applied to identify clusters, with different
combinations of 22 variables as input values. The variables considered in the models
were: information on body composition obtained by bioimpedance, weight, height and
waist circumference, as well as indexes calculated from these. Parametric and
nonparametric tests were performed to characterize the clusters and nine formulas for
estimating RMR were tested to verify their accuracy among the observed phenotypes.
Four clusters were obtained by 7 variables transformed by log2 and the k-means
algorithm, and these were named, based on characteristics of body fat accumulation,
as: Normal Adiposity (NA), Moderate Adiposity (MA), Risk Adiposity (RA) and Elevated
Risk Adiposity (ARE). Increases in the concentrations of leptin and reductions in
adiponectin adjusted per kilogram of body fat and in the adiponectin/leptin ratio were
also observed throughout the clusters. The maximum accuracy achieved by the
formulas was 63.5% among the phenotypes and all presented under and
overestimations of the measured RMR, with overestimated values for up to 65.8% of
the women. In conclusion, by the K-means method, we identified 4 adiposity clusters,
with distinct physical phenotypes and endocrine markers, regardless of BMI. Thus, the
use of machine learning tools may be a promising tool for identifying individuals with a
higher metabolic risk associated with adiposity accumulation, therefore contributing to
the screening of preclinical and clinical obesity. Furthermore, it is suggested that these
phenotypes be considered for the development of new equations for predicting resting
metabolic rate, for greater accuracy.
Assunto
Fisologia, Obesidade, Aprendizado de máquina, Metabolismo Basal
Palavras-chave
Obesidade, Fenótipos da obesidade, Aprendizado de máquinas, Taxa metabólica