Predição da energia de ligação do pósitron com moléculas: uma análise exploratória utilizando algoritmos de machine learning
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Prediction of positron binding energy with molecules: an exploratory analysis using machine learning algorithms
Primeiro orientador
Membros da banca
Maurício Veloso Brant Pinheiro
Omar Paranaiba Vilela Neto
Juan Carlos González Pérez
Omar Paranaiba Vilela Neto
Juan Carlos González Pérez
Resumo
Oobjetivo desta dissertação é empregar técnicas de aprendizado de máquina para investigar
a importância de propriedades moleculares específicas na determinação da energia de
ligação do pósitron com moléculas. Foram utilizados dados experimentais de energias de
ligação de pósitrons (PBEs) e propriedades moleculares como polarizabilidade, momento
de dipolo e número de ligações π. Cinco algoritmos de aprendizado de máquina foram
explorados: máquinas de vetores de suporte para regressão (SVR), regressão polinomial
com regularização ridge, XGBoost, perceptron de multicamadas (RNA) e um modelo
ensemble.
Os dados foram divididos em três grupos: moléculas apolares, polares e uma mistura
dos dois tipos. Diferentes conjuntos de propriedades moleculares foram testados para
cada grupo. A avaliação e ajuste dos algoritmos foram realizados utilizando validação
cruzada aninhada e otimização bayesiana, respectivamente, com a métrica de referência
sendo o erro percentual absoluto médio. Além disso foi utilizado a abordagem SHAP para
interpretabilidade dos modelos utilizados.
Os resultados sugerem que a polarizabilidade anisotrópica é um descritor importante
para moléculas polares, bem como as ligações π para as moléculas apolares, refletindo
a influência da estrutura e distribuição espacial da nuvem eletrônica no cálculo energia
de ligação do pósitron. Para as moléculas polares, observou-se também a melhoria do
desempenho dos algoritmos quando utiliza-se o potencial de ionização como atributo.
Este estudo demonstra que técnicas de aprendizado de máquina podem fornecer pistas
valiosas sobre os mecanismos físicos envolvidos na ligação do pósitron com moléculas,
complementando abordagens teóricas e experimentais.
No entanto, limitações como a escassez de dados experimentais precisam ser superadas em
pesquisas futuras. Trabalhos futuros devem focar na aquisição de mais dados, exploração de
outros modelos específicos para poucas amostras e técnicas avançadas de interpretabilidade
de modelos.
Abstract
The goal of this dissertation is to employ machine learning techniques to investigate
the importance of specific molecular properties in determining the binding energy of the
positron with molecules. Experimental data on positron binding energies (PBEs) and
molecular properties such as polarizability, dipole moment, and the number of π bonds
were used. Five machine learning algorithms were explored: support vector machines for
regression (SVR), polynomial regression with ridge regularization, XGBoost, multilayer
perceptron, and an ensemble model.
The data were divided into three groups: nonpolar molecules, polar molecules, and a
mix of both types. Different sets of molecular properties were tested for each group. The
evaluation and tuning of the algorithms were performed using nested cross-validation and
Bayesian optimization, respectively, with the benchmark metric being the mean absolute
percentage error. Additionally, the SHAP approach was used for interpretability of the
models used.
The results suggest that anisotropic polarizability is an important descriptor for polar
molecules, as well as π bonds for nonpolar molecules, reflecting the influence of structure
and spatial distribution of the electron cloud in calculating positron binding energy. For
polar molecules, it was also observed that the performance of algorithms improves when
ionization potential is used as an attribute. This study demonstrates that machine learning
techniques can provide valuable insights about the physical mechanisms involved in positron
binding with molecules, complementing theoretical and experimental approaches.
However, limitations such as the scarcity of experimental data need to be overcome in
future research. Future work should focus on acquiring more data, exploring other models
specific to few samples, and advanced model interpretability techniques.
Assunto
Pósitrons, Energia de ligação, Aprendizado do computador
Palavras-chave
Pósitron, Energia de ligação, Aprendizado de máquina, Propriedades moleculares, Polarizabilidade anisotrópica, Ligações pi
Citação
Departamento
Endereço externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Aberto
