Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/82136
Type: Dissertação
Title: Predição da energia de ligação do pósitron com moléculas: uma análise exploratória utilizando algoritmos de machine learning
Other Titles: Prediction of positron binding energy with molecules: an exploratory analysis using machine learning algorithms
Authors: Miguel Felipe de Abreu Rocha e Senra
First Advisor: José Rachid Mohallem
First Co-advisor: Paulo Henrique Ribeiro Amaral
First Referee: Maurício Veloso Brant Pinheiro
Second Referee: Omar Paranaiba Vilela Neto
Third Referee: Juan Carlos González Pérez
Abstract: Oobjetivo desta dissertação é empregar técnicas de aprendizado de máquina para investigar a importância de propriedades moleculares específicas na determinação da energia de ligação do pósitron com moléculas. Foram utilizados dados experimentais de energias de ligação de pósitrons (PBEs) e propriedades moleculares como polarizabilidade, momento de dipolo e número de ligações π. Cinco algoritmos de aprendizado de máquina foram explorados: máquinas de vetores de suporte para regressão (SVR), regressão polinomial com regularização ridge, XGBoost, perceptron de multicamadas (RNA) e um modelo ensemble. Os dados foram divididos em três grupos: moléculas apolares, polares e uma mistura dos dois tipos. Diferentes conjuntos de propriedades moleculares foram testados para cada grupo. A avaliação e ajuste dos algoritmos foram realizados utilizando validação cruzada aninhada e otimização bayesiana, respectivamente, com a métrica de referência sendo o erro percentual absoluto médio. Além disso foi utilizado a abordagem SHAP para interpretabilidade dos modelos utilizados. Os resultados sugerem que a polarizabilidade anisotrópica é um descritor importante para moléculas polares, bem como as ligações π para as moléculas apolares, refletindo a influência da estrutura e distribuição espacial da nuvem eletrônica no cálculo energia de ligação do pósitron. Para as moléculas polares, observou-se também a melhoria do desempenho dos algoritmos quando utiliza-se o potencial de ionização como atributo. Este estudo demonstra que técnicas de aprendizado de máquina podem fornecer pistas valiosas sobre os mecanismos físicos envolvidos na ligação do pósitron com moléculas, complementando abordagens teóricas e experimentais. No entanto, limitações como a escassez de dados experimentais precisam ser superadas em pesquisas futuras. Trabalhos futuros devem focar na aquisição de mais dados, exploração de outros modelos específicos para poucas amostras e técnicas avançadas de interpretabilidade de modelos.
Abstract: The goal of this dissertation is to employ machine learning techniques to investigate the importance of specific molecular properties in determining the binding energy of the positron with molecules. Experimental data on positron binding energies (PBEs) and molecular properties such as polarizability, dipole moment, and the number of π bonds were used. Five machine learning algorithms were explored: support vector machines for regression (SVR), polynomial regression with ridge regularization, XGBoost, multilayer perceptron, and an ensemble model. The data were divided into three groups: nonpolar molecules, polar molecules, and a mix of both types. Different sets of molecular properties were tested for each group. The evaluation and tuning of the algorithms were performed using nested cross-validation and Bayesian optimization, respectively, with the benchmark metric being the mean absolute percentage error. Additionally, the SHAP approach was used for interpretability of the models used. The results suggest that anisotropic polarizability is an important descriptor for polar molecules, as well as π bonds for nonpolar molecules, reflecting the influence of structure and spatial distribution of the electron cloud in calculating positron binding energy. For polar molecules, it was also observed that the performance of algorithms improves when ionization potential is used as an attribute. This study demonstrates that machine learning techniques can provide valuable insights about the physical mechanisms involved in positron binding with molecules, complementing theoretical and experimental approaches. However, limitations such as the scarcity of experimental data need to be overcome in future research. Future work should focus on acquiring more data, exploring other models specific to few samples, and advanced model interpretability techniques.
Subject: Pósitrons
Energia de ligação
Aprendizado do computador
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICX - DEPARTAMENTO DE FÍSICA
metadata.dc.publisher.program: Programa de Pós-Graduação em Física
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI: http://hdl.handle.net/1843/82136
Issue Date: 19-Aug-2024
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
Predição da energia de ligação de pósitron com moléculas - uma análise exploratória utilizando algoritmos de machine learning.pdfPredição da energia de ligação de pósitron com moléculas: uma análise exploratória utilizando algoritmos de machine learning31.69 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons