Please use this identifier to cite or link to this item:
http://hdl.handle.net/1843/82136
Type: | Dissertação |
Title: | Predição da energia de ligação do pósitron com moléculas: uma análise exploratória utilizando algoritmos de machine learning |
Other Titles: | Prediction of positron binding energy with molecules: an exploratory analysis using machine learning algorithms |
Authors: | Miguel Felipe de Abreu Rocha e Senra |
First Advisor: | José Rachid Mohallem |
First Co-advisor: | Paulo Henrique Ribeiro Amaral |
First Referee: | Maurício Veloso Brant Pinheiro |
Second Referee: | Omar Paranaiba Vilela Neto |
Third Referee: | Juan Carlos González Pérez |
Abstract: | Oobjetivo desta dissertação é empregar técnicas de aprendizado de máquina para investigar a importância de propriedades moleculares específicas na determinação da energia de ligação do pósitron com moléculas. Foram utilizados dados experimentais de energias de ligação de pósitrons (PBEs) e propriedades moleculares como polarizabilidade, momento de dipolo e número de ligações π. Cinco algoritmos de aprendizado de máquina foram explorados: máquinas de vetores de suporte para regressão (SVR), regressão polinomial com regularização ridge, XGBoost, perceptron de multicamadas (RNA) e um modelo ensemble. Os dados foram divididos em três grupos: moléculas apolares, polares e uma mistura dos dois tipos. Diferentes conjuntos de propriedades moleculares foram testados para cada grupo. A avaliação e ajuste dos algoritmos foram realizados utilizando validação cruzada aninhada e otimização bayesiana, respectivamente, com a métrica de referência sendo o erro percentual absoluto médio. Além disso foi utilizado a abordagem SHAP para interpretabilidade dos modelos utilizados. Os resultados sugerem que a polarizabilidade anisotrópica é um descritor importante para moléculas polares, bem como as ligações π para as moléculas apolares, refletindo a influência da estrutura e distribuição espacial da nuvem eletrônica no cálculo energia de ligação do pósitron. Para as moléculas polares, observou-se também a melhoria do desempenho dos algoritmos quando utiliza-se o potencial de ionização como atributo. Este estudo demonstra que técnicas de aprendizado de máquina podem fornecer pistas valiosas sobre os mecanismos físicos envolvidos na ligação do pósitron com moléculas, complementando abordagens teóricas e experimentais. No entanto, limitações como a escassez de dados experimentais precisam ser superadas em pesquisas futuras. Trabalhos futuros devem focar na aquisição de mais dados, exploração de outros modelos específicos para poucas amostras e técnicas avançadas de interpretabilidade de modelos. |
Abstract: | The goal of this dissertation is to employ machine learning techniques to investigate the importance of specific molecular properties in determining the binding energy of the positron with molecules. Experimental data on positron binding energies (PBEs) and molecular properties such as polarizability, dipole moment, and the number of π bonds were used. Five machine learning algorithms were explored: support vector machines for regression (SVR), polynomial regression with ridge regularization, XGBoost, multilayer perceptron, and an ensemble model. The data were divided into three groups: nonpolar molecules, polar molecules, and a mix of both types. Different sets of molecular properties were tested for each group. The evaluation and tuning of the algorithms were performed using nested cross-validation and Bayesian optimization, respectively, with the benchmark metric being the mean absolute percentage error. Additionally, the SHAP approach was used for interpretability of the models used. The results suggest that anisotropic polarizability is an important descriptor for polar molecules, as well as π bonds for nonpolar molecules, reflecting the influence of structure and spatial distribution of the electron cloud in calculating positron binding energy. For polar molecules, it was also observed that the performance of algorithms improves when ionization potential is used as an attribute. This study demonstrates that machine learning techniques can provide valuable insights about the physical mechanisms involved in positron binding with molecules, complementing theoretical and experimental approaches. However, limitations such as the scarcity of experimental data need to be overcome in future research. Future work should focus on acquiring more data, exploring other models specific to few samples, and advanced model interpretability techniques. |
Subject: | Pósitrons Energia de ligação Aprendizado do computador |
language: | por |
metadata.dc.publisher.country: | Brasil |
Publisher: | Universidade Federal de Minas Gerais |
Publisher Initials: | UFMG |
metadata.dc.publisher.department: | ICX - DEPARTAMENTO DE FÍSICA |
metadata.dc.publisher.program: | Programa de Pós-Graduação em Física |
Rights: | Acesso Aberto |
metadata.dc.rights.uri: | http://creativecommons.org/licenses/by-nc-nd/3.0/pt/ |
URI: | http://hdl.handle.net/1843/82136 |
Issue Date: | 19-Aug-2024 |
Appears in Collections: | Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Predição da energia de ligação de pósitron com moléculas - uma análise exploratória utilizando algoritmos de machine learning.pdf | Predição da energia de ligação de pósitron com moléculas: uma análise exploratória utilizando algoritmos de machine learning | 31.69 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License