Stochastic neural dynamic programming

Francisco Galuppo Azevedo

Stochastic neural dynamic programming

dc.creator	Francisco Galuppo Azevedo
dc.date.accessioned	2025-07-14T13:57:22Z
dc.date.accessioned	2025-09-09T00:32:47Z
dc.date.available	2025-07-14T13:57:22Z
dc.date.issued	2023-09-12
dc.description.abstract	Problemas de Otimização Estocástica de Múltiplos Estágios (MSSO) são comuns em cenários de tomada de decisão que envolvem incertezas sequenciais, abrangendo várias áreas, como logística de transporte, configuração de infraestrutura e agricultura. Este trabalho apresenta duas contribuições importantes: um novo algoritmo para resolver problemas MSSO, sejam eles convexos ou não, e um conjunto de metodologias para analisar o comportamento desse algoritmo e de outros em relação à tomada de decisões. O algoritmo proposto, Programação Dinâmica Neural Estocástica, aproveita as capacidades preditivas das redes neurais para lidar com problemas MSSO. Superando desafios relacionados à modelagem das funções de custo futuras como redes neurais e ao treinamento de seus pesos, o algoritmo emprega um modelo de programação inteira e uma nova função de perda. A avaliação experimental em diferentes problemas demonstra a capacidade do algoritmo de treinar efetivamente os pesos da rede. No entanto, a complexidade computacional surge como uma limitação, especialmente em problemas com muitas variáveis de decisão e estágios, devido à necessidade de resolver um grande número de subproblemas de Programação Linear Mista (MILP) ou Programação Quadrática Mista (MIQP). Uma vantagem significativa do uso de redes neurais reside na capacidade de otimizar além de valores médios, considerando observações, informações latentes e tendências temporais, libertando-se das restrições de independência probabilística entre os estágios. Além de resolver os problemas propostos, o texto aborda a importância de compreender a lógica por trás das decisões e os riscos associados a aplicações de longo prazo no mundo real. Ele apresenta um conjunto de metodologias que utilizam o SHAP (SHapley Additive exPlanations) e a curvatura das superfícies. Essas técnicas fornecem informações sobre o impacto dos reservatórios e outras variáveis nos custos futuros e suas interações. Além disso, o uso de métricas de curvatura permite a quantificação do comportamento local na função de custo futura, facilitando a análise ao migrar a política aprendida para cenários do mundo real.
dc.identifier.uri	https://hdl.handle.net/1843/83539
dc.language	eng
dc.publisher	Universidade Federal de Minas Gerais
dc.rights	Acesso Aberto
dc.rights.uri	http://creativecommons.org/licenses/by/3.0/pt/
dc.subject	Computação – Teses
dc.subject	Aprendizado profundo – Teses
dc.subject	Otimização matemática -Teses
dc.subject	Programação dinâmica – Teses
dc.subject.other	Deep learning
dc.subject.other	Optimization
dc.subject.other	Hydrothermal dispatch
dc.subject.other	Power flow
dc.title	Stochastic neural dynamic programming
dc.title.alternative	Programação dinâmica neural estocástica
dc.type	Dissertação de mestrado
local.contributor.advisor1	Adriano Alonso Veloso
local.contributor.advisor1Lattes	http://lattes.cnpq.br/9973021912226739
local.contributor.referee1	Wagner Meira Júnior
local.contributor.referee1	Ram Rajagopal
local.creator.Lattes	http://lattes.cnpq.br/1311347560265754
local.description.resumo	Multi-Stage Stochastic Optimization (MSSO) problems are prevalent in decision-making scenarios involving sequential uncertainty, spanning various domains such as transport logistics, infrastructure configuration, and agriculture. This work presents two key con- tributions: a novel algorithm for solving MSSO problems, whether convex or not, and a set of methodologies to analyze the behavior of this algorithm and others concerning decision-making. The proposed algorithm, Stochastic Neural Dynamic Programming, leverages the predictive capabilities of neural networks to address MSSO problems. Overcoming chal- lenges related to modeling future cost functions as neural networks and training their weights, the algorithm employs an integer programming model and a novel loss func- tion. Experimental evaluation on different problems demonstrates the algorithm’s ability to train network weights effectively. However, computational complexity emerges as a limitation, particularly in problems with numerous decision variables and stages, due to the need to solve a substantial number of MILP (Mixed-Integer Linear Programming) or MIQP (Mixed-Integer Quadratic Programming) subproblems. A notable strength of using neural networks lies in their capacity to optimize be- yond average values by considering observations, latent information, and temporal trends, breaking free from the constraints of probabilistic independence between stages. In addition to solving the proposed problems, the text addresses the importance of understanding the rationale behind decisions and associated risks for long-term real- world applications. It introduces a set of methodologies utilizing SHAP (SHapley Additive exPlanations) and curvature of surfaces. Furthermore, the use of curvature metrics enables the quantification of local behavior in the future cost function, facilitating analysis when migrating the learned policy to real-world scenarios.
local.publisher.country	Brasil
local.publisher.department	ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initials	UFMG
local.publisher.program	Programa de Pós-Graduação em Ciência da Computação

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1

Nome:: Dissertacao.pdf
Tamanho:: 10.36 MB
Formato:: Adobe Portable Document Format

Baixar

Licença do pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 2.07 KB
Formato:: Plain Text
Descrição:

Baixar

Coleções

Pós-Graduação em Ciência da Computação - Dissertações