Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/83019
Type: Tese
Title: Parallel-GPU DGTD method with a third-order local time stepping scheme
Authors: Marlon Jesus Lizarazo Urbina
First Advisor: Elson José da Silva
First Referee: Ursula do Carmo Resende
Second Referee: Marco Aurélio de Oliveira Schoeder
Third Referee: Renato Cardoso Mesquita
metadata.dc.contributor.referee4: Ricardo Luiz da Silva Adriano
Abstract: O uso crescente de métodos numéricos para resolver problemas eletromagnéticos de grande e multiescala tem impulsionado o desenvolvimento de estratégias para aumentar a eficiência do método de Galerkin Discontinuo no Domínio do Tempo (DGTD), sem comprometer a precisão. Este trabalho apresenta a combinação de duas dessas estratégias, visando melhorar o desempenho do DGTD e reduzir o tempo de execução. A primeira estratégia utiliza Unidades de Processamento Gráfico (GPUs) para acelerar os cálculos, aproveitando sua baixa latência e alto paralelismo. A segunda emprega uma técnica de avanço no tempo local (LTS), que permite que elementos da malha avancem de forma independente, evitando as limitações de um passo de tempo global (GTS). O estudo começa com a descrição das discretizações espacial e temporal do DGTD. Em seguida, é apresentada uma introdução às GPUs, com destaque para suas principais características e uma proposta de distribuição eficiente de dados para os cálculos. Depois, é introduzida uma abordagem LTS baseada no método de Runge-Kutta de terceira ordem (RK3), mantendo a precisão com polinômios do mesmo grau. Após o desenvolvimento das estratégias, elas são combinadas em uma técnica numérica mais eficiente. Para validar a proposta, são resolvidos problemas eletromagnéticos em duas e três dimensões. Testes iniciais em meios homogêneos, como uma cavidade metálica preenchida com ar, demonstram a precisão e o desempenho das estratégias que utilizam memória compartilhada e global da GPU, alcançando acelerações de até 24× em comparação com implementações em CPU. Validações adicionais mostram que o algoritmo LTS-RK3 preserva a precisão numérica ao mesmo tempo em que reduz o tempo de simulação em até 52% em um problema de espalhamento eletromagnético, quando comparado com a abordagem padrão GTS. Por fim, a estratégia combinada é aplicada a problemas complexos e multiescala, como o espalhamento por uma esfera multicamadas e a radiação de uma antena monopolo, alcançando reduções de tempo de aproximadamente 78% e 55%, respectivamente. Esses resultados confirmam que o método proposto melhora significativamente o desempenho computacional sem comprometer a precisão, superando a implementação padrão com GTS.
Abstract: The increasing use of numerical methods to solve large-scale and multiscale electromagnetic problems has driven the development of various strategies to enhance the efficiency of the Discontinuous Galerkin Time-Domain (DGTD) method without compromising accuracy. This work presents the combination of two such strategies aimed at improving the performance of the DGTD method and reducing execution time. The first strategy leverages Graphics Processing Units (GPUs) to accelerate computations by exploiting their low latency and high parallelism. The second employs a local time-stepping (LTS) technique, which allows different mesh elements to advance in time independently, thus avoiding the limitations imposed by a global time step (GTS). The study begins with a description of the spatial and temporal discretizations of the DGTD method. This is followed by an introduction to GPUs, highlighting their main characteristics and presenting an efficient data distribution scheme for executing DGTD computations. An LTS approach based on the third-order Runge-Kutta (RK3) method is then introduced, using a third-order polynomial to maintain accuracy. After developing both strategies, they are combined to form a more powerful and efficient numerical technique. To validate this approach, two-dimensional and three-dimensional electromagnetic problems are solved. Initial tests in homogeneous media, such as a metallic air-filled cavity, demonstrate the accuracy and performance of both shared and global GPU memory strategies, achieving speedups of up to 24× compared to CPU implementations. Further validation shows that the LTS-RK3 algorithm preserves numerical accuracy while reducing simulation time by up to 52% in an electromagnetic scattering problem when compared to the standard GTS approach. Finally, the combined strategy is applied to complex and multiscale problems, such as scattering by a multilayer sphere and radiation from a monopole antenna, achieving time reductions of nearly 78% and 55%, respectively. These results confirm that the proposed method significantly enhances computational performance while maintaining accuracy, outperforming the standard GTS implementation.
Subject: Engenharia elétrica
Galerkin, Métodos de
Eletromagnetismo - Simulação por computador
Computação paralela
language: eng
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ENG - DEPARTAMENTO DE ENGENHARIA ELÉTRICA
metadata.dc.publisher.program: Programa de Pós-Graduação em Engenharia Elétrica
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/83019
Issue Date: 30-Apr-2025
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
PARALLEL-GPU DGTD METHOD WITH A THIRD-ORDER LOCAL TIME STEPPING SCHEME.pdf29.95 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.