Parallel-GPU DGTD method with a third-order local time stepping scheme

dc.creatorMarlon Jesus Lizarazo Urbina
dc.date.accessioned2025-06-18T13:03:34Z
dc.date.accessioned2025-09-09T01:16:25Z
dc.date.available2025-06-18T13:03:34Z
dc.date.issued2025-04-30
dc.description.abstractThe increasing use of numerical methods to solve large-scale and multiscale electromagnetic problems has driven the development of various strategies to enhance the efficiency of the Discontinuous Galerkin Time-Domain (DGTD) method without compromising accuracy. This work presents the combination of two such strategies aimed at improving the performance of the DGTD method and reducing execution time. The first strategy leverages Graphics Processing Units (GPUs) to accelerate computations by exploiting their low latency and high parallelism. The second employs a local time-stepping (LTS) technique, which allows different mesh elements to advance in time independently, thus avoiding the limitations imposed by a global time step (GTS). The study begins with a description of the spatial and temporal discretizations of the DGTD method. This is followed by an introduction to GPUs, highlighting their main characteristics and presenting an efficient data distribution scheme for executing DGTD computations. An LTS approach based on the third-order Runge-Kutta (RK3) method is then introduced, using a third-order polynomial to maintain accuracy. After developing both strategies, they are combined to form a more powerful and efficient numerical technique. To validate this approach, two-dimensional and three-dimensional electromagnetic problems are solved. Initial tests in homogeneous media, such as a metallic air-filled cavity, demonstrate the accuracy and performance of both shared and global GPU memory strategies, achieving speedups of up to 24× compared to CPU implementations. Further validation shows that the LTS-RK3 algorithm preserves numerical accuracy while reducing simulation time by up to 52% in an electromagnetic scattering problem when compared to the standard GTS approach. Finally, the combined strategy is applied to complex and multiscale problems, such as scattering by a multilayer sphere and radiation from a monopole antenna, achieving time reductions of nearly 78% and 55%, respectively. These results confirm that the proposed method significantly enhances computational performance while maintaining accuracy, outperforming the standard GTS implementation.
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.identifier.urihttps://hdl.handle.net/1843/83019
dc.languageeng
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectEngenharia elétrica
dc.subjectGalerkin, Métodos de
dc.subjectEletromagnetismo - Simulação por computador
dc.subjectComputação paralela
dc.subject.otherComputação paralela
dc.subject.otherDGTD
dc.subject.otherLTS
dc.subject.otherGTS
dc.subject.otherProblemas eletromagnéticos multiescala
dc.titleParallel-GPU DGTD method with a third-order local time stepping scheme
dc.typeTese de doutorado
local.contributor.advisor1Elson José da Silva
local.contributor.advisor1Latteshttp://lattes.cnpq.br/2345499859996413
local.contributor.referee1Ursula do Carmo Resende
local.contributor.referee1Marco Aurélio de Oliveira Schoeder
local.contributor.referee1Renato Cardoso Mesquita
local.contributor.referee1Ricardo Luiz da Silva Adriano
local.creator.Latteshttp://lattes.cnpq.br/5311630556821477
local.description.resumoO uso crescente de métodos numéricos para resolver problemas eletromagnéticos de grande e multiescala tem impulsionado o desenvolvimento de estratégias para aumentar a eficiência do método de Galerkin Discontinuo no Domínio do Tempo (DGTD), sem comprometer a precisão. Este trabalho apresenta a combinação de duas dessas estratégias, visando melhorar o desempenho do DGTD e reduzir o tempo de execução. A primeira estratégia utiliza Unidades de Processamento Gráfico (GPUs) para acelerar os cálculos, aproveitando sua baixa latência e alto paralelismo. A segunda emprega uma técnica de avanço no tempo local (LTS), que permite que elementos da malha avancem de forma independente, evitando as limitações de um passo de tempo global (GTS). O estudo começa com a descrição das discretizações espacial e temporal do DGTD. Em seguida, é apresentada uma introdução às GPUs, com destaque para suas principais características e uma proposta de distribuição eficiente de dados para os cálculos. Depois, é introduzida uma abordagem LTS baseada no método de Runge-Kutta de terceira ordem (RK3), mantendo a precisão com polinômios do mesmo grau. Após o desenvolvimento das estratégias, elas são combinadas em uma técnica numérica mais eficiente. Para validar a proposta, são resolvidos problemas eletromagnéticos em duas e três dimensões. Testes iniciais em meios homogêneos, como uma cavidade metálica preenchida com ar, demonstram a precisão e o desempenho das estratégias que utilizam memória compartilhada e global da GPU, alcançando acelerações de até 24× em comparação com implementações em CPU. Validações adicionais mostram que o algoritmo LTS-RK3 preserva a precisão numérica ao mesmo tempo em que reduz o tempo de simulação em até 52% em um problema de espalhamento eletromagnético, quando comparado com a abordagem padrão GTS. Por fim, a estratégia combinada é aplicada a problemas complexos e multiescala, como o espalhamento por uma esfera multicamadas e a radiação de uma antena monopolo, alcançando reduções de tempo de aproximadamente 78% e 55%, respectivamente. Esses resultados confirmam que o método proposto melhora significativamente o desempenho computacional sem comprometer a precisão, superando a implementação padrão com GTS.
local.publisher.countryBrasil
local.publisher.departmentENG - DEPARTAMENTO DE ENGENHARIA ELÉTRICA
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
PARALLEL-GPU DGTD METHOD WITH A THIRD-ORDER LOCAL TIME STEPPING SCHEME.pdf
Tamanho:
29.25 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: