Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA

Bruno Carvalho Correa

Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/RAOA-BEKMG6

Type:	Dissertação de Mestrado
Title:	Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA
Authors:	Bruno Carvalho Correa
First Advisor:	Renato Cardoso Mesquita
First Referee:	Elson Jose da Silva
Second Referee:	Ricardo Luiz da Silva Adriano
Third Referee:	Rodney Rezende Saldanha
Abstract:	Neste trabalho desenvolvem-se estratégias de paralelismo para o método computacional sem malha Petrov-Galerkin local (MLPG) a ser executado em uma arquitetura altamente paralela conhecida como unidade de processamento gráfico (GPU). Métodos sem malha vem ganhando cada vez mais destaque dentre os métodos computacionais para se resolver problemas regidos por equações diferenciais parciais. Ao contrário do consagrado método dos elementos finitos (FEM), este não precisa de uma malha para obtenção da matriz global do sistema. O domínio do problema é representado por uma distribuição de nós mais uma descrição da fronteira, que na verdade nada mais é do que nós também distribuídos ao longo das bordas do problema, além das condições de contorno. Com a intenção de se obter melhor desempenho do algoritmo, neste trabalho aplica-se o mesmo em uma arquitetura altamente paralela. Diversas aplicações vem sendo desenvolvidas para tal arquitetura, em especial pode-se destacar o modelo de programação CUDA, do inglês computer unified architecture. Esta arquitetura tem mostrado uma imensa versatilidade de forma que é possível delegar computações numéricas utilizando a GPU como um coprocessador auxiliando a unidade central de processamento (CPU). Ométodo sem malha MLPG é paralelizado de forma a ganhar tempo e precisão já que é possível aumentar o n´umero de nós no domínio até um limite bem maior que se fosse executado na CPU. Para testar o algoritmo paralelizado, ele é aplicado a um problema eletromagnéticoclássico que possui solução analítica, e o tempo de execução na GPU é comparado com o tempo obtido pelo mesmo algoritmo executado na CPU. Os resultados obtidos com a GPU GeForce GTX 680 da NVIDIA mostram que é possível se obter um tempo de execução até 20vezes menor com o algoritmo paralelo, mantendo-se a mesma precisão da solução.
Abstract:	In this work, a new strategy to paralelize the Meshless Local Petrov-Galerkin method(MLPG) is developed. It is executed in a high parallel architecture, the well known graphics processing unit (GPU). The meshless methods are extensively applied nowadays to solve several different problems of partial diferential equations. Compared with the traditional finite element methods, the meshless methods are a quite interesting alternative because they do not require a mesh in order to solve a physical problem, only a node distribution and a proper description of the boundary of the problem (that is actually a node distribution on the boundary) as well as the boundary conditions are needed. In this work the algorithm is adapted to run on the GPU. Several applications are being developed to execute in this new architecture to take advantage of its high parallel nature. Among several models of programming, one can distinguish CUDA or Computer Unified Architecture of NVIDIA. CUDA is a scalable parallel architecture developed by NVIDIA and can be programmed in C or via graphics API, so that the GPU can be used as a coprocessor auxilliating the central processing unit (CPU) as well as serving as a cheap supercomputer for numerical applications with surprisingly readiness. The MLPG is parallelized to execute completly on the GPU side. The MLPG was chosen because of its simplicity and because it does not require any complex geometric representation of the domain or any sychronization scheme to obtain the global system of equations. In order to test this approach, it is applied to an electromagnetic problem whose analytical solution exist. The execution time of both GPU and CPU versions are compared. The results obtained with NIVIDA GeForce GTX 680 in this work shows that it is possible to have an execution time 20 times smaller than the counterpart algorithm on the CPU, ensuring the same precision of results.
Subject:	Engenharia elétrica
language:	Português
Publisher:	Universidade Federal de Minas Gerais
Publisher Initials:	UFMG
Rights:	Acesso Aberto
URI:	http://hdl.handle.net/1843/RAOA-BEKMG6
Issue Date:	24-Feb-2014
Appears in Collections:	Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format
dissertac_a_obruno.pdf		2.94 MB	Adobe PDF	View/Open

Show full item record