Divergência em GPU: análises e alocação de registradores

Diogo Nunes Sampaio

Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/ESBF-97GJKT

Tipo:	Dissertação de Mestrado
Título:	Divergência em GPU: análises e alocação de registradores
Autor(es):	Diogo Nunes Sampaio
Primeiro Orientador:	Fernando Magno Quintao Pereira
Primeiro membro da banca :	Luiz Filipe Menezes Vieira
Segundo membro da banca:	Renato Antonio Celso Ferreira
Terceiro membro da banca:	Rodolfo Jardim de Azevedo
Resumo:	Uma nova tendência no mercado de computadores é usar unidades de processamento gráfico (GPUs) 1 para acelerar tarefas paralelas por dados. Esse crescente interesse renovou a atenção dada ao modelo de execução Single Instruction Multiple Data (SIMD). Máquinas SIMD fornecem uma tremenda capacidade computacional aos desenvolvedores, mas programá-las de forma eficiente ainda é um desafio, particularmente devido a perdas de performance causadas por divergências de memória e de fluxo. Esses fenômenos são consequências de dados divergentes. Dados divergentes são variáveis com mesmo nome mas valores diferentes entre as unidades de processamento. A fim de lidar com os fenômenos de divergências, esta dissertação introduz uma nova ferramenta de análise de código, a qual chamamos Análise de Divergência com Restrições Afins. Desenvolvedores de programas e compiladores podem servir-se das informações de divergência com dois propósitos diferentes. Primeiro, podem melhorar a qualidade de programas gerados para máquinas que possuem instruções vetoriais, mesmo que essas sejam incapazes de lidar com divergências de fluxo. Segundo, podem otimizar programascriados para placas gráficas. Para exemplificar esse último, apresentamos uma otimização para alocadores de registradores que, usando das informações geradas pelas análises de divergências, melhora a utilização da hierarquia de memória das placas gráficas.Testados sobre conhecidos benchmarks, os alocadores de registradores otimizados produzem código que é, em média, 29.70% mais rápido do que o código gerado por alocadores de registradores convencionais.
Abstract:	The use of graphics processing units (GPUs) for accelerating Data Parallel workloads is the new trend on the computing market. This growing interest brought renewed attention to the Single Instruction Multiple Data (SIMD) execution model. SIMD machines give application developers tremendous computational power; however, programmingthem is stil challenging. In particular, developers must deal with memory and control flow divergences. These phenomena stem from a condition that we call data divergence, which occurs whenever processing elements (PEs) that run in lockstep see the same variable name holding different values. To deal with divergences this work introduces a new code analysis, called Divergence Analysis with Affine Constraints. Application developers and compilers can benefit from the information generated by this analysis with two different objectives. First, to improve code generate to machines that have vector instructions but cannot handle control divergence. Second, to optimize GPU code. To illustrate the last one, we present register allocators that relly on divergenceinformation to better use GPU memory hierarchy. These optimized allocators produced GPU code that is 29.70% faster than the code produced by a conventional allocator when tested on a suite of well-known benchmarks.
Assunto:	Linguagem de programação (Computadores) Computação Compiladores (Programas de computador)
Idioma:	Português
Editor:	Universidade Federal de Minas Gerais
Sigla da Instituição:	UFMG
Tipo de Acesso:	Acesso Aberto
URI:	http://hdl.handle.net/1843/ESBF-97GJKT
Data do documento:	8-Mar-2013
Aparece nas coleções:	Dissertações de Mestrado

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
diogo_msc.pdf		31.34 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas