Optimizing machine learning models: a droplet search approach to efficient kernel scheduling

Michael Canesche

Optimizing machine learning models: a droplet search approach to efficient kernel scheduling

Arquivos

michael_tese_final.pdf (11.45 MB)

Data

2024-11-15

Autor(es)

Michael Canesche

Editor

Universidade Federal de Minas Gerais

Tipo

Tese de doutorado

Título alternativo

Otimizando modelos de aprendizado de máquina: uma abordagem de busca de gota para agendamento de kernel eficiente

Primeiro orientador

Fernando Magno Quintão Pereira

Membros da banca

Marcio Costa Santos
Corinne Ancourt
Sanjay Rajopadhye
Ponnuswamy Sadayappan

Resumo

Kernel scheduling, a critical stage of computational optimization, involves the intricate task of determining the most efficient implementation for a computational kernel. This optimization journey encompasses experimenting with compiler parameters, such as tiling window sizes and unrolling factors, to discern the optimal configuration. The approach introduced in this work conceptualizes these parameters as points within a carefully defined coordinate space. While the function mapping these points to kernel running times typically results in a non-convex surface, empirical evidence supports a novel hypothesis termed the "droplet expectation." This hypothesis posits that the origin of this surface, representing an unoptimized kernel, and its global optimum, signifying the fastest kernel, collectively reside within the confines of a convex region. Leveraging this insight, the work proposes the Droplet Search methodology, grounded in the coordinate descent algorithm. Assuming the validity of the droplet expectation, Droplet Search demonstrates an ability to swiftly converge upon the optimal kernel configuration. Implemented in Apache TVM since April 2023, Droplet Search undergoes rigorous evaluation through extensive experimentation involving six large deep learning models deployed across a spectrum of computing devices, including ARM, Intel, AMD, and NVIDIA. Results gleaned from these experiments depict Droplet Search as not only matching the effectiveness of other AutoTVM search techniques but outperforming them with unparalleled efficiency, showcasing a speed improvement ranging between two to ten times. Beyond its accelerated optimization capabilities, models generated by Droplet Search exhibit a competitive edge when juxtaposed against those produced by TVM's AutoScheduler (Ansor). This is a noteworthy revelation considering that Ansor employs four to five times more code transformations than AutoTVM. The empirical findings presented herein underscore the promising trajectory of Droplet Search as a potent tool in the domain of kernel scheduling, redefining benchmarks by offering accelerated optimization processes and competitive outcomes, all accomplished with a discernibly reduced computational overhead.

Abstract

O escalonamento do kernel, um estágio crítico da otimização computacional, envolve a tarefa de determinar a implementação mais eficiente para um kernel computacional. Essa jornada de otimização envolve experimentar parâmetros do compilador, como tamanhos de janelas lado a lado e fatores de desenrolamento, para discernir a configuração ideal. A abordagem introduzida neste trabalho conceitua esses parâmetros como pontos dentro de um espaço de coordenadas cuidadosamente definido. Embora a função que mapeia esses pontos para os tempos de execução do kernel normalmente resulte em uma superfície não convexa, a evidência empírica apoia uma nova hipótese denominada "droplet expectation". Esta hipótese postula que a origem desta superfície, representando um kernel não otimizado, e seu ótimo global, significando o kernel mais rápido, residem coletivamente dentro dos limites de uma região convexa. Aproveitando esse insight, o trabalho propõe a metodologia Droplet Search, baseada no algoritmo de descida por coordenadas. Assumindo a validade da expectativa do droplet, o Droplet Search demonstra a capacidade de convergir rapidamente para a configuração ideal do kernel. Implementado no Apache TVM desde abril de 2023, o Droplet Search passa por uma avaliação rigorosa por meio de extensa experimentação envolvendo seis grandes modelos de aprendizagem profunda implantados em uma variedade de dispositivos de computação, incluindo ARM, Intel, AMD e NVIDIA. Os resultados obtidos desses experimentos mostram que o Droplet Search não apenas corresponde à eficácia de outras técnicas de pesquisa do AutoTVM, mas também as supera em eficiência, apresentando uma melhoria de velocidade que varia entre duas a dez vezes. Além de seus recursos de otimização acelerada, os modelos gerados pelo Droplet Search exibem uma vantagem competitiva quando justapostos aos produzidos pelo AutoScheduler (Ansor) do TVM. Esta é uma revelação digna de nota, considerando que o Ansor emprega quatro a cinco vezes mais transformações de código do que o AutoTVM. As descobertas empíricas aqui apresentadas ressaltam a trajetória promissora do Droplet Search como uma ferramenta potente no domínio do agendamento do kernel, redefinindo benchmarks ao oferecer processos de otimização acelerados e resultados competitivos, tudo realizado com uma sobrecarga computacional visivelmente reduzida.

Assunto

Computação – Teses, Compiladores (Programas de computador) – Teses, Otimização combinatoria – Teses, Recuperação da informação – Teses

Palavras-chave

Tensor compiler, Optimization, Kernel scheduling, Search

URI

https://hdl.handle.net/1843/78816

Departamento

ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO

Curso

Programa de Pós-Graduação em Ciência da Computação

Coleções

Pós-Graduação em Ciência da Computação - Teses

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Aberto

Página do item completo

Optimizing machine learning models: a droplet search approach to efficient kernel scheduling

Arquivos

Data

Autor(es)

Título da Revista

ISSN da Revista

Título de Volume

Editor

Descrição

Tipo

Título alternativo

Primeiro orientador

Membros da banca

Resumo

Abstract

Assunto

Palavras-chave

Citação

URI

Departamento

Curso

Endereço externo

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons