Optimizing machine learning models: a droplet search approach to efficient kernel scheduling

Michael Canesche

Optimizing machine learning models: a droplet search approach to efficient kernel scheduling

dc.creator	Michael Canesche
dc.date.accessioned	2024-12-27T17:06:29Z
dc.date.accessioned	2025-09-09T00:54:01Z
dc.date.available	2024-12-27T17:06:29Z
dc.date.issued	2024-11-15
dc.description.abstract	O escalonamento do kernel, um estágio crítico da otimização computacional, envolve a tarefa de determinar a implementação mais eficiente para um kernel computacional. Essa jornada de otimização envolve experimentar parâmetros do compilador, como tamanhos de janelas lado a lado e fatores de desenrolamento, para discernir a configuração ideal. A abordagem introduzida neste trabalho conceitua esses parâmetros como pontos dentro de um espaço de coordenadas cuidadosamente definido. Embora a função que mapeia esses pontos para os tempos de execução do kernel normalmente resulte em uma superfície não convexa, a evidência empírica apoia uma nova hipótese denominada "droplet expectation". Esta hipótese postula que a origem desta superfície, representando um kernel não otimizado, e seu ótimo global, significando o kernel mais rápido, residem coletivamente dentro dos limites de uma região convexa. Aproveitando esse insight, o trabalho propõe a metodologia Droplet Search, baseada no algoritmo de descida por coordenadas. Assumindo a validade da expectativa do droplet, o Droplet Search demonstra a capacidade de convergir rapidamente para a configuração ideal do kernel. Implementado no Apache TVM desde abril de 2023, o Droplet Search passa por uma avaliação rigorosa por meio de extensa experimentação envolvendo seis grandes modelos de aprendizagem profunda implantados em uma variedade de dispositivos de computação, incluindo ARM, Intel, AMD e NVIDIA. Os resultados obtidos desses experimentos mostram que o Droplet Search não apenas corresponde à eficácia de outras técnicas de pesquisa do AutoTVM, mas também as supera em eficiência, apresentando uma melhoria de velocidade que varia entre duas a dez vezes. Além de seus recursos de otimização acelerada, os modelos gerados pelo Droplet Search exibem uma vantagem competitiva quando justapostos aos produzidos pelo AutoScheduler (Ansor) do TVM. Esta é uma revelação digna de nota, considerando que o Ansor emprega quatro a cinco vezes mais transformações de código do que o AutoTVM. As descobertas empíricas aqui apresentadas ressaltam a trajetória promissora do Droplet Search como uma ferramenta potente no domínio do agendamento do kernel, redefinindo benchmarks ao oferecer processos de otimização acelerados e resultados competitivos, tudo realizado com uma sobrecarga computacional visivelmente reduzida.
dc.description.sponsorship	CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico
dc.description.sponsorship	FAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais
dc.description.sponsorship	CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.identifier.uri	https://hdl.handle.net/1843/78816
dc.language	eng
dc.publisher	Universidade Federal de Minas Gerais
dc.rights	Acesso Aberto
dc.rights.uri	http://creativecommons.org/licenses/by/3.0/pt/
dc.subject	Computação – Teses
dc.subject	Compiladores (Programas de computador) – Teses
dc.subject	Otimização combinatoria – Teses
dc.subject	Recuperação da informação – Teses
dc.subject.other	Tensor compiler
dc.subject.other	Optimization
dc.subject.other	Kernel scheduling
dc.subject.other	Search
dc.title	Optimizing machine learning models: a droplet search approach to efficient kernel scheduling
dc.title.alternative	Otimizando modelos de aprendizado de máquina: uma abordagem de busca de gota para agendamento de kernel eficiente
dc.type	Tese de doutorado
local.contributor.advisor1	Fernando Magno Quintão Pereira
local.contributor.advisor1Lattes	http://lattes.cnpq.br/4608001746330875
local.contributor.referee1	Marcio Costa Santos
local.contributor.referee1	Corinne Ancourt
local.contributor.referee1	Sanjay Rajopadhye
local.contributor.referee1	Ponnuswamy Sadayappan
local.creator.Lattes	http://lattes.cnpq.br/2682801945729306
local.description.resumo	Kernel scheduling, a critical stage of computational optimization, involves the intricate task of determining the most efficient implementation for a computational kernel. This optimization journey encompasses experimenting with compiler parameters, such as tiling window sizes and unrolling factors, to discern the optimal configuration. The approach introduced in this work conceptualizes these parameters as points within a carefully defined coordinate space. While the function mapping these points to kernel running times typically results in a non-convex surface, empirical evidence supports a novel hypothesis termed the "droplet expectation." This hypothesis posits that the origin of this surface, representing an unoptimized kernel, and its global optimum, signifying the fastest kernel, collectively reside within the confines of a convex region. Leveraging this insight, the work proposes the Droplet Search methodology, grounded in the coordinate descent algorithm. Assuming the validity of the droplet expectation, Droplet Search demonstrates an ability to swiftly converge upon the optimal kernel configuration. Implemented in Apache TVM since April 2023, Droplet Search undergoes rigorous evaluation through extensive experimentation involving six large deep learning models deployed across a spectrum of computing devices, including ARM, Intel, AMD, and NVIDIA. Results gleaned from these experiments depict Droplet Search as not only matching the effectiveness of other AutoTVM search techniques but outperforming them with unparalleled efficiency, showcasing a speed improvement ranging between two to ten times. Beyond its accelerated optimization capabilities, models generated by Droplet Search exhibit a competitive edge when juxtaposed against those produced by TVM's AutoScheduler (Ansor). This is a noteworthy revelation considering that Ansor employs four to five times more code transformations than AutoTVM. The empirical findings presented herein underscore the promising trajectory of Droplet Search as a potent tool in the domain of kernel scheduling, redefining benchmarks by offering accelerated optimization processes and competitive outcomes, all accomplished with a discernibly reduced computational overhead.
local.publisher.country	Brasil
local.publisher.department	ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initials	UFMG
local.publisher.program	Programa de Pós-Graduação em Ciência da Computação

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1

Nome:: michael_tese_final.pdf
Tamanho:: 11.45 MB
Formato:: Adobe Portable Document Format

Baixar

Licença do pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 2.07 KB
Formato:: Plain Text
Descrição:

Baixar

Coleções

Pós-Graduação em Ciência da Computação - Teses