Optimizing machine learning models: a droplet search approach to efficient kernel scheduling
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Otimizando modelos de aprendizado de máquina: uma abordagem de busca de gota para agendamento de kernel eficiente
Primeiro orientador
Membros da banca
Marcio Costa Santos
Corinne Ancourt
Sanjay Rajopadhye
Ponnuswamy Sadayappan
Corinne Ancourt
Sanjay Rajopadhye
Ponnuswamy Sadayappan
Resumo
Kernel scheduling, a critical stage of computational optimization, involves the intricate task of determining the most efficient implementation for a computational kernel. This optimization journey encompasses experimenting with compiler parameters, such as tiling window sizes and unrolling factors, to discern the optimal configuration. The approach introduced in this work conceptualizes these parameters as points within a carefully defined coordinate space. While the function mapping these points to kernel running times typically results in a non-convex surface, empirical evidence supports a novel hypothesis termed the "droplet expectation." This hypothesis posits that the origin of this surface, representing an unoptimized kernel, and its global optimum, signifying the fastest kernel, collectively reside within the confines of a convex region. Leveraging this insight, the work proposes the Droplet Search methodology, grounded in the coordinate descent algorithm. Assuming the validity of the droplet expectation, Droplet Search demonstrates an ability to swiftly converge upon the optimal kernel configuration. Implemented in Apache TVM since April 2023, Droplet Search undergoes rigorous evaluation through extensive experimentation involving six large deep learning models deployed across a spectrum of computing devices, including ARM, Intel, AMD, and NVIDIA. Results gleaned from these experiments depict Droplet Search as not only matching the effectiveness of other AutoTVM search techniques but outperforming them with unparalleled efficiency, showcasing a speed improvement ranging between two to ten times. Beyond its accelerated optimization capabilities, models generated by Droplet Search exhibit a competitive edge when juxtaposed against those produced by TVM's AutoScheduler (Ansor). This is a noteworthy revelation considering that Ansor employs four to five times more code transformations than AutoTVM. The empirical findings presented herein underscore the promising trajectory of Droplet Search as a potent tool in the domain of kernel scheduling, redefining benchmarks by offering accelerated optimization processes and competitive outcomes, all accomplished with a discernibly reduced computational overhead.
Abstract
O escalonamento do kernel, um estágio crítico da otimização computacional, envolve a tarefa de determinar a implementação mais eficiente para um kernel computacional. Essa jornada de otimização envolve experimentar parâmetros do compilador, como tamanhos de janelas lado a lado e fatores de desenrolamento, para discernir a configuração ideal. A abordagem introduzida neste trabalho conceitua esses parâmetros como pontos dentro de um espaço de coordenadas cuidadosamente definido. Embora a função que mapeia esses pontos para os tempos de execução do kernel normalmente resulte em uma superfície não convexa, a evidência empírica apoia uma nova hipótese denominada "droplet expectation". Esta hipótese postula que a origem desta superfície, representando um kernel não otimizado, e seu ótimo global, significando o kernel mais rápido, residem coletivamente dentro dos limites de uma região convexa. Aproveitando esse insight, o trabalho propõe a metodologia Droplet Search, baseada no algoritmo de descida por coordenadas. Assumindo a validade da expectativa do droplet, o Droplet Search demonstra a capacidade de convergir rapidamente para a configuração ideal do kernel. Implementado no Apache TVM desde abril de 2023, o Droplet Search passa por uma avaliação rigorosa por meio de extensa experimentação envolvendo seis grandes modelos de aprendizagem profunda implantados em uma variedade de dispositivos de computação, incluindo ARM, Intel, AMD e NVIDIA. Os resultados obtidos desses experimentos mostram que o Droplet Search não apenas corresponde à eficácia de outras técnicas de pesquisa do AutoTVM, mas também as supera em eficiência, apresentando uma melhoria de velocidade que varia entre duas a dez vezes. Além de seus recursos de otimização acelerada, os modelos gerados pelo Droplet Search exibem uma vantagem competitiva quando justapostos aos produzidos pelo AutoScheduler (Ansor) do TVM. Esta é uma revelação digna de nota, considerando que o Ansor emprega quatro a cinco vezes mais transformações de código do que o AutoTVM. As descobertas empíricas aqui apresentadas ressaltam a trajetória promissora do Droplet Search como uma ferramenta potente no domínio do agendamento do kernel, redefinindo benchmarks ao oferecer processos de otimização acelerados e resultados competitivos, tudo realizado com uma sobrecarga computacional visivelmente reduzida.
Assunto
Computação – Teses, Compiladores (Programas de computador) – Teses, Otimização combinatoria – Teses, Recuperação da informação – Teses
Palavras-chave
Tensor compiler, Optimization, Kernel scheduling, Search
Citação
Departamento
Endereço externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Aberto
