Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/44588
Type: Tese
Title: Iracema: from note onset detection challenges towards an audio content analysis library for the empirical study of music performance
Other Titles: Iracema: da detecção de onsets de notas ao desenvolvimento de uma biblioteca de análise de conteúdo de áudio para o estudo empírico da performance musical
Authors: Tairone Nunes Magalhães
First Advisor: Mauricio Alves Loureiro
First Referee: Jose Augusto Mannis
Second Referee: Hugo Bastos de Paula
Third Referee: Flávio Luiz Schiavoni
metadata.dc.contributor.referee4: Sérgio Freire Garcia
metadata.dc.contributor.referee5: Thiago de Almeida Magalhães Campolina
Davi Alves Mota
Abstract: The earliest empirical studies on music performance date back to the end of the nineteenth century, when the first mechanical devices capable of recording the actions of pianists on the instrument (key presses) were invented. Since then, many technologies that open up new possibilities for collecting data from musical performances have been invented or developed, including techniques for extracting information directly from audio recordings. These techniques, which have been driven by the fast-paced technological development in computer-related fields over the last decades, are the subject matter of this thesis. We introduce a new software library called Iracema, which contains techniques for extracting patterns of manipulation of timing, energy, and spectral content from monophonic audio recordings. In this endeavor, the clarinet is the instrument chosen for the baseline experiments and models, but most of the presented techniques should also work for other monophonic instruments. One of the most critical steps in studying musical performances is the detection of the note onsets because our perception of timing is strongly tied to this variable. We pay special attention to this topic, proposing an interactive web interface for the precise manual annotation of note onsets and conducting an experiment to assess the typical measurement error involved in this kind of task for clarinet recordings. We also propose an annotated dataset of solo clarinet recordings containing approximately 23 minutes of audio and a total of 3551 note onsets. Using this dataset, we train a convolutional neural network to generate a model for automatic note onset detection specifically on clarinet recordings and compare its results to other onset detection models. Finally, we discuss a study case using recordings of a clarinet excerpt by a few different clarinetists to demonstrate the use of the proposed library.
Abstract: Os primeiros estudos empíricos em performance musical datam do final do século XIX, quando foram criados os primeiros dispositivos mecânicos capazes de gravar as ações de pianistas no instrumento (o pressionar das teclas). Desde então, várias tecnologias que abrem novas possibilidades de coleta de dados de performances musicais foram inventadas ou aprimoradas, incluindo técnicas de extração de informação a partir do sinal de áudio. Tais técnicas, que se aprimoraram em ritmo acentuado ao longo das últimas décadas, impulsionadas pelo rápido desenvolvimento das mais diversas áreas correlatas à computação, são o foco do presente trabalho. Propomos aqui uma nova biblioteca de software chamada Iracema, que contém técnicas para a extração de padrões temporais, de energia, e conteúdo espectral, a partir de gravações de áudio monofônicas. Escolhemos a clarineta como o instrumento a ser utilizado nos experimentos de referência e modelos propostos, mas a maior parte das técnicas aqui apresentadas pode ser aplicada a outros instrumentos monofônicos. Um dos passos mais importantes no estudo de performances musicais é a detecção dos instantes de \textit{onset} (início) das notas musicais, já que a nossa percepção rítmica (temporal) está fortemente associada a tais instantes. A este assunto dedicamos atenção especial, e propomos uma interface \textit{web} para a anotação manual precisa dos instantes de onset, além de realizar um experimento para avaliar o erro típico de anotação neste tipo de tarefa, para gravações de clarineta. Também propomos uma base de dados anotada contendo aproximadamente 23 minutos de áudio tocados na clarineta, contendo um total de 3551 onsets. Utilizando esta base de dados, treinamos uma rede neuronal convolucional para obter um modelo para detecção automática de onsets especificamente em gravações de clarineta, e comparamos os seus resultados com os de outros modelos. Por fim, exemplificamos e demonstramos o uso da biblioteca proposta por meio de um estudo de caso, envolvendo a análise de gravações de um excerto de uma peça, tocada por vários clarinetistas.
Subject: Performance musical
Música e tecnologia
Música para clarinete
Processamento de som por computador
Editor de audio digital
Aprendizado do computador
language: eng
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.program: Programa de Pós-Graduação em Música
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI: http://hdl.handle.net/1843/44588
Issue Date: 28-Apr-2021
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
Tairone Nunes Magalhaes - Tese Final.pdf4.48 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons