Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/44588
Tipo: Tese
Título: Iracema: from note onset detection challenges towards an audio content analysis library for the empirical study of music performance
Título(s) alternativo(s): Iracema: da detecção de onsets de notas ao desenvolvimento de uma biblioteca de análise de conteúdo de áudio para o estudo empírico da performance musical
Autor(es): Tairone Nunes Magalhães
Primeiro Orientador: Mauricio Alves Loureiro
Primeiro membro da banca : Jose Augusto Mannis
Segundo membro da banca: Hugo Bastos de Paula
Terceiro membro da banca: Flávio Luiz Schiavoni
Quarto membro da banca: Sérgio Freire Garcia
Quinto membro da banca: Thiago de Almeida Magalhães Campolina
Davi Alves Mota
Resumo: The earliest empirical studies on music performance date back to the end of the nineteenth century, when the first mechanical devices capable of recording the actions of pianists on the instrument (key presses) were invented. Since then, many technologies that open up new possibilities for collecting data from musical performances have been invented or developed, including techniques for extracting information directly from audio recordings. These techniques, which have been driven by the fast-paced technological development in computer-related fields over the last decades, are the subject matter of this thesis. We introduce a new software library called Iracema, which contains techniques for extracting patterns of manipulation of timing, energy, and spectral content from monophonic audio recordings. In this endeavor, the clarinet is the instrument chosen for the baseline experiments and models, but most of the presented techniques should also work for other monophonic instruments. One of the most critical steps in studying musical performances is the detection of the note onsets because our perception of timing is strongly tied to this variable. We pay special attention to this topic, proposing an interactive web interface for the precise manual annotation of note onsets and conducting an experiment to assess the typical measurement error involved in this kind of task for clarinet recordings. We also propose an annotated dataset of solo clarinet recordings containing approximately 23 minutes of audio and a total of 3551 note onsets. Using this dataset, we train a convolutional neural network to generate a model for automatic note onset detection specifically on clarinet recordings and compare its results to other onset detection models. Finally, we discuss a study case using recordings of a clarinet excerpt by a few different clarinetists to demonstrate the use of the proposed library.
Abstract: Os primeiros estudos empíricos em performance musical datam do final do século XIX, quando foram criados os primeiros dispositivos mecânicos capazes de gravar as ações de pianistas no instrumento (o pressionar das teclas). Desde então, várias tecnologias que abrem novas possibilidades de coleta de dados de performances musicais foram inventadas ou aprimoradas, incluindo técnicas de extração de informação a partir do sinal de áudio. Tais técnicas, que se aprimoraram em ritmo acentuado ao longo das últimas décadas, impulsionadas pelo rápido desenvolvimento das mais diversas áreas correlatas à computação, são o foco do presente trabalho. Propomos aqui uma nova biblioteca de software chamada Iracema, que contém técnicas para a extração de padrões temporais, de energia, e conteúdo espectral, a partir de gravações de áudio monofônicas. Escolhemos a clarineta como o instrumento a ser utilizado nos experimentos de referência e modelos propostos, mas a maior parte das técnicas aqui apresentadas pode ser aplicada a outros instrumentos monofônicos. Um dos passos mais importantes no estudo de performances musicais é a detecção dos instantes de \textit{onset} (início) das notas musicais, já que a nossa percepção rítmica (temporal) está fortemente associada a tais instantes. A este assunto dedicamos atenção especial, e propomos uma interface \textit{web} para a anotação manual precisa dos instantes de onset, além de realizar um experimento para avaliar o erro típico de anotação neste tipo de tarefa, para gravações de clarineta. Também propomos uma base de dados anotada contendo aproximadamente 23 minutos de áudio tocados na clarineta, contendo um total de 3551 onsets. Utilizando esta base de dados, treinamos uma rede neuronal convolucional para obter um modelo para detecção automática de onsets especificamente em gravações de clarineta, e comparamos os seus resultados com os de outros modelos. Por fim, exemplificamos e demonstramos o uso da biblioteca proposta por meio de um estudo de caso, envolvendo a análise de gravações de um excerto de uma peça, tocada por vários clarinetistas.
Assunto: Performance musical
Música e tecnologia
Música para clarinete
Processamento de som por computador
Editor de audio digital
Aprendizado do computador
Idioma: eng
País: Brasil
Editor: Universidade Federal de Minas Gerais
Sigla da Instituição: UFMG
Curso: Programa de Pós-Graduação em Música
Tipo de Acesso: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI: http://hdl.handle.net/1843/44588
Data do documento: 28-Abr-2021
Aparece nas coleções:Teses de Doutorado

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Tairone Nunes Magalhaes - Tese Final.pdf4.48 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons