Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/BUBD-92MMZK
Type: Dissertação de Mestrado
Title: Estudo sobre transientes em sinais de fala e mùsica
Authors: Thiago de Almeida Magalhaes Campolina
First Advisor: Mauricio Alves Loureiro
metadata.dc.contributor.advisor2: Mauricio Alves Loureiro
First Referee: Eduardo Mazoni Andrade Marcal Mendes
Second Referee: Maurilio Nunes Vieira
Third Referee: Leandro de Campos Teixeira Gomes
Abstract: Atualmente, sistemas computacionais necessitam da modelagem de sinais de música e fala para vários propósitos: síntese, audição computacional, análise acústica, análise musical sistemática, transformação, composição, entre muitas outras. A modelagempor síntese de sinais de música e fala, com qualidade, é uma tarefa complexa, que ainda se apresenta como um desafio. Principalmente, quando se busca a representação com a menor quantidade de parâmetros possível, visando baixo custo computacional,procurando manter boa inteligibilidade e naturalidade. Sinais de fala e música apresentam estados transitórios de vibração, que contêmtransientes. Como é o caso de ataques de notas musicais e bursts em consoantes oclusivas. Por possuírem características impulsivas, transientes são como retratos instantâneos do trato vocal e instrumentos musicais, sendo importantes para a percepção detimbre e reconhecimento da fonte sonora. Muitas das técnicas de modelagem de música e fala não são eficientes para transientes. A modelagem por síntese dos transientes possibilita sua separação das partes determinísticas e estocásticas de sinais, representandomaior flexibilidade para processamentos. Este estudo é dedicado à análise, modelagem, e percepção auditiva de transientes. Na pesquisa desenvolvida, Transient Modeling Synthesis (TMS) é usado paramodelar a componente transiente de sinais musicais e de fala. Em seguida, TMS é avaliado e comparado à tradicional modelagem senoidal Spectral Modeling Synthesis (SMS). Os resultados de um experimento de reconhecimento e qualidade MOS (MeanOpinion score) são usados para medir a importância de uma modelagem adequada para transientes como bursts de consoantes oclusivas. Comparado à inteligibilidade de 98% obtida das elocuções originais, o TMS atingiu 95%, sendo significativamente maior que os 87% obtidos com o SMS. É também observado que a remoção dos bursts reduziu a inteligibilidade para 79%. Finalmente, possibilitando a separação da componente transiente, o TMS permite a definição de um índice para medir a razão entre as energias do sinal original e suacomponente transiente. Esse índice, chamado de Índice de Transiência, é avaliado. Os valores obtidos para notas musicais de diferentes instrumentos são, então, comparados.
Abstract: Nowadays, computer systems require the modeling of musical and speech signals for several purposes: synthesis, computational hearing, acoustic analysis, systematic musicology, transformation, composition, and many others. The quality modeling synthesis of music and speech signals is a complex task, which is still presented as a challenge.This is particularly true when low dimensional parametric representation, low computational cost, intelligibility and naturalness are aimed.Speech and musical signals have transient states of vibration, such as musical instrument note attacks and speech bursts in stop consonants. Due to its impulsive characteristics, transients are like snapshots of the vocal tract and musical instruments, being important for the perception of timbre and recognition of the sound source. Many of the modeling techniques of musical and speech signals are not efficient attransient parts. The separation of transients from deterministic and stochastic signal components represent a significant improvement in modeling synthesis flexibility. This study is devoted to the analysis, modeling, and auditory perception measurements of speech and music transients. In the research carried out, Transient Modeling Synthesis (TMS) is used to model the transient components of speech and musical signals. Next, TMS is evaluated and compared to traditional sinusoidal based Spectral Modeling Synthesis (SMS). The results of a phoneme recognition experiment and a quality MOS (Mean Opinion Score)test are used to measure the importance of an adequate modeling of transients as bursts in stop consonants. Compared to the intelligibility of 98% obtained for the original utterances, TMS modeling attained 95%, which are significantly higher than the 87% attained withSMS modeling. It was also observed that removing the transient component reduces the intelligibility to 79%. Finally, by enabling the separation of transient components, TMS allows the definitionof an index to measure the ratio between the energy of original and of transient signal components. This index, called Index of Transience, has been evaluated. The values obtained were then compared in a test and applied to different musical instrument notes.
Subject: Engenharia elétrica
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/BUBD-92MMZK
Issue Date: 10-Aug-2012
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
dissertacao.pdf1.92 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.