Estudo sobre transientes em sinais de fala e mùsica

Thiago de Almeida Magalhaes Campolina

Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/BUBD-92MMZK

Tipo:	Dissertação de Mestrado
Título:	Estudo sobre transientes em sinais de fala e mùsica
Autor(es):	Thiago de Almeida Magalhaes Campolina
Primeiro Orientador:	Mauricio Alves Loureiro
Segundo Orientador:	Mauricio Alves Loureiro
Primeiro membro da banca :	Eduardo Mazoni Andrade Marcal Mendes
Segundo membro da banca:	Maurilio Nunes Vieira
Terceiro membro da banca:	Leandro de Campos Teixeira Gomes
Resumo:	Atualmente, sistemas computacionais necessitam da modelagem de sinais de música e fala para vários propósitos: síntese, audição computacional, análise acústica, análise musical sistemática, transformação, composição, entre muitas outras. A modelagempor síntese de sinais de música e fala, com qualidade, é uma tarefa complexa, que ainda se apresenta como um desafio. Principalmente, quando se busca a representação com a menor quantidade de parâmetros possível, visando baixo custo computacional,procurando manter boa inteligibilidade e naturalidade. Sinais de fala e música apresentam estados transitórios de vibração, que contêmtransientes. Como é o caso de ataques de notas musicais e bursts em consoantes oclusivas. Por possuírem características impulsivas, transientes são como retratos instantâneos do trato vocal e instrumentos musicais, sendo importantes para a percepção detimbre e reconhecimento da fonte sonora. Muitas das técnicas de modelagem de música e fala não são eficientes para transientes. A modelagem por síntese dos transientes possibilita sua separação das partes determinísticas e estocásticas de sinais, representandomaior flexibilidade para processamentos. Este estudo é dedicado à análise, modelagem, e percepção auditiva de transientes. Na pesquisa desenvolvida, Transient Modeling Synthesis (TMS) é usado paramodelar a componente transiente de sinais musicais e de fala. Em seguida, TMS é avaliado e comparado à tradicional modelagem senoidal Spectral Modeling Synthesis (SMS). Os resultados de um experimento de reconhecimento e qualidade MOS (MeanOpinion score) são usados para medir a importância de uma modelagem adequada para transientes como bursts de consoantes oclusivas. Comparado à inteligibilidade de 98% obtida das elocuções originais, o TMS atingiu 95%, sendo significativamente maior que os 87% obtidos com o SMS. É também observado que a remoção dos bursts reduziu a inteligibilidade para 79%. Finalmente, possibilitando a separação da componente transiente, o TMS permite a definição de um índice para medir a razão entre as energias do sinal original e suacomponente transiente. Esse índice, chamado de Índice de Transiência, é avaliado. Os valores obtidos para notas musicais de diferentes instrumentos são, então, comparados.
Abstract:	Nowadays, computer systems require the modeling of musical and speech signals for several purposes: synthesis, computational hearing, acoustic analysis, systematic musicology, transformation, composition, and many others. The quality modeling synthesis of music and speech signals is a complex task, which is still presented as a challenge.This is particularly true when low dimensional parametric representation, low computational cost, intelligibility and naturalness are aimed.Speech and musical signals have transient states of vibration, such as musical instrument note attacks and speech bursts in stop consonants. Due to its impulsive characteristics, transients are like snapshots of the vocal tract and musical instruments, being important for the perception of timbre and recognition of the sound source. Many of the modeling techniques of musical and speech signals are not efficient attransient parts. The separation of transients from deterministic and stochastic signal components represent a significant improvement in modeling synthesis flexibility. This study is devoted to the analysis, modeling, and auditory perception measurements of speech and music transients. In the research carried out, Transient Modeling Synthesis (TMS) is used to model the transient components of speech and musical signals. Next, TMS is evaluated and compared to traditional sinusoidal based Spectral Modeling Synthesis (SMS). The results of a phoneme recognition experiment and a quality MOS (Mean Opinion Score)test are used to measure the importance of an adequate modeling of transients as bursts in stop consonants. Compared to the intelligibility of 98% obtained for the original utterances, TMS modeling attained 95%, which are significantly higher than the 87% attained withSMS modeling. It was also observed that removing the transient component reduces the intelligibility to 79%. Finally, by enabling the separation of transient components, TMS allows the definitionof an index to measure the ratio between the energy of original and of transient signal components. This index, called Index of Transience, has been evaluated. The values obtained were then compared in a test and applied to different musical instrument notes.
Assunto:	Engenharia elétrica
Idioma:	Português
Editor:	Universidade Federal de Minas Gerais
Sigla da Instituição:	UFMG
Tipo de Acesso:	Acesso Aberto
URI:	http://hdl.handle.net/1843/BUBD-92MMZK
Data do documento:	10-Ago-2012
Aparece nas coleções:	Dissertações de Mestrado

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
dissertacao.pdf		1.92 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas