Predição de intensidade sonora percebida (loudness ) para áudio espacial
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Primeiro orientador
Membros da banca
Maurílio Nunes Vieira
Hani Camille Yehia
Adriano Vilela Barbosa
Wallace do Couto Boaventura
Luiz Wagner Pereira Biscainho
Hani Camille Yehia
Adriano Vilela Barbosa
Wallace do Couto Boaventura
Luiz Wagner Pereira Biscainho
Resumo
O controle da intensidade percebida de áudio (loudness) na radiodifusão é
prática comum e legalmente exigida desde a publicação da Recomendação ITUR
BS.1770, da União Internacional de Telecomunicações (ITU), para medição
objetiva de loudness em áudio multicanal. Recomendações e regulamentos
regionais foram publicados com base no algoritmo ITU-R, inclusive no Brasil.
Isto posto, há oportunidades tanto de melhoria da regulamentação nacional à luz
das contribuições mais recentes na área, quanto de aprimoramento do modelo
ITU-R para medidas em sistemas avançados de áudio espacial. Este trabalho
persegue estes dois objetivos ao testar os parâmetros da norma nacional com
um controlador de intensidade percebida em tempo real usando descritores de
loudness voltados para conteúdo de curta duração, além de procurar contribuir
com as discussões sobre o tema no âmbito do ITU-R com o desenvolvimento de
um modelo de medição objetiva adaptado aos novos formatos de áudio espacial.
Este teve um desempenho satisfatório em comparação com outros modelos,
embora fosse puramente uma solução de processamento de sinais e suas leituras
não se assemelhassem tanto aos resultados subjetivos. Buscando benefícios
potenciais de um modelo mais orientado à percepção, realizou-se testes de escuta
para avaliação dos parâmetros posicionais de distância, azimute e elevação, cujos
resultados serviram de base para a obtenção de curvas de correção de ganho e
nova ponderação direcional para o modelo ITU-R. Os resultados gerais apontam
para avanços tanto na frente regulatória quanto na de padronização, seja pela
elaboração de uma estratégia de melhorias propostas para a norma brasileira de
intensidade percebida, seja pela comparação deste novo algoritmo de predição
com a fortuna crítica de modelos de loudness por meio de medições realizadas em
conteúdo para sistemas de reprodução de áudio espacial multicanal. O modelo
desenvolvido obteve a melhor relação de compromisso entre erros de predição
(RMSE*), correlação das estimações com os resultados dos testes subjetivos, e
tempo médio de execução.
Abstract
Loudness control for brodcasting is a common and legally required practice
since the International Telecommunication Union (ITU) Recommendation ITUR
BS.1770 for objective measurements in multichannel audio. Recommendations
and regulations based on the ITU-R algorithm have been published worldwide,
including Brazil. There is scope for improving national regulations in light
of recent contributions to the field, and also for adapting the ITU-R model to
measurements in advanced audio systems. This work pursues these two goals
by testing the parameters of the Brazilian standard with a real-time loudness
controller using short-form descriptors and by developing a new objective measurement
model adapted to the new spatial audio formats. The proposed method
performed well compared to other loudness models, although it was purely signal
processing based and its readings were not very close to subject responses. The
potential benefits of a more perceptually motivated model led to a PhD placement
in the Institute of Sound Recording at the University of Surrey (UK), where
listening tests were conducted to assess positional parameters of distance, azimuth
and elevation, whose results served as a basis for deriving gain correction
curves and a new directional weighting for the ITU-R model. General results
point to advancements in the regulatory and standardization fronts, either by
the elaboration of a strategy to improve the Brazilian standard of loudness, or
by comparing this new prediction method with the critical fortune of loudness
models through measurements on audio content for multichannel reproduction
systems. The developed model resulted in the best trade-off between prediction
errors (RMSE*), correlation between predictions and subject responses, and
mean run time.
Assunto
Engenharia elétrica, Processamento de sinais, Radiodifusão, Telecomunicações
Palavras-chave
Loudness, Radiodifusão, Auralização, Áudio Espacial, Testes subjetivos, Processamento de sinais