Predição de intensidade sonora percebida (loudness ) para áudio espacial

Leandro da Silva Pires

Predição de intensidade sonora percebida (loudness ) para áudio espacial

Arquivos

20190801_Tese_LeandroPires_posBanca.pdf (15.92 MB)

Data

2019-06-27

Autor(es)

Leandro da Silva Pires

Editor

Universidade Federal de Minas Gerais

Tipo

Tese de doutorado

Primeiro orientador

Maurílio Nunes Vieira

Membros da banca

Maurílio Nunes Vieira
Hani Camille Yehia
Adriano Vilela Barbosa
Wallace do Couto Boaventura
Luiz Wagner Pereira Biscainho

Resumo

O controle da intensidade percebida de áudio (loudness) na radiodifusão é prática comum e legalmente exigida desde a publicação da Recomendação ITUR BS.1770, da União Internacional de Telecomunicações (ITU), para medição objetiva de loudness em áudio multicanal. Recomendações e regulamentos regionais foram publicados com base no algoritmo ITU-R, inclusive no Brasil. Isto posto, há oportunidades tanto de melhoria da regulamentação nacional à luz das contribuições mais recentes na área, quanto de aprimoramento do modelo ITU-R para medidas em sistemas avançados de áudio espacial. Este trabalho persegue estes dois objetivos ao testar os parâmetros da norma nacional com um controlador de intensidade percebida em tempo real usando descritores de loudness voltados para conteúdo de curta duração, além de procurar contribuir com as discussões sobre o tema no âmbito do ITU-R com o desenvolvimento de um modelo de medição objetiva adaptado aos novos formatos de áudio espacial. Este teve um desempenho satisfatório em comparação com outros modelos, embora fosse puramente uma solução de processamento de sinais e suas leituras não se assemelhassem tanto aos resultados subjetivos. Buscando benefícios potenciais de um modelo mais orientado à percepção, realizou-se testes de escuta para avaliação dos parâmetros posicionais de distância, azimute e elevação, cujos resultados serviram de base para a obtenção de curvas de correção de ganho e nova ponderação direcional para o modelo ITU-R. Os resultados gerais apontam para avanços tanto na frente regulatória quanto na de padronização, seja pela elaboração de uma estratégia de melhorias propostas para a norma brasileira de intensidade percebida, seja pela comparação deste novo algoritmo de predição com a fortuna crítica de modelos de loudness por meio de medições realizadas em conteúdo para sistemas de reprodução de áudio espacial multicanal. O modelo desenvolvido obteve a melhor relação de compromisso entre erros de predição (RMSE*), correlação das estimações com os resultados dos testes subjetivos, e tempo médio de execução.

Abstract

Loudness control for brodcasting is a common and legally required practice since the International Telecommunication Union (ITU) Recommendation ITUR BS.1770 for objective measurements in multichannel audio. Recommendations and regulations based on the ITU-R algorithm have been published worldwide, including Brazil. There is scope for improving national regulations in light of recent contributions to the field, and also for adapting the ITU-R model to measurements in advanced audio systems. This work pursues these two goals by testing the parameters of the Brazilian standard with a real-time loudness controller using short-form descriptors and by developing a new objective measurement model adapted to the new spatial audio formats. The proposed method performed well compared to other loudness models, although it was purely signal processing based and its readings were not very close to subject responses. The potential benefits of a more perceptually motivated model led to a PhD placement in the Institute of Sound Recording at the University of Surrey (UK), where listening tests were conducted to assess positional parameters of distance, azimuth and elevation, whose results served as a basis for deriving gain correction curves and a new directional weighting for the ITU-R model. General results point to advancements in the regulatory and standardization fronts, either by the elaboration of a strategy to improve the Brazilian standard of loudness, or by comparing this new prediction method with the critical fortune of loudness models through measurements on audio content for multichannel reproduction systems. The developed model resulted in the best trade-off between prediction errors (RMSE*), correlation between predictions and subject responses, and mean run time.

Assunto

Engenharia elétrica, Processamento de sinais, Radiodifusão, Telecomunicações

Palavras-chave

Loudness, Radiodifusão, Auralização, Áudio Espacial, Testes subjetivos, Processamento de sinais

URI

https://hdl.handle.net/1843/30272

Departamento

ENG - DEPARTAMENTO DE ENGENHARIA ELÉTRICA

Curso

Programa de Pós-Graduação em Engenharia Elétrica

Coleções

Pós-Graduação em Engenharia Elétrica - Teses

Página do item completo

Predição de intensidade sonora percebida (loudness ) para áudio espacial

Arquivos

Data

Autor(es)

Título da Revista

ISSN da Revista

Título de Volume

Editor

Descrição

Tipo

Título alternativo

Primeiro orientador

Membros da banca

Resumo

Abstract

Assunto

Palavras-chave

Citação

URI

Departamento

Curso

Endereço externo

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por