Predição de intensidade sonora percebida (loudness ) para áudio espacial

Leandro da Silva Pires

Use este identificador para citar o ir al link de este elemento: http://hdl.handle.net/1843/30272

Tipo:	Tese
Título:	Predição de intensidade sonora percebida (loudness ) para áudio espacial
Autor(es):	Leandro da Silva Pires
primer Tutor:	Maurílio Nunes Vieira
primer Co-tutor:	Hani Camille Yehia
primer miembro del tribunal :	Maurílio Nunes Vieira
Segundo miembro del tribunal:	Hani Camille Yehia
Tercer miembro del tribunal:	Adriano Vilela Barbosa
Cuarto miembro del tribunal:	Wallace do Couto Boaventura
Quinto miembro del tribunal:	Luiz Wagner Pereira Biscainho
Resumen:	O controle da intensidade percebida de áudio (loudness) na radiodifusão é prática comum e legalmente exigida desde a publicação da Recomendação ITUR BS.1770, da União Internacional de Telecomunicações (ITU), para medição objetiva de loudness em áudio multicanal. Recomendações e regulamentos regionais foram publicados com base no algoritmo ITU-R, inclusive no Brasil. Isto posto, há oportunidades tanto de melhoria da regulamentação nacional à luz das contribuições mais recentes na área, quanto de aprimoramento do modelo ITU-R para medidas em sistemas avançados de áudio espacial. Este trabalho persegue estes dois objetivos ao testar os parâmetros da norma nacional com um controlador de intensidade percebida em tempo real usando descritores de loudness voltados para conteúdo de curta duração, além de procurar contribuir com as discussões sobre o tema no âmbito do ITU-R com o desenvolvimento de um modelo de medição objetiva adaptado aos novos formatos de áudio espacial. Este teve um desempenho satisfatório em comparação com outros modelos, embora fosse puramente uma solução de processamento de sinais e suas leituras não se assemelhassem tanto aos resultados subjetivos. Buscando benefícios potenciais de um modelo mais orientado à percepção, realizou-se testes de escuta para avaliação dos parâmetros posicionais de distância, azimute e elevação, cujos resultados serviram de base para a obtenção de curvas de correção de ganho e nova ponderação direcional para o modelo ITU-R. Os resultados gerais apontam para avanços tanto na frente regulatória quanto na de padronização, seja pela elaboração de uma estratégia de melhorias propostas para a norma brasileira de intensidade percebida, seja pela comparação deste novo algoritmo de predição com a fortuna crítica de modelos de loudness por meio de medições realizadas em conteúdo para sistemas de reprodução de áudio espacial multicanal. O modelo desenvolvido obteve a melhor relação de compromisso entre erros de predição (RMSE*), correlação das estimações com os resultados dos testes subjetivos, e tempo médio de execução.
Abstract:	Loudness control for brodcasting is a common and legally required practice since the International Telecommunication Union (ITU) Recommendation ITUR BS.1770 for objective measurements in multichannel audio. Recommendations and regulations based on the ITU-R algorithm have been published worldwide, including Brazil. There is scope for improving national regulations in light of recent contributions to the field, and also for adapting the ITU-R model to measurements in advanced audio systems. This work pursues these two goals by testing the parameters of the Brazilian standard with a real-time loudness controller using short-form descriptors and by developing a new objective measurement model adapted to the new spatial audio formats. The proposed method performed well compared to other loudness models, although it was purely signal processing based and its readings were not very close to subject responses. The potential benefits of a more perceptually motivated model led to a PhD placement in the Institute of Sound Recording at the University of Surrey (UK), where listening tests were conducted to assess positional parameters of distance, azimuth and elevation, whose results served as a basis for deriving gain correction curves and a new directional weighting for the ITU-R model. General results point to advancements in the regulatory and standardization fronts, either by the elaboration of a strategy to improve the Brazilian standard of loudness, or by comparing this new prediction method with the critical fortune of loudness models through measurements on audio content for multichannel reproduction systems. The developed model resulted in the best trade-off between prediction errors (RMSE*), correlation between predictions and subject responses, and mean run time.
Asunto:	Engenharia elétrica Processamento de sinais Radiodifusão Telecomunicações
Idioma:	por
País:	Brasil
Editor:	Universidade Federal de Minas Gerais
Sigla da Institución:	UFMG
Departamento:	ENG - DEPARTAMENTO DE ENGENHARIA ELÉTRICA
Curso:	Programa de Pós-Graduação em Engenharia Elétrica
Tipo de acceso:	Acesso Aberto
URI:	http://hdl.handle.net/1843/30272
Fecha del documento:	27-jun-2019
Aparece en las colecciones:	Teses de Doutorado

archivos asociados a este elemento:

archivo	Descripción	Tamaño	Formato
20190801_Tese_LeandroPires_posBanca.pdf		16.3 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo del elemento Visualizar estadísticas