Predição de intensidade sonora percebida (loudness ) para áudio espacial

dc.creatorLeandro da Silva Pires
dc.date.accessioned2019-10-10T17:42:40Z
dc.date.accessioned2025-09-08T23:52:24Z
dc.date.available2019-10-10T17:42:40Z
dc.date.issued2019-06-27
dc.description.abstractLoudness control for brodcasting is a common and legally required practice since the International Telecommunication Union (ITU) Recommendation ITUR BS.1770 for objective measurements in multichannel audio. Recommendations and regulations based on the ITU-R algorithm have been published worldwide, including Brazil. There is scope for improving national regulations in light of recent contributions to the field, and also for adapting the ITU-R model to measurements in advanced audio systems. This work pursues these two goals by testing the parameters of the Brazilian standard with a real-time loudness controller using short-form descriptors and by developing a new objective measurement model adapted to the new spatial audio formats. The proposed method performed well compared to other loudness models, although it was purely signal processing based and its readings were not very close to subject responses. The potential benefits of a more perceptually motivated model led to a PhD placement in the Institute of Sound Recording at the University of Surrey (UK), where listening tests were conducted to assess positional parameters of distance, azimuth and elevation, whose results served as a basis for deriving gain correction curves and a new directional weighting for the ITU-R model. General results point to advancements in the regulatory and standardization fronts, either by the elaboration of a strategy to improve the Brazilian standard of loudness, or by comparing this new prediction method with the critical fortune of loudness models through measurements on audio content for multichannel reproduction systems. The developed model resulted in the best trade-off between prediction errors (RMSE*), correlation between predictions and subject responses, and mean run time.
dc.identifier.urihttps://hdl.handle.net/1843/30272
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectEngenharia elétrica
dc.subjectProcessamento de sinais
dc.subjectRadiodifusão
dc.subjectTelecomunicações
dc.subject.otherLoudness
dc.subject.otherRadiodifusão
dc.subject.otherAuralização
dc.subject.otherÁudio Espacial
dc.subject.otherTestes subjetivos
dc.subject.otherProcessamento de sinais
dc.titlePredição de intensidade sonora percebida (loudness ) para áudio espacial
dc.typeTese de doutorado
local.contributor.advisor-co1Hani Camille Yehia
local.contributor.advisor1Maurílio Nunes Vieira
local.contributor.advisor1Latteshttp://lattes.cnpq.br/1636687509748198
local.contributor.referee1Maurílio Nunes Vieira
local.contributor.referee1Hani Camille Yehia
local.contributor.referee1Adriano Vilela Barbosa
local.contributor.referee1Wallace do Couto Boaventura
local.contributor.referee1Luiz Wagner Pereira Biscainho
local.creator.Latteshttp://lattes.cnpq.br/0991051600471199
local.description.resumoO controle da intensidade percebida de áudio (loudness) na radiodifusão é prática comum e legalmente exigida desde a publicação da Recomendação ITUR BS.1770, da União Internacional de Telecomunicações (ITU), para medição objetiva de loudness em áudio multicanal. Recomendações e regulamentos regionais foram publicados com base no algoritmo ITU-R, inclusive no Brasil. Isto posto, há oportunidades tanto de melhoria da regulamentação nacional à luz das contribuições mais recentes na área, quanto de aprimoramento do modelo ITU-R para medidas em sistemas avançados de áudio espacial. Este trabalho persegue estes dois objetivos ao testar os parâmetros da norma nacional com um controlador de intensidade percebida em tempo real usando descritores de loudness voltados para conteúdo de curta duração, além de procurar contribuir com as discussões sobre o tema no âmbito do ITU-R com o desenvolvimento de um modelo de medição objetiva adaptado aos novos formatos de áudio espacial. Este teve um desempenho satisfatório em comparação com outros modelos, embora fosse puramente uma solução de processamento de sinais e suas leituras não se assemelhassem tanto aos resultados subjetivos. Buscando benefícios potenciais de um modelo mais orientado à percepção, realizou-se testes de escuta para avaliação dos parâmetros posicionais de distância, azimute e elevação, cujos resultados serviram de base para a obtenção de curvas de correção de ganho e nova ponderação direcional para o modelo ITU-R. Os resultados gerais apontam para avanços tanto na frente regulatória quanto na de padronização, seja pela elaboração de uma estratégia de melhorias propostas para a norma brasileira de intensidade percebida, seja pela comparação deste novo algoritmo de predição com a fortuna crítica de modelos de loudness por meio de medições realizadas em conteúdo para sistemas de reprodução de áudio espacial multicanal. O modelo desenvolvido obteve a melhor relação de compromisso entre erros de predição (RMSE*), correlação das estimações com os resultados dos testes subjetivos, e tempo médio de execução.
local.publisher.countryBrasil
local.publisher.departmentENG - DEPARTAMENTO DE ENGENHARIA ELÉTRICA
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
20190801_Tese_LeandroPires_posBanca.pdf
Tamanho:
15.92 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: