Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/33823
Tipo: Tese
Título: Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores
Autor(es): Adelino Pinheiro Silva
Primeiro Orientador: Maurílio Nunes Vieira
Primeiro Coorientador: Adriano Vilela Barbosa
Primeiro membro da banca : Luiz Wagner Pereira Biscainho
Segundo membro da banca: Plinio Almeida Barbosa
Terceiro membro da banca: Frederico Rodrigues Borges da Cruz
Quarto membro da banca: Hani Camille Yehia
Quinto membro da banca: Zelia Myriam Assis Peixoto
Resumo: A Comparação Forense de Locutor (CFL) é o exame pericial que tem como tarefa analisar duas amostras de voz e inferir sobre a compatibilidade de suas características. Uma amostra de voz é vestígio de um fato típico penal enquanto a segunda é de um indivíduo conhecido. A CFL difere-se da biometria por voz em vários aspectos. A biometria permite o controle de algumas variáveis não disponíveis na CFL, entre elas, o dispositivo de gravação, o ruído de canal, a quantidade e duração das amostras e a cooperação dos locutores. Além disso, não existe o risco de associar incorretamente um inocente (erro do Tipo I) ou falhar em associar um culpado (erro do Tipo II). Neste cenário, a presente tese apresenta duas linhas de trabalho experimentais motivadas pelo paradigma das ciências forenses, o que inclui resultados quantitativos baseados em medidas estatísticas apoiadas por bancos de dados representativos. Os experimentos foram conduzidos para emular condições presentes na prática da CFL. Na primeira linha desenvolveu-se uma solução sintética para o Teste de Significância Genuinamente Bayesiano (FBST - Full Bayesian Significance Test) sobre a média com variância desconhecida propondo uma estimativa por intervalo, denominada intervalo de evidência, aplicável à CFL. Os experimentos com variação da SNR mostraram que o intervalo de evidência reduziu as taxas de erro (Tipo I e Tipo II) em torno de 6,4%, superando os demais métodos avaliados. A segunda linha propôs a utilização de medidas espectrais de relação sinal-ruído S2NR (Spectrographic Signal-to-Noise Ratio) para separar as características do sinal de voz em conjuntos nebulosos e realizar a comparação de locutores considerando a influência destes conjuntos. Nesta linha de trabalho propôs-se ainda uma adequação para o cálculo das estatísticas de Baum-Welch. Os experimentos, baseados em conjuntos nebulosos, variaram a SNR e o tamanho das amostras. Os resultados, em relação as outras técnicas, reduziram as taxas de falso positivo (erro Tipo I) em 35, 7% em amostras contaminadas, e apresentaram uma acurácia 4,5% superior para amostras com limitação de tamanho. Do ponto de vista prático, os resultados são promissores e estão sendo utilizados de forma experimental no Instituto de Criminalística da Polícia Civil de Minas Gerais.
Abstract: Forensic Speaker Comparison (FSC) is an analysis of two voice samples to infer the similarity of their features. One voice sample is a trace of a criminal fact, while the other is from a known individual. FSC differs from voice biometrics in several ways. Biometrics allows the control of some variables not controllable in FSC, among them, the recording device, the channel noise, the quantity and duration of the samples, and speaker cooperation. Also, there is no risk of associating (or failing to associate) an innocent to guilty part. The new paradigm shift of forensic sciences can be characterized as quantitative databased implementation of the likelihood-ratio framework with quantitative evaluation of the reliability of results. This thesis presents two lines of experimental work within the new paradigm shift. The experiments were conducted using two databases for training and validation. Parameters such as noise type and intensity of speech contamination, as well as the duration of the speech sample were evaluated. The first line developed a synthetic solution for the Full Bayesian Significance Test (FBST) over the mean with unknown variance, proposing an interval estimation, hereinafter referred to as evidence interval, applicable to the FSC. In the experiments, variation of the SNR showed the evidence interval reduced error rates (Type I and Type II) by approximately 6.4%, surpassing other evaluated methods. The second line of investigation proposed the use of Spectrographic Signal-to-Noise Ratio (S2NR) measures to separate the signal into fuzzy sets for the comparison of speakers. Moreover, it was also proposed an adaptation for the calculation of the Baum-Welch statistics. Experiments with combinations of SNR and speech size showed the proposed method reduced false-positive rates by 35.7%, rising also accuracy in 4.5%, compared to other evaluated techniques. The results are promising and are being used experimentally at the Instituto de Criminalística of Polícia Civil de Minas Gerais.
Assunto: Engenharia elétrica
Fonética forense
Processamento de sinais
Reconhecimento de padrões
Idioma: por
País: Brasil
Editor: Universidade Federal de Minas Gerais
Sigla da Instituição: UFMG
Departamento: ENGENHARIA - ESCOLA DE ENGENHARIA
Curso: Programa de Pós-Graduação em Engenharia Elétrica
Tipo de Acesso: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-sa/3.0/pt/
URI: http://hdl.handle.net/1843/33823
Data do documento: 16-Abr-2020
Aparece nas coleções:Teses de Doutorado



Este item está licenciada sob uma Licença Creative Commons Creative Commons