Detecção automática de fronteiras prosódicas entre unidades entonacionais

dc.creatorBárbara Teixeira
dc.creatorTommaso Raso
dc.creatorPlínio Almeida Barbosa
dc.date.accessioned2023-09-14T21:43:53Z
dc.date.accessioned2025-09-08T23:10:59Z
dc.date.available2023-09-14T21:43:53Z
dc.date.issued2020-08-10
dc.description.abstractSpeech is segmented into intonational units marked by prosodic boundaries. This work aims both to investigate the phonetic-acoustic parameters that guide the production and perception of prosodic boundaries and to develop models for automatic detection of prosodic boundaries in spontaneous speech. Two samples of male spontaneous speech excerpts were segmented into intonational units by two groups of trained annotators. The boundaries perceived by the annotators were annotated as either terminal (TB) or non-terminal (NTB). A script was used to extract phonetic-acoustic parameters along the speech signal. The extracted parameters comprise measures of: 1) Speech rate and rhythm; 2) Normalized duration; 3) Fundamental frequency; 4) Intensity; 5) Silent pause. A training of models composed by multiple parameters designed to the automatic identification of boundaries marked by the annotators was developed. The Linear Discriminant Analysis algorithm was used and positions at which at least 50% of the annotators indicated a boundary of the same type were considered as boundary. The automatic terminal boundary detection model shows a convergence of 80% in relation to terminal boundaries noticed by annotators in sample I. For non-terminal boundaries, three statistical classification models were obtained. Together, the three models show a convergence of 98% in relation to nonterminal boundaries noticed by annotators in sample I. The models were validated later in sample II. The results of the validation indicate that the performance of the TB model is 74% and that of the NTB model is 88% in sample II.
dc.format.mimetypepdf
dc.identifier.doihttps://doi.org/10.47627/gradus.v5i1.147
dc.identifier.issn2526-2718
dc.identifier.urihttps://hdl.handle.net/1843/58707
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.relation.ispartofGradus: Revista Brasileira de Fonologia de Laboratório
dc.rightsAcesso Aberto
dc.subjectAnalise prosódica (Linguística)
dc.subjectAtos de fala (Linguística)
dc.subjectPercepção da fala
dc.subject.otherFronteiras prosódicas
dc.subject.otherDetecção automática
dc.subject.otherFala espontânea
dc.subject.otherSegmentação da fala
dc.titleDetecção automática de fronteiras prosódicas entre unidades entonacionais
dc.typeArtigo de periódico
local.citation.epage46
local.citation.issue1
local.citation.spage17
local.citation.volume5
local.description.resumoA fala é segmentada em unidades entonacionais marcadas por fronteiras prosódicas. Este trabalho tem como objetivo investigar os parâmetros fonético-acústicos que orientam a produção e a percepção de fronteiras prosódicas, bem como desenvolver modelos para detecção automática de fronteiras prosódicas em fala espontânea. Duas amostras de trechos de fala espontânea masculina foram segmentadas em unidades entonacionais por dois grupos de segmentadores treinados. As fronteiras percebidas pelos segmentadores foram anotadas como terminais (TB) ou não-terminais (NTB). Um script foi utilizado para extrair parâmetros fonético-acústicos ao longo do sinal de fala. Os parâmetros extraídos compreendem medidas de: 1) Velocidade e ritmo da fala; 2) Duração normalizada; 3) Frequência fundamental; 4) Intensidade; 5) Pausa silenciosa. Foi desenvolvido um treinamento de modelos compostos por múltiplos parâmetros projetados para a identificação automática das fronteiras marcadas pelos segmentadores. Utilizou-se o algoritmo Linear Discriminant Analysis e consideraram-se como fronteira posições em que pelo menos 50% dos segmentadores indicaram uma fronteira do mesmo tipo. O modelo de detecção automática de fronteiras terminais mostra uma convergência de 80% em relação às fronteiras terminais observadas pelos segmentadores na Amostra I. Para fronteiras não-terminais, foram obtidos três modelos de classificação estatística. Juntos, os três modelos mostram uma convergência de 98% em relação às fronteiras não-terminais observadas pelos segmentadores na Amostra I. Os modelos foram validados posteriormente na Amostra II. Os resultados da validação indicam que o desempenho do modelo TB é de 74% e o do modelo NTB é de 88% na Amostra II.
local.identifier.orcidhttps://orcid.org/0000-0002-4484-3590
local.identifier.orcidhttps://orcid.org/0000-0002-3446-313X
local.identifier.orcidhttps://orcid.org/0000-0001-6317-3548
local.publisher.countryBrasil
local.publisher.departmentFALE - FACULDADE DE LETRAS
local.publisher.initialsUFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Detecção automática de fronteiras prosódicas entre unidades entonacionais.pdf
Tamanho:
591.14 KB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
License.txt
Tamanho:
1.99 KB
Formato:
Plain Text
Descrição: