Detecção automática de fronteiras prosódicas entre unidades entonacionais

Bárbara Teixeira; Tommaso Raso; Plínio Almeida Barbosa

doi:https://doi.org/10.47627/gradus.v5i1.147

Detecção automática de fronteiras prosódicas entre unidades entonacionais

dc.creator	Bárbara Teixeira
dc.creator	Tommaso Raso
dc.creator	Plínio Almeida Barbosa
dc.date.accessioned	2023-09-14T21:43:53Z
dc.date.accessioned	2025-09-08T23:10:59Z
dc.date.available	2023-09-14T21:43:53Z
dc.date.issued	2020-08-10
dc.description.abstract	Speech is segmented into intonational units marked by prosodic boundaries. This work aims both to investigate the phonetic-acoustic parameters that guide the production and perception of prosodic boundaries and to develop models for automatic detection of prosodic boundaries in spontaneous speech. Two samples of male spontaneous speech excerpts were segmented into intonational units by two groups of trained annotators. The boundaries perceived by the annotators were annotated as either terminal (TB) or non-terminal (NTB). A script was used to extract phonetic-acoustic parameters along the speech signal. The extracted parameters comprise measures of: 1) Speech rate and rhythm; 2) Normalized duration; 3) Fundamental frequency; 4) Intensity; 5) Silent pause. A training of models composed by multiple parameters designed to the automatic identification of boundaries marked by the annotators was developed. The Linear Discriminant Analysis algorithm was used and positions at which at least 50% of the annotators indicated a boundary of the same type were considered as boundary. The automatic terminal boundary detection model shows a convergence of 80% in relation to terminal boundaries noticed by annotators in sample I. For non-terminal boundaries, three statistical classification models were obtained. Together, the three models show a convergence of 98% in relation to nonterminal boundaries noticed by annotators in sample I. The models were validated later in sample II. The results of the validation indicate that the performance of the TB model is 74% and that of the NTB model is 88% in sample II.
dc.format.mimetype	pdf
dc.identifier.doi	https://doi.org/10.47627/gradus.v5i1.147
dc.identifier.issn	2526-2718
dc.identifier.uri	https://hdl.handle.net/1843/58707
dc.language	por
dc.publisher	Universidade Federal de Minas Gerais
dc.relation.ispartof	Gradus: Revista Brasileira de Fonologia de Laboratório
dc.rights	Acesso Aberto
dc.subject	Analise prosódica (Linguística)
dc.subject	Atos de fala (Linguística)
dc.subject	Percepção da fala
dc.subject.other	Fronteiras prosódicas
dc.subject.other	Detecção automática
dc.subject.other	Fala espontânea
dc.subject.other	Segmentação da fala
dc.title	Detecção automática de fronteiras prosódicas entre unidades entonacionais
dc.type	Artigo de periódico
local.citation.epage	46
local.citation.issue	1
local.citation.spage	17
local.citation.volume	5
local.description.resumo	A fala é segmentada em unidades entonacionais marcadas por fronteiras prosódicas. Este trabalho tem como objetivo investigar os parâmetros fonético-acústicos que orientam a produção e a percepção de fronteiras prosódicas, bem como desenvolver modelos para detecção automática de fronteiras prosódicas em fala espontânea. Duas amostras de trechos de fala espontânea masculina foram segmentadas em unidades entonacionais por dois grupos de segmentadores treinados. As fronteiras percebidas pelos segmentadores foram anotadas como terminais (TB) ou não-terminais (NTB). Um script foi utilizado para extrair parâmetros fonético-acústicos ao longo do sinal de fala. Os parâmetros extraídos compreendem medidas de: 1) Velocidade e ritmo da fala; 2) Duração normalizada; 3) Frequência fundamental; 4) Intensidade; 5) Pausa silenciosa. Foi desenvolvido um treinamento de modelos compostos por múltiplos parâmetros projetados para a identificação automática das fronteiras marcadas pelos segmentadores. Utilizou-se o algoritmo Linear Discriminant Analysis e consideraram-se como fronteira posições em que pelo menos 50% dos segmentadores indicaram uma fronteira do mesmo tipo. O modelo de detecção automática de fronteiras terminais mostra uma convergência de 80% em relação às fronteiras terminais observadas pelos segmentadores na Amostra I. Para fronteiras não-terminais, foram obtidos três modelos de classificação estatística. Juntos, os três modelos mostram uma convergência de 98% em relação às fronteiras não-terminais observadas pelos segmentadores na Amostra I. Os modelos foram validados posteriormente na Amostra II. Os resultados da validação indicam que o desempenho do modelo TB é de 74% e o do modelo NTB é de 88% na Amostra II.
local.identifier.orcid	https://orcid.org/0000-0002-4484-3590
local.identifier.orcid	https://orcid.org/0000-0002-3446-313X
local.identifier.orcid	https://orcid.org/0000-0001-6317-3548
local.publisher.country	Brasil
local.publisher.department	FALE - FACULDADE DE LETRAS
local.publisher.initials	UFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1

Nome:: Detecção automática de fronteiras prosódicas entre unidades entonacionais.pdf
Tamanho:: 591.14 KB
Formato:: Adobe Portable Document Format

Baixar

Licença do pacote

Agora exibindo 1 - 1 de 1

Nome:: License.txt
Tamanho:: 1.99 KB
Formato:: Plain Text
Descrição:

Baixar

Coleções

Artigo de Periódico