Use este identificador para citar o ir al link de este elemento: http://hdl.handle.net/1843/77007
Tipo: Tese
Título: How to deal with discourse markers: a prosodic, corpus-based, computational and experimental proposal
Título(s) alternativo(s): Como lidar com os Marcadores Discursivos: uma proposta prosódica, baseada em corpus, computacional e experimental
Comment aborder les Marqueurs discursifs : une approche prosodique, basée sur corpus, computationnelle et expérimentale
Autor(es): Saulo Mendes Santos
primer Tutor: Tommaso Raso
Segundo Tutor: Albert Olivier Blaise Rilliard
primer miembro del tribunal : Plínio de Almeida Barbosa
Segundo miembro del tribunal: Antonio Romano
Tercer miembro del tribunal: Corinne Fredouille
Cuarto miembro del tribunal: Alessandro Panunzi
Quinto miembro del tribunal: Bruno Neves Rati de Melo Rocha
Resumen: The primary focus of this research is to examine Discourse Markers (DMs) in spontaneous spoken interactions. DMs are lexemes or small expressions that underwent pragmaticalization. They do not participate in constructing the meaning, being directed at managing spoken interactions. Proposed DM functions vary greatly depending on goals and analytical methods, with most studies taking the lexicon as a departing point. However, the same DM function can be accomplished through various lexemes. This research takes a different approach. The formal criterion is the prosodic form, which is deemed more stable and revealing regarding the functionalities of DMs. Thus, the objective is to comprehend the factors contributing to expressing DMs’ functions and understand how their prosodic form can predict their respective functions. The theoretical framework utilized for this investigation is the Language into Act Theory (L-AcT – Cavalcante, 2020; Cresti, 2000; Moneglia & Raso, 2014). The L-AcT views DMs as a special type of Information Unit (IU), which are conveyed by prosodic units and have distributional constraints. Based on previous studies (Cresti, 2000; Raso, 2014; Raso & Vieira, 2016; Raso & Ferrari, 2020), a reviewed DM framework is proposed: the Allocutive (social cohesion); the Conative (pointing to an illocutionary solution); the Expressive (enacting non-illocutionary surprise); the Highlighter (highlighting); and the Incipit (opening a TU or a turn). Statistical and experimental evidence supporting the proposal is presented. An IU sample containing DM candidates was extracted from the C-ORAL-BRASIL I corpus (Raso & Mello, 2012). The data were categorized into the five proposed classes. 30 prosodic-acoustic descriptors were estimated, including intonational shape, syllable lengthening, and relative intensity. Different classification models were trained and evaluated on a cross-validation set. The best classification model achieved an accuracy score of 78% for these five categories. The more relevant features for distinguishing each class from others are described. The results show that despite the large variability of contexts, speakers, and speaking styles, achieving a reasonable classification through the prosodic form is possible. Additionally, an experiment evaluated participants' ability to recognize DM classes occurring in the initial position based on prosodic cues. 25 utterances containing three different DM functions (ALL, CNT, and INP) and seven different lexemes were selected. A trained speaker reproduced instances in a sound-processed room, and the original DMs were manipulated to match the prototypical forms of all functional targets. The stimuli were presented to 120 participants, whose task was to identify the function. Results show that all controlled factors were relevant: the original context, the prosodic form, and the lexicon. However, the prosodic form is less variable and less submitted to the sentence’s interpretation to cue functionality.
Abstract: O foco principal desta pesquisa é examinar Marcadores de Discurso (MDs) em interações de fala espontânea. DMs são lexemas ou expressões que passaram por pragmaticalização. Eles não participam da construção do significado, sendo direcionados ao gerenciamento das interações faladas. As funções propostas variam muito dependendo dos objetivos e do método analítico, e a maioria dos estudos toma o léxico como ponto de partida. Contudo, uma mesma função pode ser realizada através de vários lexemas. Esta pesquisa adota uma abordagem diferente. O critério formal é a forma prosódica, considerada mais estável e reveladora no que diz respeito às funcionalidades dos DMs. O objetivo é compreender os fatores que contribuem para a veiculação dos DMs e como a forma prosódica pode ser utilizada para prever as respectivas funções. O referencial teórico utilizado é a Language into Act (L-AcT – Cavalcante, 2020; Cresti, 2000; Moneglia & Raso, 2014). A L-AcT vê os DMs como um tipo especial de Unidade Informacional (UI), que é veiculada por unidades prosódicas e possui restrições distribucionais. Com base em estudos anteriores (Cresti, 2000; Raso, 2014; Raso & Vieira, 2016; Raso & Ferrari, 2020), propõe-se um quadro de MDs revisto: o Alocutivo (coesão social); o Conativo (apontando para uma solução ilocucionária); o Expressivo (representando surpresa não ilocucionária); o Marcador (destaque); e o Incipitário (abrir uma TU ou um turno). São apresentadas evidências estatísticas e experimentais que apoiam a proposta. Uma amostra de UIs contendo candidatos a DM foi extraída do C-ORAL-BRASIL I (Raso & Mello, 2012). Os dados foram categorizados nas cinco classes propostas. Foram estimados 30 descritores prosódico-acústicos, incluindo forma entoacional, alongamento silábico e intensidade relativa. Diferentes modelos de classificação foram treinados e avaliados em validação cruzada. O melhor modelo de classificação obteve uma acurácia de 78%. Os resultados mostram que, apesar da grande variabilidade de contextos, falantes e estilos de elocução, é possível conseguir uma classificação razoável por meio da forma prosódica. Além disso, foi realizado um experimento para avaliar a capacidade dos participantes de reconhecer classes de DM que ocorrem na posição inicial com base apenas em pistas prosódicas. Foram selecionados 25 enunciados contendo três funções diferentes (ALL, CNT e INP) e sete lexemas diferentes. As instâncias foram registradas em um ambiente controlado e os originais foram manipulados para corresponder às formas prototípicas de outros DMs alvo. Os estímulos foram apresentados a 120 participantes. Os resultados mostram que todos os fatores controlados desempenham um papel relevante: o contexto original, a forma prosódica e o léxico. No entanto, apenas a forma prosódica é menos variável.
Asunto: Análise prosódica (Linguística)
Linguística de corpus
Atos de fala (Linguística)
Idioma: eng
País: Brasil
Editor: Universidade Federal de Minas Gerais
Sigla da Institución: UFMG
Departamento: FALE - FACULDADE DE LETRAS
Curso: Programa de Pós-Graduação em Estudos Linguísticos
Tipo de acceso: Acesso Aberto
URI: http://hdl.handle.net/1843/77007
Fecha del documento: 26-feb-2024
Aparece en las colecciones:Teses de Doutorado

archivos asociados a este elemento:
archivo Descripción TamañoFormato 
20240524_these_depot-final_v-ufmg_saulo.mendes-santos.pdf8.92 MBAdobe PDFVisualizar/Abrir


Los elementos en el repositorio están protegidos por copyright, con todos los derechos reservados, salvo cuando es indicado lo contrario.