Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/33039
Type: Tese
Title: Sintaxe da fala, probabilidade e cognição: uma proposta integrada de investigação em estudo sobre NPs baseado em corpus
Authors: Luis Filipe Lima e Silva
First Advisor: Heliana Ribeiro de Mello
First Referee: Mailce Borges Mota
Second Referee: Giulia Bossaglia
Third Referee: Larissa Santos Ciríaco
metadata.dc.contributor.referee4: Aparecida de Araújo Oliveira
metadata.dc.contributor.referee5: Mailce Borges Mota
Abstract: Este trabalho consiste de três amplos objetivos complementares: (i) propor uma reflexão teórica e fornecer subsídios necessários para uma investigação mais abrangente sobre a sintaxe da fala e (ii) desenvolver estudo de caso baseado naquilo foi refletido em termos teóricos, levando em conta aspectos metodológicos oriundos da estatística e (iii) propor um domínio para a sintaxe da fala. O ponto de partida é a Language into Act Theory [L-AcT] (CRESTI, 2000) – uma teoria pragmática que individualiza o enunciado como a unidade de referência da fala espontânea. A L-AcT entende que a estrutura informacional do enunciado é sinalizada por quebras prosódicas, as quais são atribuídas diferentes unidades pragmáticas com funções distintas. O Tópico (TOP) compõe uma das unidades informacionais e é definido como o âmbito em que a força ilocucionária deve ser aplicada. Cresti (2014) diz que qualquer tipo de relação sintática só pode se estabelecer caso o conteúdo locutivo do enunciado esteja disposto dentro de uma mesma unidade informacional, ao passo que, caso tal conteúdo esteja distribuído entre duas unidades, cessam-se as relações sintáticas e o que emergem são as relações pragmáticas oriundas das respectivas funções de cada unidade informacional. Contudo, esse critério pode nem sempre ocorrer na fala. E é isso que acaba nos levando a um panorama probabilístico para o estudo da sintaxe, ou seja, quais as chances de que elementos possam estabelecer relações sintáticas entre unidades informacionais? Além disso, é preciso que haja alguma fundamentação teórica que leve em consideração os aspectos constitutivos das relações sintáticas, que são inerentemente cognitivo-computacionais, e que seja compatível com os dados de fala, incluindo a dimensão probabilística da linguagem. A Gramática Cognitiva [GC] (LANGACKER, 2008) é uma teoria compatível com a investigação empírica e experimental e vem sendo testada nesses moldes. A partir da discussão proposta e visando responder a questão acima, buscamos aplicar o que foi refletido a um estudo de caso. Nosso intuito era investigar quais as chances de que um NP em TOP estabelecesse uma relação sujeito-verbo dadas algumas variáveis selecionadas. Utilizamos três minicorpora etiquetados de acordo com os parâmetros da L-AcT, extraindo dados do inglês, do português brasileiro e do espanhol. O método estatístico utilizado foi um modelo misto de regressão logística com efeitos aleatórios cruzados. As análises quantitativas foram conduzidas com auxílio do software R (R CORE TEAM, 2018). Contudo, só conseguimos resultados estatisticamente significativos com os dados do espanhol. A análise de regressão com os dados do espanhol, no entanto, mostrou que há uma maior probabilidade de que o NP em TOP estabeleça uma relação de sujeito com o conteúdo do COM caso tal NP seja definido, animado e dado. Posteriormente, os resultados foram interpretados segundo a GC. Uma análise provisória apontou que para os casos em que o NP é sujeito, haveria uma congruência no alinhamento de trajetores em TOP, tanto no nível oracional quanto no nível discursivo, ao passo que nos NPs sem relação sintática (SRS) o alinhamento se manifesta apenas no nível discursivo entre as unidades de TOP e de COM. Foi aplicado adicionalmente um modelo de árvore de decisão para os dados do espanhol. A aplicação do modelo mostrou que os NPs animados tedem a ser sujeito do verbo em COM, ao passo que os NPs inanimados apresentam uma interação maior com as outras variáveis. Caso os NPs sejam inanimados e o verbo da unidade seguinte seja das classes verbais modulación e relacional, os NPs tendem a ser sujeito. Se os verbos forem das demais classes (existencial, material, mental e verbal), há ainda a interação com o tipo de TOP, isto é, se os verbos pertencem às classes supracitadas e se o TOP for do tipo 2, os NPs tendem a ser sujeito, ao passo que se o TOP for do tipo 1, 3 ou flat, os NPs tendem a ser SRS. Por fim, por meio de argumentos empíricos e experimentais, propôs-se que o constituinte é o domínio da sintaxe da fala.
Abstract: This dissertation consists of three broad complementary objectives: (i) to propose a theoretical reflection and to provide necessary subsidies for a more detailed investigation of spoken syntax and (ii) to propose a case study based on what was reflected in theoretical terms, using the following methods derived from statistics and (iii) propose a domain for spoken syntax. The starting point is Language into Act Theory [L-AcT] (CRESTI, 2000) - a pragmatic theory that individualizes utterance as the reference unit of spontaneous speech. L-AcT assumes that the information structure of the utterance is signaled by prosodic breaks, which are assigned different pragmatic units with distinct functions. Topic (TOP) is one of the information units and it is defined as the scope in which the illocutionary force is to be applied. Cresti (2014) says that any kind of syntactic relation can only take place if the locutive content of the utterance is arranged within the same information unit, whereas if such content is distributed between two units, the syntactic relations cease and what emerge are the pragmatic relations arising from the respective functions of each informational unit. However, this criterion may not always occur in speech. And this is what leads us to a probabilistic overview for the study of syntax, i.e., what are the chances that elements can establish syntactic relations between information units? In addition, there needs to be some theoretical foundation that takes into account the constitutive aspects of syntactic relations, which are inherently cognitive-computational, and that is compatible with speech data, including the probabilistic dimension of language. Cognitive Grammar [CG] (LANGACKER, 2008) is a theory compatible with empirical and experimental research and has been tested along these lines. From the proposed discussion and aiming to answer the above question, we seek to apply what was reflected in a case study. Our aim was to investigate the odds that a NP in TOP would establish a subject-verb relation given some selected variables. We used three minicorpora labeled according to L-AcT parameters, extracting data from English, Brazilian Portuguese and Spanish. The statistical method used was a mixed logistic regression model with crossover random effects. Quantitative analyzes were conducted with the aid of R software (R CORE TEAM, 2018). However, we only achieved statistically significant results with Spanish data. Regression analysis with Spanish data, however, showed that there is a greater likelihood that an NP in TOP will establish a subject relationship with COM content if such NP is defined, animated, and given. Subsequently, the results were interpreted according to the CG. A provisional analysis pointed out that for the cases in which the NP is subject, there would be a congruence in the trajector alignment in TOP, both at the sentence level and at the discursive level, whereas in the non-syntactic relationship alignment only appears at the discursive level between the TOP and COM units. A conditional inferece tree model was also applied to the Spanish data. The application of the model showed that animated NPs are the subject of the COM verbs, whereas inanimate NPs have a greater interaction with the other variables. If the NPs are inanimate and the verb of the next unit is of the modulation and relational verbal classes, the NPs tend to be subject. If the verbs are from the other classes (existential, material, mental and verbal), there is still interaction with the type of TOP, i.e., if the verbs belong to the above classes and if the TOP is type 2, the NPs tend to subject, whereas if TOP is type 1, 3 or flat, NPs tend to exhibit no syntactic relation. Finally, through empirical and experimental arguments, it was proposed that the constituent is the domain of spoken syntax.
Subject: Linguistica
Sintaxe
Atos de fala (Linguística)
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: FALE - FACULDADE DE LETRAS
metadata.dc.publisher.program: Programa de Pós-Graduação em Estudos Linguísticos
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by/3.0/pt/
URI: http://hdl.handle.net/1843/33039
Issue Date: 18-Feb-2020
Appears in Collections:Teses de Doutorado



This item is licensed under a Creative Commons License Creative Commons