Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/44004
Type: Tese
Title: Padrão informacional de stanzas de pacientes com esquizofrenia
Other Titles: Informational pattern of stanzas of patients with schizophrenia
Authors: José Carlos da Costa Júnior
First Advisor: Heliana Ribeiro de Mello
First Co-advisor: Bruno Neves Rati de Melo Rocha
First Referee: Tommaso Raso
Second Referee: João Vinicius Salgado
Third Referee: Waldemar Ferreira Netto
metadata.dc.contributor.referee4: Natália Bezerra Mota
Abstract: Objetivos: Fazer uma comparação entre o padrão informacional e disfluências da fala de pacientes com esquizofrenia e participantes sem essa condição. Esses padrões representam os possíveis arranjos de unidades informacionais encontrados em enunciados (CRESTI, 2000; RASO, 2012; MONEGLIA, RASO, 2014). Além disso, é proposta uma descrição preliminar das medidas da fala, léxico e classes de palavras desses pacientes. Hipóteses: I) indivíduos com esquizofrenia possuiriam padrão informacional menos variado e complexo – medido pela quantidade de unidades textuais do enunciado - do que indivíduos sem esquizofrenia, tal como foi sugerido em Cresti et al (2015) II) esses pacientes realizariam mais disfluências, como pausas preenchidas e silenciosas com maior duração, maior quantidade de reformulações e enunciados interrompidos do que os participantes sem esquizofrenia. Metodologia: Foram utilizados dois corpora orais representativos de suas populações, C-ORAL-ESQ (FERRARI; ROCHA; RASO, em construção), e minicorpus de monólogos do C-ORAL-BRASIL (RASO; MELLO, 2012), a partir dos quais foram selecionados seis textos etiquetados informacionalmente em cada corpus. O parâmetro de comparação entre os grupos é a quantidade de Comentários Ligados – COBs – unidade informacional textual cuja presença categoriza uma unidade terminada da fala como stanza. Dessa forma, são comparadas stanzas com igual quantidade de COBs e contabilizadas as outras unidades textuais, uma vez que a presença dessas indicaria a complexidade maior ou menor de elaboração da fala. Para isso, foram desenvolvidos programas em linguagem Python (VAN ROSSUM, DRAKE, 1995), disponibilizados para outros usuários e pesquisas, que extraem o texto das transcrições, contam todas as etiquetas e disfluências, transformam português semiortográfico em padrão, etiquetam com classes gramaticais detalhando sua morfologia e frequência; fazem análise estatística, criam corpus de pesquisa balanceado e geram visualizações de todas as variáveis comparadas entre os grupos automaticamente, entre outras implementações. Isso foi realizado principalmente com o auxílio de bibliotecas como o Pandas (MCKINNEY, 2010), para análise estatística e automação, Natural Language Toolkit (BIRD et al, 2011) e re (VAN ROSSUM, 2020) para processamento de linguagem natural e mineração de texto. Resultados: Pacientes com esquizofrenia realizaram menos: padrões únicos, unidades textuais totais (p = 0,001); Tópicos (p = 0,01); Parentéticos (p =0,03), Introdutores Locutivos (p =0,01), Comentários Múltiplos (p = 0,04) entre outros resultados estatisticamente significativos no teste U de Mann Whitney, em diferentes amostras. Enunciados interrompidos foram mais frequentes no C-ORAL-BRASIL, mas foi constatado que os pacientes realizaram menos unidades textuais antes de sua interrupção. Retractings, por sua vez, tiveram registro variado nas amostras, mas foram mais frequentes no C-ORAL-BRASIL, com similar distribuição de sua dimensão silábica e segmento inicial. Quanto às pausas, foi verificado que os participantes do C-ORAL-ESQ as realiza com maior duração tanto para as silenciosas (p < 0,01) quanto para as preenchidas, embora esta última não tenha significância estatística. Portanto, é defendido que pacientes com esquizofrenia possuem fala menos elaborada do ponto de vista informacional – e consequentemente menos variada melodicamente -, além de terem mais disfluências nas variáveis medidas de uma forma geral.
Abstract: Goals: We make a comparison between the informational pattern and speech disfluencies of patients with schizophrenia and participants without this mental illness. The informational pattern represents the different arrays of information units that are found in utterances (CRESTI, 2000; RASO, 2012; MONEGLIA, RASO, 2014). We also offer a preliminary description for speech disfluencies, lexicon and part of speech of a representative sample of patients. Hypotheses: I) patients with schizophrenia could have a less varied and less complex informational pattern - given for the textual units frequency- as it was already suggested in Cresti et al (2015); II) these patients could make more speech disfluencies, as larger filled and silent pauses or more speech reformulations or interrupted utterances than people without schizophrenia. Methodology: We use 12 informational tagged transcriptions from two oral corpora - 6 of each -, namely C-ORAL-ESQ (FERRARI, ROCHA, RASO, forthcoming), which is representative of patients with schizophrenia, and C-ORAL-BRASIL minicorpus (RASO, MELLO, 2012), which is representative of spoken Brazilian Portuguese. Comparison between the two groups was based on the number of Bound Comments - COBs - a textual unit whose presence defines a terminated unit of speech as a stanza. We compare stanzas with the same number of COBs and we count other textual units around, as these last ones could suggest more complexity in speech elaboration. For this purpose, it was developed Python (VAN ROSSUM, DRAKE, 1995) applications, which are free available for users, that extract text transcriptions and normalize their spelling conventions, tag part of speech, detail word frequency and morphology, make statistical analysis, build a balanced research sample and generate charts of all variables compared automatically, among other implementations. This was built mainly with Pandas (MCKINNEY, 2010), for statistical analysis and automation; Natural Language Toolkit (BIRD et al, 2011) and buil-in libraries like re (VAN ROSSUM, 2020) for natural language processing and text mining. Results: Patients with schizophrenia made less: unique patterns, total textual units (p =0,001); Topics (p=0,01); Parenthetics (p=0,03); Locutive Introducers (p=0,01); Multiple Comments (p=0,04) among other significant results in Mann Whitney U test. Interrupted utterances were more frequent in C-ORAL-BRASIL, although patients with schizophrenia made less textual units before their interruption. Retractings, for their turn, presented different frequency patterns in both groups, though they were less frequent in patient’s speech in the most relevant samples, with similar number of syllables and distribution of the first phonetic segment. Regarding pauses, it was observed that patients made them longer than no patients, both for silent (p<0,01) as for filled pauses, though these last ones had no statistical significance. Therefore, we claim that patients with schizophrenia have less elaborated speech from the point of view of the information pattern – hence less varied melodically - as well as they have more speech disfluencies in the considered variables overall.
Subject: Atos de fala (Linguística)
Esquizofrenia
Linguística
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: FALE - FACULDADE DE LETRAS
metadata.dc.publisher.program: Programa de Pós-Graduação em Estudos Linguísticos
Rights: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI: http://hdl.handle.net/1843/44004
Issue Date: 25-Feb-2022
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
padrao_informacional_de_stanzas_de_pessoas_com_esquizofrenia.pdf4.82 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons