Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/44004
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Heliana Ribeiro de Mellopt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/5724573734505786pt_BR
dc.contributor.advisor-co1Bruno Neves Rati de Melo Rochapt_BR
dc.contributor.referee1Tommaso Rasopt_BR
dc.contributor.referee2João Vinicius Salgadopt_BR
dc.contributor.referee3Waldemar Ferreira Nettopt_BR
dc.contributor.referee4Natália Bezerra Motapt_BR
dc.creatorJosé Carlos da Costa Júniorpt_BR
dc.creator.Latteshttp://lattes.cnpq.br/3336031546876937pt_BR
dc.date.accessioned2022-08-05T17:28:35Z-
dc.date.available2022-08-05T17:28:35Z-
dc.date.issued2022-02-25-
dc.identifier.urihttp://hdl.handle.net/1843/44004-
dc.description.abstractGoals: We make a comparison between the informational pattern and speech disfluencies of patients with schizophrenia and participants without this mental illness. The informational pattern represents the different arrays of information units that are found in utterances (CRESTI, 2000; RASO, 2012; MONEGLIA, RASO, 2014). We also offer a preliminary description for speech disfluencies, lexicon and part of speech of a representative sample of patients. Hypotheses: I) patients with schizophrenia could have a less varied and less complex informational pattern - given for the textual units frequency- as it was already suggested in Cresti et al (2015); II) these patients could make more speech disfluencies, as larger filled and silent pauses or more speech reformulations or interrupted utterances than people without schizophrenia. Methodology: We use 12 informational tagged transcriptions from two oral corpora - 6 of each -, namely C-ORAL-ESQ (FERRARI, ROCHA, RASO, forthcoming), which is representative of patients with schizophrenia, and C-ORAL-BRASIL minicorpus (RASO, MELLO, 2012), which is representative of spoken Brazilian Portuguese. Comparison between the two groups was based on the number of Bound Comments - COBs - a textual unit whose presence defines a terminated unit of speech as a stanza. We compare stanzas with the same number of COBs and we count other textual units around, as these last ones could suggest more complexity in speech elaboration. For this purpose, it was developed Python (VAN ROSSUM, DRAKE, 1995) applications, which are free available for users, that extract text transcriptions and normalize their spelling conventions, tag part of speech, detail word frequency and morphology, make statistical analysis, build a balanced research sample and generate charts of all variables compared automatically, among other implementations. This was built mainly with Pandas (MCKINNEY, 2010), for statistical analysis and automation; Natural Language Toolkit (BIRD et al, 2011) and buil-in libraries like re (VAN ROSSUM, 2020) for natural language processing and text mining. Results: Patients with schizophrenia made less: unique patterns, total textual units (p =0,001); Topics (p=0,01); Parenthetics (p=0,03); Locutive Introducers (p=0,01); Multiple Comments (p=0,04) among other significant results in Mann Whitney U test. Interrupted utterances were more frequent in C-ORAL-BRASIL, although patients with schizophrenia made less textual units before their interruption. Retractings, for their turn, presented different frequency patterns in both groups, though they were less frequent in patient’s speech in the most relevant samples, with similar number of syllables and distribution of the first phonetic segment. Regarding pauses, it was observed that patients made them longer than no patients, both for silent (p<0,01) as for filled pauses, though these last ones had no statistical significance. Therefore, we claim that patients with schizophrenia have less elaborated speech from the point of view of the information pattern – hence less varied melodically - as well as they have more speech disfluencies in the considered variables overall.pt_BR
dc.description.resumoObjetivos: Fazer uma comparação entre o padrão informacional e disfluências da fala de pacientes com esquizofrenia e participantes sem essa condição. Esses padrões representam os possíveis arranjos de unidades informacionais encontrados em enunciados (CRESTI, 2000; RASO, 2012; MONEGLIA, RASO, 2014). Além disso, é proposta uma descrição preliminar das medidas da fala, léxico e classes de palavras desses pacientes. Hipóteses: I) indivíduos com esquizofrenia possuiriam padrão informacional menos variado e complexo – medido pela quantidade de unidades textuais do enunciado - do que indivíduos sem esquizofrenia, tal como foi sugerido em Cresti et al (2015) II) esses pacientes realizariam mais disfluências, como pausas preenchidas e silenciosas com maior duração, maior quantidade de reformulações e enunciados interrompidos do que os participantes sem esquizofrenia. Metodologia: Foram utilizados dois corpora orais representativos de suas populações, C-ORAL-ESQ (FERRARI; ROCHA; RASO, em construção), e minicorpus de monólogos do C-ORAL-BRASIL (RASO; MELLO, 2012), a partir dos quais foram selecionados seis textos etiquetados informacionalmente em cada corpus. O parâmetro de comparação entre os grupos é a quantidade de Comentários Ligados – COBs – unidade informacional textual cuja presença categoriza uma unidade terminada da fala como stanza. Dessa forma, são comparadas stanzas com igual quantidade de COBs e contabilizadas as outras unidades textuais, uma vez que a presença dessas indicaria a complexidade maior ou menor de elaboração da fala. Para isso, foram desenvolvidos programas em linguagem Python (VAN ROSSUM, DRAKE, 1995), disponibilizados para outros usuários e pesquisas, que extraem o texto das transcrições, contam todas as etiquetas e disfluências, transformam português semiortográfico em padrão, etiquetam com classes gramaticais detalhando sua morfologia e frequência; fazem análise estatística, criam corpus de pesquisa balanceado e geram visualizações de todas as variáveis comparadas entre os grupos automaticamente, entre outras implementações. Isso foi realizado principalmente com o auxílio de bibliotecas como o Pandas (MCKINNEY, 2010), para análise estatística e automação, Natural Language Toolkit (BIRD et al, 2011) e re (VAN ROSSUM, 2020) para processamento de linguagem natural e mineração de texto. Resultados: Pacientes com esquizofrenia realizaram menos: padrões únicos, unidades textuais totais (p = 0,001); Tópicos (p = 0,01); Parentéticos (p =0,03), Introdutores Locutivos (p =0,01), Comentários Múltiplos (p = 0,04) entre outros resultados estatisticamente significativos no teste U de Mann Whitney, em diferentes amostras. Enunciados interrompidos foram mais frequentes no C-ORAL-BRASIL, mas foi constatado que os pacientes realizaram menos unidades textuais antes de sua interrupção. Retractings, por sua vez, tiveram registro variado nas amostras, mas foram mais frequentes no C-ORAL-BRASIL, com similar distribuição de sua dimensão silábica e segmento inicial. Quanto às pausas, foi verificado que os participantes do C-ORAL-ESQ as realiza com maior duração tanto para as silenciosas (p < 0,01) quanto para as preenchidas, embora esta última não tenha significância estatística. Portanto, é defendido que pacientes com esquizofrenia possuem fala menos elaborada do ponto de vista informacional – e consequentemente menos variada melodicamente -, além de terem mais disfluências nas variáveis medidas de uma forma geral.pt_BR
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológicopt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentFALE - FACULDADE DE LETRASpt_BR
dc.publisher.programPrograma de Pós-Graduação em Estudos Linguísticospt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Abertopt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/pt/*
dc.subjectEsquizofreniapt_BR
dc.subjectPadrão informacionalpt_BR
dc.subjectTeoria da Língua em Atopt_BR
dc.subjectComparação entre corpora oraispt_BR
dc.subjectProcessamento de linguagem natural - PLNpt_BR
dc.subject.otherAtos de fala (Linguística)pt_BR
dc.subject.otherEsquizofreniapt_BR
dc.subject.otherLinguísticapt_BR
dc.titlePadrão informacional de stanzas de pacientes com esquizofreniapt_BR
dc.title.alternativeInformational pattern of stanzas of patients with schizophreniapt_BR
dc.typeTesept_BR
dc.identifier.orcid0000-0001-8265-4195pt_BR
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
padrao_informacional_de_stanzas_de_pessoas_com_esquizofrenia.pdf4.82 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons