Sentiment analysis in Portuguese texts from online health community forums: data, model and evaluation

dc.creatorYohan Bonescki Gumiel
dc.creatorIsabela Lee
dc.creatorTayane Arantes Soares
dc.creatorThiago Castro Ferreira
dc.creatorAdriana Silvina Pagano
dc.date.accessioned2024-03-21T19:22:57Z
dc.date.accessioned2025-09-09T00:31:15Z
dc.date.available2024-03-21T19:22:57Z
dc.date.issued2021-11-29
dc.description.abstractEste estudo apresenta dados e modelos para a Análise de Sentimentos de textos em português sobre Diabetes Mellitus. O corpus ́e composto por 1290 posts, extraídos de forums online sobre tópicos de saúde e anotados por dois estudantes de acordo com 3 categorias (e.g. Positivo, Neutro e Negativo). A avaliação de classificadores de Aprendizagem de Máquina (classificadores Support Vector Machine, Decision Tree, Random Forest e Logistic Regression) tradicionais e estado-da-arte (modelos baseados em BERT) mostrou a vantagem em performance do segundo tipo como esperado. Os dados e modelos estão disponíveis para a comunidade por meio de solicitação.
dc.format.mimetypepdf
dc.identifier.doihttps://doi.org/10.5753/stil.2021.17785
dc.identifier.urihttps://hdl.handle.net/1843/66344
dc.languageeng
dc.publisherUniversidade Federal de Minas Gerais
dc.relation.ispartofSimpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana
dc.rightsAcesso Aberto
dc.subjectRedes sociais on-line
dc.subjectLinguística de corpus
dc.subjectLinguística - Processamento de dados
dc.titleSentiment analysis in Portuguese texts from online health community forums: data, model and evaluation
dc.typeArtigo de evento
local.citation.epage72
local.citation.issue13
local.citation.spage64
local.description.resumoThis study introduces novel data and models for the task of Sentiment Analysis in Portuguese texts about Diabetes Mellitus. The corpus contains1290 posts retrieved from online health community forums in Portuguese and annotated by two annotators according to 3 sentiment categories (e.g. Positive, Neutral and Negative). Evaluation of traditional (Support Vector Machine, Decision Tree, Random Forest and Logistic Regression classifiers) and state-of-the-art (BERT-based models) machine learning classifiers for the task showed the advantage in performance of the latter models as expected. Data and models are available to the community upon request.
local.identifier.orcidhttps://orcid.org/0000-0001-8239-2930
local.identifier.orcidhttps://orcid.org/0000-0002-8548-7625
local.identifier.orcidhttps://orcid.org/0009-0002-8315-4090
local.identifier.orcidhttps://orcid.org/0000-0003-0200-3646
local.identifier.orcidhttps://orcid.org/0000-0002-3150-3503
local.publisher.countryBrasil
local.publisher.departmentFALE - FACULDADE DE LETRAS
local.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initialsUFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Sentiment analysis in Portuguese texts from online health community forums data, model and evaluation.pdf
Tamanho:
158.03 KB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
License.txt
Tamanho:
1.99 KB
Formato:
Plain Text
Descrição: