Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/1843/66344
Tipo: | Artigo de Evento |
Título: | Sentiment analysis in Portuguese texts from online health community forums: data, model and evaluation |
Autor(es): | Yohan Bonescki Gumiel Isabela Lee Tayane Arantes Soares Thiago Castro Ferreira Adriana Silvina Pagano |
Resumo: | This study introduces novel data and models for the task of Sentiment Analysis in Portuguese texts about Diabetes Mellitus. The corpus contains1290 posts retrieved from online health community forums in Portuguese and annotated by two annotators according to 3 sentiment categories (e.g. Positive, Neutral and Negative). Evaluation of traditional (Support Vector Machine, Decision Tree, Random Forest and Logistic Regression classifiers) and state-of-the-art (BERT-based models) machine learning classifiers for the task showed the advantage in performance of the latter models as expected. Data and models are available to the community upon request. |
Abstract: | Este estudo apresenta dados e modelos para a Análise de Sentimentos de textos em português sobre Diabetes Mellitus. O corpus ́e composto por 1290 posts, extraídos de forums online sobre tópicos de saúde e anotados por dois estudantes de acordo com 3 categorias (e.g. Positivo, Neutro e Negativo). A avaliação de classificadores de Aprendizagem de Máquina (classificadores Support Vector Machine, Decision Tree, Random Forest e Logistic Regression) tradicionais e estado-da-arte (modelos baseados em BERT) mostrou a vantagem em performance do segundo tipo como esperado. Os dados e modelos estão disponíveis para a comunidade por meio de solicitação. |
Assunto: | Redes sociais on-line Linguística de corpus Linguística - Processamento de dados |
Idioma: | eng |
País: | Brasil |
Editor: | Universidade Federal de Minas Gerais |
Sigla da Instituição: | UFMG |
Departamento: | FALE - FACULDADE DE LETRAS ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO |
Tipo de Acesso: | Acesso Aberto |
Identificador DOI: | https://doi.org/10.5753/stil.2021.17785 |
URI: | http://hdl.handle.net/1843/66344 |
Data do documento: | 29-Nov-2021 |
metadata.dc.relation.ispartof: | Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana |
Aparece nas coleções: | Artigo de Evento |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Sentiment analysis in Portuguese texts from online health community forums data, model and evaluation.pdf | 158.03 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.