Aviso de indisponibilidade temporária do RI

Informamos que o Repositório Institucional da UFMG está temporariamente fora do ar em virtude do processo de migração para uma nova versão da plataforma DSpace. Durante esse período, o acesso ao site permanecerá indisponível.

Caso necessite, com comprovada urgência, da declaração de entrega do trabalho acadêmico, entre em contato pelo e-mail:
repositorio-trabacad@servicos.ufmg.br

O uso do sintagma nominal na recuperação de documentos: proposta de um mecanismo automático para classificação temática de textos digitais

dc.creatorAgnaldo Lopes Martins
dc.date.accessioned2019-08-10T01:18:50Z
dc.date.accessioned2025-09-08T23:09:32Z
dc.date.available2019-08-10T01:18:50Z
dc.date.issued2014-08-18
dc.description.abstractThis thesis aimed to evaluate the use of the noun phrase as a data source for an automatic classification of text documents stored in digital format. Various technological tools that have transformed scientific articles in a list of noun phrases that have been used for a classifier system based on supervised learning training. Among the tools used the words were responsible for the identification and removal of noun phrases of corporas. For training the classifier machine the application SVMLight was used. The methodology was developed in two stages; the first qualitative test was performed when comparing the documents of the corpus; and in the second stage SVM training was conducted using a larger number of documents. At the end, several tests were performed and it is possible to demonstrate that the proposed methodology was able to classify documents with high precision.
dc.identifier.urihttps://hdl.handle.net/1843/BUOS-9RQHC6
dc.languagePortuguês
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectIndexação automática
dc.subjectSistemas de recuperação da informação
dc.subjectCiência da informação
dc.subjectProcessamento da linguagem natural (Computação)
dc.subject.otherProcessamento da linguagem natural
dc.subject.otherSintagmas nominais
dc.subject.otherClassificação de documentos
dc.subject.otherSistemas de recuperação da informação
dc.titleO uso do sintagma nominal na recuperação de documentos: proposta de um mecanismo automático para classificação temática de textos digitais
dc.typeTese de doutorado
local.contributor.advisor1Renato Rocha Souza
local.contributor.referee1Flavio Codeco Coelho
local.contributor.referee1Luiz Claudio Gomes Maia
local.contributor.referee1Manoel Palhares Moreira
local.contributor.referee1Heliana Ribeiro de Mello
local.contributor.referee1Maria Aparecida Moura
local.description.resumoEsta tese objetivou avaliar o uso do sintagma nominal como fonte de dados para um sistema automático de classificação de documentos textuais armazenados no formato digital. Foram utilizadas diversas ferramentas tecnológicas que transformaram artigos científicos em uma lista de sintagmas nominais que foram utilizados para treinamento de um sistema classificador baseado em treinamento supervisionado. Dentre as ferramentas utilizadas o software Palavras foi o responsável pela identificação e remoção dos sintagmas nominais dos corporas utilizados. Para treinamento da máquina classificadora foi utilizado o aplicativo SVMLight. A metodologia foi desenvolvida em duas etapas; na primeira foi realizado um teste qualitativo na comparação entre os documentos do corpus; e na segunda etapa foi realizado o treinamento utilizando SVM com um número maior de documentos. Ao final, vários testes foram realizados sendo possível demonstrar que a metodologia proposta foi capaz de classificar documentos com alta precisão.
local.publisher.initialsUFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
tese_doutorado___entregue_no_cd_em_28112014.pdf
Tamanho:
3.01 MB
Formato:
Adobe Portable Document Format