Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/BUOS-9RQHC6
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Renato Rocha Souzapt_BR
dc.contributor.referee1Flavio Codeco Coelhopt_BR
dc.contributor.referee2Luiz Claudio Gomes Maiapt_BR
dc.contributor.referee3Manoel Palhares Moreirapt_BR
dc.contributor.referee4Heliana Ribeiro de Mellopt_BR
dc.contributor.referee5Maria Aparecida Mourapt_BR
dc.creatorAgnaldo Lopes Martinspt_BR
dc.date.accessioned2019-08-10T01:18:50Z-
dc.date.available2019-08-10T01:18:50Z-
dc.date.issued2014-08-18pt_BR
dc.identifier.urihttp://hdl.handle.net/1843/BUOS-9RQHC6-
dc.description.abstractThis thesis aimed to evaluate the use of the noun phrase as a data source for an automatic classification of text documents stored in digital format. Various technological tools that have transformed scientific articles in a list of noun phrases that have been used for a classifier system based on supervised learning training. Among the tools used the words were responsible for the identification and removal of noun phrases of corporas. For training the classifier machine the application SVMLight was used. The methodology was developed in two stages; the first qualitative test was performed when comparing the documents of the corpus; and in the second stage SVM training was conducted using a larger number of documents. At the end, several tests were performed and it is possible to demonstrate that the proposed methodology was able to classify documents with high precision.pt_BR
dc.description.resumoEsta tese objetivou avaliar o uso do sintagma nominal como fonte de dados para um sistema automático de classificação de documentos textuais armazenados no formato digital. Foram utilizadas diversas ferramentas tecnológicas que transformaram artigos científicos em uma lista de sintagmas nominais que foram utilizados para treinamento de um sistema classificador baseado em treinamento supervisionado. Dentre as ferramentas utilizadas o software Palavras foi o responsável pela identificação e remoção dos sintagmas nominais dos corporas utilizados. Para treinamento da máquina classificadora foi utilizado o aplicativo SVMLight. A metodologia foi desenvolvida em duas etapas; na primeira foi realizado um teste qualitativo na comparação entre os documentos do corpus; e na segunda etapa foi realizado o treinamento utilizando SVM com um número maior de documentos. Ao final, vários testes foram realizados sendo possível demonstrar que a metodologia proposta foi capaz de classificar documentos com alta precisão.pt_BR
dc.languagePortuguêspt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectProcessamento da linguagem naturalpt_BR
dc.subjectSintagmas nominaispt_BR
dc.subjectClassificação de documentospt_BR
dc.subjectSistemas de recuperação da informaçãopt_BR
dc.subject.otherIndexação automáticapt_BR
dc.subject.otherSistemas de recuperação da informaçãopt_BR
dc.subject.otherCiência da informaçãopt_BR
dc.subject.otherProcessamento da linguagem natural (Computação)pt_BR
dc.titleO uso do sintagma nominal na recuperação de documentos: proposta de um mecanismo automático para classificação temática de textos digitaispt_BR
dc.typeTese de Doutoradopt_BR
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
tese_doutorado___entregue_no_cd_em_28112014.pdf3.08 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.