Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/ECID-7NXJKZ
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Renato Rocha Souzapt_BR
dc.contributor.referee1George Leal Jamilpt_BR
dc.contributor.referee2Marcello Peixoto Baxpt_BR
dc.contributor.referee3Beatriz Valadares Cendonpt_BR
dc.contributor.referee4Manoel Palhares Moreirapt_BR
dc.creatorLuiz Claudio Gomes Maiapt_BR
dc.date.accessioned2019-08-13T18:47:13Z-
dc.date.available2019-08-13T18:47:13Z-
dc.date.issued2008-12-12pt_BR
dc.identifier.urihttp://hdl.handle.net/1843/ECID-7NXJKZ-
dc.description.abstractThis research work presents a proposal for the classification of electronic documents using techniques and algorithms based on natural language processing and noun phrases indexing along with plain keywords. Two tools, OGMA and Weka, were used for the experiments proposed. OGMA was developed by the author to automate the extraction of noun phrases and to perform the calculation of the weight of each termin the process of document indexing for each of the six proposed methods. The WEKA was used to analyze the OGMA results using the algorithms of clustering and classification "Simplekmeans" and "NaiveBayes", respectively. This process resulted in a percentage value indicating how many documents were classified correctly. The bestperforming methods were those with the terms without stopwords and the classified and scored noun phrases.pt_BR
dc.description.resumoEsta pesquisa verificou se ocorre aprimoramento na classificação de documentos eletrônicos com o uso de técnicas e algoritmos de mineração de texto (análise de texto) utilizando além das palavras, sintagmas nominais como indexadores. Utilizaram-se duas ferramentas nos experimentos propostos desta pesquisa o OGMA e a WEKA. O OGMA foi desenvolvido pelo autor para automatizar a extração dos sintagmas nominas e o cálculo do peso de cada termo na indexação dos documentos para cada um dos seis métodos propostos. A WEKA foi utilizada analisar os resultados encontrados pelo OGMA utilizando aos algoritmos de agrupamento e classificação, simplekmeans e NaiveBayes, respectivamente, obtendo um valor percentual indicando quantos documentos foram classificados corretamente. Os métodos com melhores resultados foram o de termos sem stopwords e o de sintagmas nominais classificados e pontuados como descritores.pt_BR
dc.languagePortuguêspt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectautomáticapt_BR
dc.subjectIndexaçãopt_BR
dc.subjectSintagmas nominaspt_BR
dc.subjectAnálise de textopt_BR
dc.subjectAgrupamento automático de documentospt_BR
dc.subject.otherIndexação automaticapt_BR
dc.subject.otherCiência da informaçãopt_BR
dc.subject.otherSistemas de recuperação da informaçãopt_BR
dc.subject.otherProcessamento da linguagem natural (Computação)pt_BR
dc.titleUso de sintagmas nominais na classificação automática de documentos eletrônicospt_BR
dc.typeTese de Doutoradopt_BR
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
tesefinal.pdf6.33 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.