Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/ECID-943NXP
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Renato Rocha Souzapt_BR
dc.contributor.advisor-co1Renata Maria Abrantes Baracho Portopt_BR
dc.contributor.referee1Wagner Meira Juniorpt_BR
dc.contributor.referee2Gercina Angela Borem de Oliveira Limapt_BR
dc.creatorLuiz Antonio Lopes Mesquitapt_BR
dc.date.accessioned2019-08-12T07:31:45Z-
dc.date.available2019-08-12T07:31:45Z-
dc.date.issued2012-12-19pt_BR
dc.identifier.urihttp://hdl.handle.net/1843/ECID-943NXP-
dc.description.abstractThe main goal of this thesis was to analyze whether there was a characteristic behavior regarding the distribution of relevant terms through a scientific text that could contribute as a criterion for its automatic indexing process. The distribution was analyzed in two ways: a linear one, performed from the beginning to the end of the text; and another that considered some of its structural parts (introduction, development and conclusion). The terms considered here were only nominal phrases contained in the texts. The texts considered here are a total of 98 doctoral dissertations from the eight knowledge areas of UFMG. Initially, for each text, 20 nominal phrases were selected as candidates for descriptors. The authors of the theses, through interviews, rated the importance of each nominal phrase as a descriptor of his/her work. 77.9% of candidates were considered relevant. The descriptors relevance values were associated with their positions in the text. We analyzed the resulting values of this distribution considering two types of position: a linear one, where values were consolidated into ten equal and consecutive portions; and one considering other structural parts of the text (such as introduction, development and conclusion). All texts showed a unique and characteristic behavior, as well as a characteristic behavior when the text was related to the natural sciences or social sciences. All behaviors, including general, were characterized in polynomial equations and can be applied as a criterion for automatic indexing.pt_BR
dc.description.resumoO objetivo principal dessa dissertação foi analisar se haveria um comportamento característico de distribuição de termos relevantes ao longo de um texto científico que poderia contribuir como um critério para o processo da sua indexação automática. A distribuição foi analisada de duas formas: uma linear, realizada do início ao fim do texto; e outra que considera algumas de suas partes estruturais (introdução, desenvolvimento e conclusão). Os termos considerados aqui foram somente sintagmas nominais plenos contidos nos próprios textos. Os textos considerados foram um total de 98 teses de doutorado das oito áreas de conhecimento da UFMG. Inicialmente, para cada um dos textos, foram selecionados 20 sintagmas nominais como candidatos a descritores. Os próprios autores das teses, mediante entrevistas, avaliaram a relevância de cada um deles como descritor de suas obras. 77,9% dos candidatos foram considerados relevantes. Os valores de relevância dos descritores foram associados às suas posições no texto. Foram analisados os valores resultantes dessa distribuição considerando dois tipos de posição: uma linear, com valores consolidados em dez partes iguais e consecutivas; outro considerando partes estruturais do texto (como introdução, desenvlvimento e conclusão). Todos os textos apresentaram um comportamento característico único, assim como um comportamento característico quando estavam relacionados às ciências naturais ou às ciências sociais. Todos os comportamentos, inclusive o geral, foram caracterizados em equações polinomiais e podem ser aplicados como critério para indexação automática.pt_BR
dc.languagePortuguêspt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectSintagmas nominaispt_BR
dc.subjectIndexação automáticapt_BR
dc.subject.otherRecuperação da informaçãopt_BR
dc.subject.otherLinguagens de indexaçãopt_BR
dc.subject.otherUniversidade Federal de Minas Geraispt_BR
dc.subject.otherIndexação automaticapt_BR
dc.subject.otherCiência da informaçãopt_BR
dc.titleSintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMGpt_BR
dc.typeDissertação de Mestradopt_BR
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
mesquita__luiz_a._l._pesquisa___disserta__o___vers.10.final.pdf5.69 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.