Sintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMG

Luiz Antonio Lopes Mesquita

Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/ECID-943NXP

Full metadata record

DC Field	Value	Language
dc.contributor.advisor1	Renato Rocha Souza	pt_BR
dc.contributor.advisor-co1	Renata Maria Abrantes Baracho Porto	pt_BR
dc.contributor.referee1	Wagner Meira Junior	pt_BR
dc.contributor.referee2	Gercina Angela Borem de Oliveira Lima	pt_BR
dc.creator	Luiz Antonio Lopes Mesquita	pt_BR
dc.date.accessioned	2019-08-12T07:31:45Z	-
dc.date.available	2019-08-12T07:31:45Z	-
dc.date.issued	2012-12-19	pt_BR
dc.identifier.uri	http://hdl.handle.net/1843/ECID-943NXP	-
dc.description.abstract	The main goal of this thesis was to analyze whether there was a characteristic behavior regarding the distribution of relevant terms through a scientific text that could contribute as a criterion for its automatic indexing process. The distribution was analyzed in two ways: a linear one, performed from the beginning to the end of the text; and another that considered some of its structural parts (introduction, development and conclusion). The terms considered here were only nominal phrases contained in the texts. The texts considered here are a total of 98 doctoral dissertations from the eight knowledge areas of UFMG. Initially, for each text, 20 nominal phrases were selected as candidates for descriptors. The authors of the theses, through interviews, rated the importance of each nominal phrase as a descriptor of his/her work. 77.9% of candidates were considered relevant. The descriptors relevance values were associated with their positions in the text. We analyzed the resulting values of this distribution considering two types of position: a linear one, where values were consolidated into ten equal and consecutive portions; and one considering other structural parts of the text (such as introduction, development and conclusion). All texts showed a unique and characteristic behavior, as well as a characteristic behavior when the text was related to the natural sciences or social sciences. All behaviors, including general, were characterized in polynomial equations and can be applied as a criterion for automatic indexing.	pt_BR
dc.description.resumo	O objetivo principal dessa dissertação foi analisar se haveria um comportamento característico de distribuição de termos relevantes ao longo de um texto científico que poderia contribuir como um critério para o processo da sua indexação automática. A distribuição foi analisada de duas formas: uma linear, realizada do início ao fim do texto; e outra que considera algumas de suas partes estruturais (introdução, desenvolvimento e conclusão). Os termos considerados aqui foram somente sintagmas nominais plenos contidos nos próprios textos. Os textos considerados foram um total de 98 teses de doutorado das oito áreas de conhecimento da UFMG. Inicialmente, para cada um dos textos, foram selecionados 20 sintagmas nominais como candidatos a descritores. Os próprios autores das teses, mediante entrevistas, avaliaram a relevância de cada um deles como descritor de suas obras. 77,9% dos candidatos foram considerados relevantes. Os valores de relevância dos descritores foram associados às suas posições no texto. Foram analisados os valores resultantes dessa distribuição considerando dois tipos de posição: uma linear, com valores consolidados em dez partes iguais e consecutivas; outro considerando partes estruturais do texto (como introdução, desenvlvimento e conclusão). Todos os textos apresentaram um comportamento característico único, assim como um comportamento característico quando estavam relacionados às ciências naturais ou às ciências sociais. Todos os comportamentos, inclusive o geral, foram caracterizados em equações polinomiais e podem ser aplicados como critério para indexação automática.	pt_BR
dc.language	Português	pt_BR
dc.publisher	Universidade Federal de Minas Gerais	pt_BR
dc.publisher.initials	UFMG	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Sintagmas nominais	pt_BR
dc.subject	Indexação automática	pt_BR
dc.subject.other	Recuperação da informação	pt_BR
dc.subject.other	Linguagens de indexação	pt_BR
dc.subject.other	Universidade Federal de Minas Gerais	pt_BR
dc.subject.other	Indexação automatica	pt_BR
dc.subject.other	Ciência da informação	pt_BR
dc.title	Sintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMG	pt_BR
dc.type	Dissertação de Mestrado	pt_BR
Appears in Collections:	Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format
mesquita__luiz_a._l._pesquisa___disserta__o___vers.10.final.pdf		5.69 MB	Adobe PDF	View/Open

Show simple item record