Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/ECID-943NXP
Tipo: Dissertação de Mestrado
Título: Sintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMG
Autor(es): Luiz Antonio Lopes Mesquita
Primeiro Orientador: Renato Rocha Souza
Primeiro Coorientador: Renata Maria Abrantes Baracho Porto
Primeiro membro da banca : Wagner Meira Junior
Segundo membro da banca: Gercina Angela Borem de Oliveira Lima
Resumo: O objetivo principal dessa dissertação foi analisar se haveria um comportamento característico de distribuição de termos relevantes ao longo de um texto científico que poderia contribuir como um critério para o processo da sua indexação automática. A distribuição foi analisada de duas formas: uma linear, realizada do início ao fim do texto; e outra que considera algumas de suas partes estruturais (introdução, desenvolvimento e conclusão). Os termos considerados aqui foram somente sintagmas nominais plenos contidos nos próprios textos. Os textos considerados foram um total de 98 teses de doutorado das oito áreas de conhecimento da UFMG. Inicialmente, para cada um dos textos, foram selecionados 20 sintagmas nominais como candidatos a descritores. Os próprios autores das teses, mediante entrevistas, avaliaram a relevância de cada um deles como descritor de suas obras. 77,9% dos candidatos foram considerados relevantes. Os valores de relevância dos descritores foram associados às suas posições no texto. Foram analisados os valores resultantes dessa distribuição considerando dois tipos de posição: uma linear, com valores consolidados em dez partes iguais e consecutivas; outro considerando partes estruturais do texto (como introdução, desenvlvimento e conclusão). Todos os textos apresentaram um comportamento característico único, assim como um comportamento característico quando estavam relacionados às ciências naturais ou às ciências sociais. Todos os comportamentos, inclusive o geral, foram caracterizados em equações polinomiais e podem ser aplicados como critério para indexação automática.
Abstract: The main goal of this thesis was to analyze whether there was a characteristic behavior regarding the distribution of relevant terms through a scientific text that could contribute as a criterion for its automatic indexing process. The distribution was analyzed in two ways: a linear one, performed from the beginning to the end of the text; and another that considered some of its structural parts (introduction, development and conclusion). The terms considered here were only nominal phrases contained in the texts. The texts considered here are a total of 98 doctoral dissertations from the eight knowledge areas of UFMG. Initially, for each text, 20 nominal phrases were selected as candidates for descriptors. The authors of the theses, through interviews, rated the importance of each nominal phrase as a descriptor of his/her work. 77.9% of candidates were considered relevant. The descriptors relevance values were associated with their positions in the text. We analyzed the resulting values of this distribution considering two types of position: a linear one, where values were consolidated into ten equal and consecutive portions; and one considering other structural parts of the text (such as introduction, development and conclusion). All texts showed a unique and characteristic behavior, as well as a characteristic behavior when the text was related to the natural sciences or social sciences. All behaviors, including general, were characterized in polynomial equations and can be applied as a criterion for automatic indexing.
Assunto: Recuperação da informação
Linguagens de indexação
Universidade Federal de Minas Gerais
Indexação automatica
Ciência da informação
Idioma: Português
Editor: Universidade Federal de Minas Gerais
Sigla da Instituição: UFMG
Tipo de Acesso: Acesso Aberto
URI: http://hdl.handle.net/1843/ECID-943NXP
Data do documento: 19-Dez-2012
Aparece nas coleções:Dissertações de Mestrado

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
mesquita__luiz_a._l._pesquisa___disserta__o___vers.10.final.pdf5.69 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.