UNIVERSIDADE FEDERAL DE MINAS GERAIS ESCOLA DE CIÊNCIA DA INFORMAÇÃO Benildes Coura Moreira dos Santos Maculan ESTUDO E APLICAÇÃO DE METODOLOGIA PARA REENGENHARIA DE TESAURO: REMODELAGEM DO THESAGRO Belo Horizonte Junho, 2015 Benildes Coura Moreira dos Santos Maculan ESTUDO E APLICAÇÃO DE METODOLOGIA PARA REENGENHARIA DE TESAURO: REMODELAGEM DO THESAGRO Documento apresentado à banca de defesa de tese no Programa de Pós-Graduação em Ciência da Informação da Escola de Ciência da Informação da Universidade Federal de Minas Gerais, como requisito normativo para título de Doutor. Linha de Pesquisa: Organização e Uso da Informação Orientadora: Gercina A. B. de O. Lima Belo Horizonte Junho, 2015 M175e 2015 Maculan, Benildes Coura Moreira dos Santos Estudo e aplicação de metodologia para reengenharia de tesauro : remodelagem do THESAGRO [manuscrito]. / Benildes Coura Moreira dos Santos Maculan. – 2015. 345f. : enc. Orientadora: Gercina Ângela Borém de Oliveira Lima. Tese (Doutorado) – Universidade Federal de Minas Gerais, Escola de Ciência da Informação. Bibliografia: f. 249 1. Organização da informação. 2. Sistema de organização do conhecimento. 3. Reengenharia de tesauro. 4. Tesauro. 5. Modelagem conceitual. 6. Recuperação da informação. Modelo de conversão de tesauro. I. Lima, Gercina Ângela Borém de Oliveira. II. Universidade Federal de Minas Gerais, Escola de Ciência da Informação. III. Título. CDU: 025.49:004.55 AGRADECIMENTOS Ào meu Deus Superior, que me conforta e energiza: sou grata pelo muito que tenho! À minha orientadora, Gercina Lima, um grande e especial agradecimento por sua solidária, atenciosa e generosa orientação nesta pesquisa e por ser um modelo de pesquisadora comprometida e dedicada. Obrigada pelo incentivo, amizade e por tornar a jornada menos tormentosa, com as tantas, constantes e infindáveis leituras, sempre tão valiosas! Ao querido Ivo Pierozzi, que tão bem representou a Embrapa, meu especial agradecimento por sua inegável competência, pela parceria e pela oportunidade de trabalhar com algo tangível, assim como pela inestimável dedicação nesta pesquisa, pelas muitas conversas esclarecedoras sobre a Agropecuária e pela paciência nessas explicações. Ao Leandro Oliveira, meu tecnólogo preferido, por sua preciosa contribuição, seriedade e empenho, principalmente com o sistema e-Termos. I am specially indebted to Dagobert Soergel: please accept my sincere gratitude for your valuable contribution to my research. Ao meu pai (in memorium) e à minha mãe, por seu exemplo, compreensão e torcida. Ao meu filho Sandro, com quem desfruto de uma sintonia e afinidades impagáveis, a quem admiro a inteligência, clareza de ideias e lealdade. Obrigada pelos conselhos “infalíveis” e pelos elogios com os quais sinto o seu carinho: te amo! E à Bela, agora parte da família, tão alegre, gentil e amiga: “cia” para toda hora! À querida Patrícia, sempre tão presente e atenciosa, e ao Serginho, meus filhos por afeição. E ao Xande, por sua atenção e consideração: não tem preço! Às lindas e meigas Aninha e Ariadne! À Tininha, mais que estimada e querida irmã, uma filha por afeto. Obrigada pela torcida, incentivo e o apoio de sempre. E ao Wagner, pela amizade e carinho sem medida, assim como pela dedicação ao meu abstract. Obrigada pelos lindos, queridos e adorados sobrinhos: Nico e Ian. Em especial, ao meu afilhado Nico, tão lindo, inteligente e amado! À Libéria, meu anjo da guarda, sempre cuidando de mim. Obrigada pelas muitas idas e vindas com o meu texto para revisão! À irmã Isabel, e aos sobrinhos Felipe e Lucas: obrigada pela diversão, por passarem embaraços comigo, pelas gargalhadas por piadas sem graça, por “agirem naturalmente” sempre, por mais ridícula que seja a situação. À minha família, tão numerosa: irmãos, irmãs, cunhados, cunhadas, sobrinhos e sobrinhas, namoradas e namorados, e agregados: adoro todos vocês! À turma de amigos do Sandro, que verdadeiramente estimo, valorizo e aprecio. Adoro a companhia e o convívio com vocês! Isso me revigora! À Noca, amiga que sempre cuida de mim; e aos amigos dos tempos memoráveis em Monlé. Ao marco ECI em minha vida, desde o curso de Biblioteconomia, pelos muitos professores que me instigaram dentro e fora da sala de aula! Na trajetória até aqui, passando pelo Mestrado, encontrei amigos, desafios e um mundo acadêmico que me enlaçou. À profa. Marlene, primeira incentivadora; à profa. Beatriz, primeira orientadora, que me fez querer mais; à profa. Adriana Bogliolo, que me estimulou a escrever o primeiro artigo. Ao prof. Maurício, a quem admiro pelo exemplo de pesquisador dedicado, obrigada por fazer parte de meu percurso acadêmico: como professor, nas bancas de meu mestrado e concurso para professora da ECI, e, agora, na defesa deste doutorado. Aos professores do DOTI, que cobriram minhas disciplinas para que pudesse me dedicar integralmente à pesquisa nos últimos 12 meses. À lindinha Lucimary, pela sua eficiência e por toda a atenção e carinho, tão inestimáveis. Aos funcionários e colaboradores da ECI, em especial à Eliedir, Vanda, Claudinha, Roberto, Sônia, Célio, à equipe do LTI, e tantos outros que, direta ou indiretamente, tornaram meu caminho mais agradável e menos conflituoso. À Carol Cota, linda e estimada amiga, sempre generosa e presente nas horas mais importantes. Que leu, palpitou e normalizou este trabalho, de novo!! Em quem confio e que implica comigo, mas que atende aos meus pedidos de última hora: nunca falha! Vale ouro! À Fernanda, valiosa amiga, de qualquer hora, pelos momentos divididos, pelas confidências e pelas alegrias multiplicadas. À Graciane, querida amiga, tão determinada, esforçada e competente! Alma boa! Ao Diplofundão, turma espetacular de bibliotecários, amigos de jornada, especialmente à querida e admirável Admildes (in memoriam), que tão cedo cumpriu sua missão entre nós. Aos colegas do MHTX, entre bolsistas e orientandos, pelo enriquecimento advindo das calorosas discussões e compartilhamento de conhecimento. À Érica Sarsur, pelas correções, pontuações e melhoras linguísticas neste texto. Às colegas da UFSCAR, Gladis Almeida e Dayse Kamikawachi, assim como aos bolsistas do projeto INTAGRO, pelo fundamental apoio nas atividades terminológicas, especialmente nas definições e pelos apontamentos sobre a bibliografia estudada. Aos amigos da Biblioteca Etelvina Lima, especialmente à Elaine, Maianna, Vívian e Fernando, pela amizade e pelo constante e competente suporte. À Secretaria do PPGCI, Nely, Gisele e Carolina, pela competência do trabalho e pelo constante apoio e ao atendimento de excelência. Vocês são demais! Aos integrantes da Banca de Defesa desta Tese, ao Doutor Ivo Pierozzi Jr. e aos professores e Doutores Célia Dias, Cíntia de A. Lourenço, Lídia Alvarenga, Eduardo Wense e Maurício B. Almeida, que muito me honraram pela participação e por suas contribuições. À Embrapa, pelos insumos instrumentais fornecidos e aplicados nesta pesquisa. À CAPES e ao CNPq, pelo auxílio financeiro durante parte do desenvolvimento deste estudo. À FAPEMIG, pelo apoio com bolsas de Iniciação Científica. OFEREÇO À minha orientadora, Gercina Lima, Pela dedicação e comprometimento, Principalmente por acordar em mim a vocação para a pesquisa! DEDICO Ao meu filho Sandro, que sempre me encanta, desafia e estimula. Ao meu pai (in memoriam); à minha mãe, pela compreensão; à Patrícia e Tininha. Enquanto estiver vivo, sinta-se vivo. Se sentir saudades do que fazia, volte a fazê-lo. Não viva de fotografias amareladas... Madre Teresa de Calcutá Se ouvires a voz do vento, Chamando sem cessar; Se ouvires a voz do tempo, Mandando esperar. A decisão é tua; Pois, são muitos os convidados, E quase ninguém tem tempo... Vocação, P. Zezinho RESUMO Os sistemas de organização do conhecimento (SOCs) abarcam distintos tipos de linguagens de representação, tais como taxonomias, tesauros e ontologias. Esses instrumentos possuem diferentes níveis de controle terminológico e indicação de relacionamentos entre conceitos que podem ser utilizados para auxiliar a integração de dados em ambiente web. O foco desta pesquisa foi o tesauro, que se caracteriza como um vocabulário controlado e especializado, composto por um conjunto de descritores inter-relacionados por relações de equivalência, hierarquia e associação. Esta pesquisa investigou e aplicou um modelo de reengenharia para tesauros tradicionais, com o objetivo de transformar o seu sistema de relacionamentos entre conceitos em uma estrutura mais enriquecida semanticamente. Com isso, pretendeu-se principalmente demonstrar a viabilidade dessa conversão e contribuir para a organização e o gerenciamento de informações. Como fundamento teórico-contextual e com base na literatura estudada, apresentam-se abordagens com distintas acepções, a partir de discussões e reflexões realizadas em torno de temas que, articulados, constituem o arcabouço teórico no qual se pauta a construção de tesauros. Traçou-se um percurso no campo da Biblioteconomia e Ciência da Informação (BCI) e exploraram-se os aportes da Terminologia, Semântica, Pragmática e também os aportes dos papéis Qualia e da Teoria da Valência, proposta por Borba (1996), que determina um valor semântico para diferentes verbos em português. Durante essa trajetória, foram discutidos temas tais como o conceito, o termo, a definição, problemas de ambiguidade e polissemia. O ambiente de pesquisa foi a Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA), responsável pelo desenvolvimento de soluções tecnológicas com vistas à disponibilização compartilhada de informações dentro do domínio da agropecuária brasileira. A metodologia adotada se caracterizou como um estudo de caso e envolveu procedimentos de natureza exploratória, aplicada e empírica, com uma abordagem qualitativa em relação à análise da literatura especializada da área. O modelo selecionado como objeto de estudo foi desenvolvido por Soergel et al. (2004) e Lauser et al. (2006) e consiste em procedimentos que possibilitam tratar as diferentes entidades (conceito, termo, string, nota de escopo e relacionamentos) da estrutura conceitual de um tesauro tradicional, através da explicitação formal dos relacionamentos entre conceitos. Nesse percurso metodológico, os procedimentos do modelo de conversão foram descritos, analisados e detalhados. A reengenharia foi aplicada no tesauro brasileiro THESAGRO, do domínio da Agropecuária, no recorte temático da intensificação agropecuária, tendo por base uma taxonomia e utilizando como insumos terminológicos outros tesauros da área da agricultura. Na aplicação do modelo empregou-se o sistema e-Termos, que é um software que auxilia a gestão e o desenvolvimento de produtos terminológicos. Os resultados demonstraram a viabilidade da utilização do modelo analisado na reengenharia de tesauros tradicionais, pois permitiu imprimir mais semântica à estrutura do tesauro modelado, especificando o tipo de relação existente entre os conceitos e termos. Porém, os resultados também evidenciaram que a construção da estrutura dos tesauros deve ser realizada de maneira mais formalizada, a partir de normas internacionais e representada por linguagens tais como Simple Knowledge Organization System (SKOS) e Resource Description Framework Schema (RDFS), vislumbrando a possibilidade de interoperabilidade entre os distintos tesauros. Conclui-se que a possibilidade de refinamento das relações entre conceitos, através da sua explicitação na estrutura do tesauro, auxiliou a organização do conhecimento do domínio modelado, o que pode facilitar a sua exploração pelo usuário, uma vez que torna esses relacionamentos mais claros e específicos. Palavras-chave: Reengenharia de tesauro. Sistema de organização do conhecimento. Tesauro. Modelagem conceitual. Modelo de conversão de tesauro. ABSTRACT Knowledge organization systems (KOSs) encompass different types of representation languages such as taxonomies, thesauri, and ontologies. These instruments have different levels of terminological control and indicators of relationships between concepts. These relationships may be used to help data integration in a web environment. Our work focuses on the thesaurus, which is defined by a controlled and specialized vocabulary, consisting of a set of descriptors that are interrelated by equivalence, hierarchy, and association relationships. We investigate and apply a model for reengineering a traditional thesaurus, with the goal of transforming the concept relationship system of the thesaurus into a semantically richer structure. Our main contribution is to demonstrate the viability of this conversion as an aid to information organization and management. To provide the theoretical context of our work, we review the thesaurus construction literature, and discuss several approaches and their different meanings. We provide an overview of the Library and Information Science (LIS) field, covering the foundations of Terminology, Semantics, and Pragmatics, as well as the foundations of Qualia roles and the Valence Theory, which was developed by Borba (1996), and assigns semantic values to Portuguese verbs. In this overview, we discuss several themes, including concept, term, definition, ambiguity, and polysemy. Our research environment is the Brazilian Agricultural Research Corporation (EMBRAPA), which is responsible for developing technological solutions for information sharing in the Brazilian agriculture domain. Our methodology consists of a case study and involves exploratory, applied, and empirical procedures combined with a qualitative analysis of the specialized literature of the agricultural and the thesaurus construction fields. The thesaurus reengineering model we apply was developed by Soergel et al. (2004) and Lauser et al. (2006), and consists of procedures that allow us to process the different entities (concepts, terms, strings, scope notes, and relationships) of the conceptual structure of a traditional thesaurus through a formal refinement of the relationships between concepts. We describe and analyze in detail these procedures of the reengineering model. We apply the reengineering model to THESAGRO, which is a Brazilian thesaurus in the agriculture domain, in the thematic frame of agriculture intensification, using taxonomy as a basis and other agriculture thesauri as inputs. In the process of applying the model, we use the e- Termos system, which is a software application that helps with the development and management of terminological products. The results demonstrate the viability of using the model to reengineer a traditional thesaurus into a semantically richer structure that specifies the types of relationships between concepts and terms. The results also show that the construction of the structure of thesauri should be done in a more formal way, based on international conventions and represented in conceptual modeling languages such as Simple Knowledge Organization System (SKOS) and Resource Description Framework Schema (RDFS), to promote interoperability among different thesauri. Finally, the ability of refining the relationships between concepts, by explicitly modeling them in the thesaurus structure, helps us organize the knowledge in the modeled domain, which in turn helps users explore the domain, because it makes these relationships clearer and more specific. Keywords: Thesaurus reengineering. Knowledge organization system. Thesaurus. Conceptual modeling. Thesaurus reengineering model. RESUMEN Los sistemas de organización del conocimiento (KOSs) abarcan distintos tipos de lenguajes de representación, tales como taxonomías, tesauros y ontologías. Esos mecanismos poseen diferentes niveles de control terminológico e indicación de relacionamientos entre conceptos que pueden ser utilizados para auxiliar la integración de datos en la aplicación web. El foco de esta investigación fue el tesauro, que se caracteriza como un vocabulario controlado y especializado, compuesto por un conjunto de descriptores inter-relacionados por relaciones de equivalencia, jerarquía y asociación. Este estudio ha investigado y aplicado un modelo de reingeniería para tesauros tradicionales, con el objetivo de trasformar su sistema de relacionamientos entre conceptos en una estructura más enriquecida semánticamente. Así, se pretendió también demostrar la viabilidad de esa conversión y contribuir para la organización y para la administración de informaciones. Como fundamento teórico- contextual y con base en la literatura estudiada, se presentan abordajes con distintas acepciones, a partir de discusiones y reflexiones realizadas acerca de temas que, articulados, constituyen el marco teórico por el cual se regula la construcción de tesauros. Se trazó un trayecto en el campo de la Bibliotecología y las Ciencias de la Información (BCI) y se explotaron las aportaciones de la Terminología, Semántica, Pragmática y también de los aportes de los papeles Qualia y de la Teoría de la Valencia, propuesta por Borba (1996), que determina un valor semántico para diferentes verbos en portugués. Durante ese trayecto, fueron debatidos temas como el concepto, término, definición, problemas de ambigüedad y polisemia. El campo de investigación fue la Empresa Brasileña de Investigación Agropecuaria (EMBRAPA), responsable por el desarrollo de soluciones tecnológicas mirando a la disponibilidad compartida de informaciones adentro del dominio de la agropecuaria brasileña. La metodología adoptada se caracterizó como un estudio de caso e involucró procedimientos de naturaleza exploratoria, aplicada y empírica, con un abordaje cualitativo en relación al análisis de la literatura especializada del área. El modelo seleccionado como objeto de estudio fue desarrollado por Soergel et al (2004) y Lauser et al (2006) y consiste en procedimientos que posibilitan tratar las diferentes entidades (concepto, término, string, nota aclaratoria y relacionamientos) de la estructura conceptual de un tesauro tradicional, a través de la explicitación formal de los relacionamientos entre conceptos. En ese recorrido metodológico, los procedimientos del modelo de conversión fueron descriptos, analizados y detallados. La reingeniería fue aplicada en el tesauro brasileño THESAGRO, del dominio de la Agropecuaria, en el matiz temático de la intensificación agropecuaria, teniendo como base una taxonomía y utilizando como insumos terminológicos otros tesauros del área de la agricultura. En la aplicación del modelo se empleó el sistema e-Termos, que es un software que auxilia la administración y el desarrollo de productos terminológicos. Los resultados demostraron la viabilidad de la utilización del modelo analizado en la reingeniería de tesauros tradicionales, pues permitió imprimir más semántica a la estructura del tesauro modelado, especificando el tipo de relación existente entre los conceptos y términos. Sin embargo los resultados también evidenciaron que la construcción de la estructura de los tesauros debe ser realizada de forma más formalizada, a partir de normas internacionales y debe ser presentada por lenguajes como Simple Knowledge Organization System (SKOS) e Resource Description Framework Schema (RDFS), vislumbrando la posibilidad de interoperabilidad entre los distintos tesauros. Se concluye que la posibilidad de refinamiento de las relaciones entre conceptos, a través da su explicitación en la estructura del tesauro, auxilió la organización del conocimiento del dominio modelado, lo que puede facilitar su explotación por el usuario, una vez que hacen esos relacionamientos más claros y específicos. Palabras-clave: Reingeniería de tesauro. Sistema de organización del conocimiento. Tesauro. Modelaje conceptual. Modelo de conversión de tesauro. LISTA DE ILUSTRAÇÕES FIGURA 1 – Processos onomasiológico e semasiológico .................................................... 75 FIGURA 2 – Percurso onomasiológico................................................................................. 77 FIGURA 3 – Percurso semasiológico da TCT ...................................................................... 77 FIGURA 4 – Relação triádica de Saussure .......................................................................... 92 FIGURA 5 – Triângulo de Ogden e Richards ....................................................................... 92 FIGURA 6 – Triângulo do conceito ...................................................................................... 98 FIGURA 7 – Proposta de conceito de conceito .................................................................. 106 FIGURA 8 – Representação de polissemia ........................................................................ 108 FIGURA 9 – Representação de sinonímia ......................................................................... 109 FIGURA 10 – Variedade de tipos de SOCs ....................................................................... 127 FIGURA 11 – Taxonomia das dimensões dos SOCs ......................................................... 128 FIGURA 12 – Linha cronológica das diretrizes para construção de tesauros ..................... 138 FIGURA 13 – Relação genérica: todo-e-algum .................................................................. 151 FIGURA 14 – Relação genérica: algum-e-algum ............................................................... 152 FIGURA 15 - Poli-hierarquia em relações todo-parte ......................................................... 155 FIGURA 16 – Poli-hierarquia em relações de natureza diferentes ..................................... 156 FIGURA 17 – Representação de relações associativas paradigmáticas e sintagmáticas... 158 FIGURA 18 – Sistematização dos tipos de situação dos verbos ........................................ 164 FIGURA 19 – Modelo conceitual para transição de tesauro tradicional em ontologia......... 168 FIGURA 20 – Nível conceitual mais alto ............................................................................ 175 FIGURA 21 – Atribuição conceito-termo ............................................................................ 176 FIGURA 22 – Tela principal do portal e-Termos ................................................................ 178 FIGURA 23 – Tela principal do sistema e-Termos ............................................................. 180 FIGURA 24 – Interface do AGROVOC (versão out. 2014) ................................................. 191 FIGURA 25 – Representação de MANDIOCA, a partir modelo de Soergel (2004; 2006) ... 204 FIGURA 26 – Relação de string: descritor AIPIM ............................................................... 205 FIGURA 27 – Relação gênero-espécie: conceito PESTICIDA ........................................... 226 FIGURA 28 – Relação partitiva: conceito PECUÁRIA ........................................................ 228 FIGURA 29 – Relação de equivalência: conceito AGRICULTURA INTENSIVA ................. 231 FIGURA 30 – Relação de string: conceito MANEJO DE CULTURA .................................. 235 FIGURA 31 – Relação de string: conceito SISTEMA DE INFORMAÇÃO GEOGRÁFICA .. 235 FIGURA 32 – Representação de relações entre Notas de Escopo (NE) ............................ 241 LISTA DE QUADROS QUADRO 1 – Síntese sobre o conceito de conceito, a partir de estudos filosóficos, epistemológicos, linguísticos, terminológicos e da BCI ............................. 101 QUADRO 2 – Polissemia do termo “definição” ................................................................... 110 QUADRO 3 – Definições do termo “ambiguidade” ............................................................. 116 QUADRO 4 – Definições para o termo “polissemia” ........................................................... 121 QUADRO 5 – O sentido verbal dos papéis Qualia ............................................................. 166 QUADRO 6 – Exemplo de estrutura do THESAGRO ......................................................... 187 QUADRO 7 – Conjunto dos conceitos da amostra ............................................................. 208 QUADRO 8 – Comparação terminológica nos tesauros, em inglês .................................... 212 QUADRO 9 – Comparação terminológica nos tesauros, em português ............................. 213 QUADRO 10 – Diferenças de padrões terminológicos em português europeu e brasileiro 214 QUADRO 11 – Campos semânticos da ficha terminológica ............................................... 218 QUADRO 12 – Conjunto relações aplicado na amostra ..................................................... 222 QUADRO 13 – Conjunto de relações associativas representadas na amostra .................. 236 QUADRO 14 – Notas de Escopo (NE) da amostra ............................................................ 240 QUADRO 15 – Restrições com base em relacionamentos ................................................ 285 LISTA DE SIGLAS E ABREVIATURAS AAT Art and Architecture Thesaurus AB Abreviação Ag Agentivo AGRIS Sistema Internacional de Informação para as Ciências e Tecnologias Agrárias AGROVOC AGROVOC: Multilingual Agricultural Thesaurus AIMS Agricultural Information Management Standarts ANSI American National Standardization Institute ARIST Annual Review of Information Science and Technology ASCII American Standard Code for Information Interchange AWM Apelon Workflow Manager B Beneficiário BCI Biblioteconomia e Ciência da Informação BDPA Base de Dados da Pesquisa Agropecuária BINAGRI Biblioteca Nacional de Agricultura BRAPCI Base de Dados Referenciais de Artigos de Periódicos em Ciência da Informação BS British Standards BSE Bovine spongiform encephalopathyi BSI British Standards Institution BT Broader term BVSA Biblioteca Virtual de Saúde Ambiental Ca Causativo CDU Classificação Decimal Universal CI Ciência da Informação CISMEF Catalogue and Index of French-speaking Medical CNPTIA Embrapa Informática Agropecuária Co Comitativo CRG Classification Research Group CS Concept Server CUI Concept Unique Identifiers DOC Document DOLCE Descriptive Ontology for Linguistic and Cognitive Engineering ECI Escola de Ciência da Informação EIA Embrapa Informática Agropecuária E-LIS E-Prints in Library and Information Science EMBRAPA Empresa Brasileira de Pesquisa Agropecuária ERIC Educational Resources Information Center ES Erro de soletração ETECAM Extrator de Termos e Estruturas Conceituais Agrícolas Multilíngue ETT European Training Thesaurus Ex Experimentador FAO Food and Agriculture Organization FCT Forma completa do termo GEM Gateway to Educational Materials GETerm Grupo de Estudos e Pesquisas em Terminologia HTML HyperText Markup Language I Instrumental IA Intensificação Agropecuária IAU International Astronomical Union IBGE Instituto Brasileiro de Geografia e Estatística IBICT Instituto Brasileiro de Informação em Ciência e Tecnologia IICA Inter-American Institute for Cooperation on Agriculture INTAGRO Intensificação Agropecuária em Polos de Produção de Soja e Cana de Açúcar: Territorialidade, Sustentabilidade e Competitividade IPHAN Instituto do Patrimônio Histórico e Artístico Nacional ISKO International Society for Knowledge Organization ISO International Organization for Standardization KOS Knowledge Organization Systems L Locativo LabInfo Laboratório de Organização e Tratamento da Informação Eletrônica LanguaL Langua aLimentaria LISA Library and Information Science Abstracts LISP Lost In Stupid Parenthesis LOD Linked Open Data M Meta MAPA Ministério da Agricultura, Pecuária e Abastecimento MARC Machine Readable Cataloging MCD Mad Cow Disease MeSH Medical Subject Headings MHTX Mapa Hipertextual MI Mecanismo de inferência MMA Ministério do Meio Ambiente NAL National Agricultural Library NCI National Cancer Institute NE Nota de escopo NILC Núcleo Interinstitucional de Linguística Computacional NISO National Information Standards Organization NT Narrower term Ob Objetivo OC Organização do conhecimento OEKC/FAO Food and Agriculture Organization, Knowledge and Capacity Development OI Organização da informação Or Origem OWL Web Ontology Language PDF Portable Document Format PD&I Pesquisa, Desenvolvimento e Inovação PLN Processamento de Língua Natural PMEST Personalidade, Matéria, Energia, Espaço e Tempo PT/BR Português brasileiro PT/EU Português europeu R Resultativo RDF Resource Description Framework RDF/SKOS-XL Resource Description Framework/SKOS/eXtension for Labels RDFS Resource Description Framework Schema REPIDISCA Rede Pan-americana de Informação sobre Saúde Ambiental RT Related term SE/MAPA Secretaria-Executiva do Ministério da Agricultura, Pecuária e Abastecimento SKOS Simple Knowledge Organization Systems SNPA Sistema Nacional de Pesquisa Agropecuária SOC Sistema de Organização do Conhecimento SRI Sistema de Recuperação de Informação TA Termo associado (relação) TBX TermBase eXchange TCT Teoria Comunicativa da Terminologia TE Termo específico (relação) TEG Termo específico de gênero (relação) TEI Termo específico de instância (relação) TEP Termo específico partitivo (relação) TERMCAT Centro de Terminologia Catalão TEST Thesaurus of Engineering and Scientific Terms TG Termo genérico (relação) TGG Termo genérico de gênero (relação) TGI Termo genérico de instância (relação) TGP Termo genérico partitivo (relação) TGT Teoria Geral da Terminologia THESAGRO Thesaurus Agrícola Nacional Tp Temporal TR Termo relacionado (relação) TST Teoria Sociocognitiva da Terminologia TV Teoria da Valência UF Used for (relação) UFMG Universidade Federal de Minas Gerais UFSCar Universidade Federal de São Carlos UMLS Unified Medical Language System UNESCO United Nations Educational, Scientific and Cultural Organization UNISIST United Nations International Scientific Information System UP Usado para (relação) URI Uniform Resource Identifier USDA United States Department of Agriculture USE Use (relação) USI Unique Subject Indentifiers USP Universidade de São Paulo VO Variante ortográfica W3C World Wide Web Consortium WWW World Wide Web XL EXtension for Labels XML EXtensible Markup Language YSA General Finnish Thesaurus YSO General Finish Ontology SUMÁRIO 1 INTRODUÇÃO .................................................................................................... 17 1.1 O PROBLEMA ..................................................................................................... 20 1.2 OBJETIVOS ......................................................................................................... 22 1.2.1 Objetivo geral ..................................................................................................... 23 1.2.2 Objetivos específicos ........................................................................................ 23 1.3 JUSTIFICATIVAS ................................................................................................ 23 1.4 ESTRUTURA DA TESE ....................................................................................... 25 2 AMBIENTAÇÃO DA PESQUISA ......................................................................... 28 2.1 A EMBRAPA ........................................................................................................ 29 2.2 O CAMPO DE INVESTIGAÇÃO: AGROPECUÁRIA BRASILEIRA ...................... 31 2.2.1 O projeto INTAGRO ........................................................................................... 33 2.3 RECORTE TEMÁTICO DA PESQUISA: INTENSIFICAÇÃO AGROPECUÁRIA .. 34 3 CARACTERIZAÇÃO E DEFINIÇÃO DA METODOLOGIA .................................. 38 4 REVISÃO DE LITERATURA ............................................................................... 43 5 FUNDAMENTOS TEÓRICO-CONTEXTUAIS ..................................................... 57 5.1 UM OLHAR SOBRE A SEMÂNTICA .................................................................... 58 5.1.1 Uma interface entre Pragmática e Semântica .................................................. 64 5.2 O PAPEL DA TERMINOLOGIA ........................................................................... 68 5.3 APORTES DA TEORIA COMUNICATIVA DA TERMINOLOGIA (TCT)................ 73 5.4 OS ELEMENTOS BÁSICOS DE UMA TERMINOLOGIA ..................................... 79 5.4.1 O termo ............................................................................................................... 79 5.4.2 O conceito .......................................................................................................... 84 5.4.2.1 Breve panorama acerca dos estudos sobre o conceito ........................................ 84 5.4.2.2 O conceito na Linguística, Terminologia e BCI ..................................................... 90 5.4.2.2.1 Discussões relativas à Teoria do Conceito de Dahlberg ...................................... 99 5.4.2.2.2 Uma proposta de definição e representação para “conceito” ............................. 104 5.4.3 A definição ....................................................................................................... 109 5.5 A QUESTÃO DA AMBIGUIDADE E POLISSEMIA ............................................. 115 5.5.1 Ambiguidade nos enunciados ........................................................................ 116 5.5.2 Ambiguidade lexical: polissemia e homonímia ............................................. 120 5.6 SISTEMAS DE ORGANIZAÇÃO DO CONHECIMENTO (SOC) ........................ 124 5.6.1 Tesauros ........................................................................................................... 129 5.6.1.1 Construção de tesauros: síntese sobre a origem de seus princípios .................. 130 5.6.1.2 Funções e características do tesauro ................................................................. 133 5.6.1.3 Relato sobre diretrizes para a construção de tesauros....................................... 136 5.7 RELACIONAMENTOS NOS TESAUROS .......................................................... 140 5.7.1 Relações de equivalência ................................................................................ 145 5.7.2 Relações hierárquicas ..................................................................................... 149 5.7.2.1 As poli-hierarquias ............................................................................................. 155 5.7.3 Relações associativas ..................................................................................... 156 5.8 A VALÊNCIA SEMÂNTICA DOS VERBOS ........................................................ 160 6 FUNDAMENTOS TEÓRICO-METODOLÓGICOS ............................................. 167 6.1 FUNDAMENTOS DO MODELO CONCEITUAL PARA REENGENHARIA ......... 167 6.1.2 Etapas e detalhamento da conversão ............................................................ 173 6.2 FUNDAMENTOS E CARACTERIZAÇÃO DO SOFTWARE E-TERMOS............ 177 6.3 INSUMOS TERMINOLÓGICOS E SEMÂNTICOS ............................................. 183 6.3.1 A taxonomia da Intensificação Agropecuária ................................................ 184 6.3.2 O tesauro THESAGRO ..................................................................................... 185 6.3.3 O tesauro AGROVOC ....................................................................................... 188 6.3.4 O tesauro NAL .................................................................................................. 192 7 DESCRIÇÃO DOS PROCEDIMENTOS E RESULTADOS ................................ 196 7.1 PLANEJAMENTO INICIAL ................................................................................. 196 7.2 ETAPA UM – DEFINIÇÃO DA ESTRUTURA ..................................................... 198 7.2.1 Mapeamento da estrutura conceitual do tesauro THESAGRO ..................... 198 7.2.2 Determinação do recorte temático ................................................................. 206 7.2.3 Subdivisão do recorte temático em categorias ............................................. 206 7.2.4 Demarcação e composição da amostra ......................................................... 207 7.3 ETAPA DOIS: COLETA DE TERMINOLOGIA ................................................... 210 7.3.1 Identificação e seleção de tesauros e outras fontes ..................................... 210 7.3.2 Coleta de terminologia .................................................................................... 211 7.3.3 Análise e escolha de terminologia.................................................................. 215 7.4 ETAPA TRÊS: EDIÇÃO DO THESAGRO .......................................................... 215 7.4.1 Escolha do software ........................................................................................ 216 7.4.2 Compilação da base definicional .................................................................... 216 7.4.3 Elaboração do glossário ................................................................................. 217 7.4.4 Registro das fichas terminológicas ................................................................ 217 7.4.5 Construção do sistema de conceitos ............................................................. 220 8 CONSIDERAÇÕES FINAIS ............................................................................... 245 REFERÊNCIAS ................................................................................................................. 254 APÊNDICE A – Propostas de Sistematização de Relações em Tesauros, por data .... 276 APÊNDICE B – Implantação Computacional do Modelo Adotado ................................ 284 APÊNDICE C – Estrutura Semântica Inicial ................................................................... 289 APÊNDICE D – Lista de Tesauros e Fontes da Agricultura .......................................... 294 APÊNDICE E – Definições das Relações do Domínio da Agricultura .......................... 297 APÊNDICE F – Taxonomia das Relações do Domínio da Agricultura .......................... 315 APÊNDICE G – Estrutura Semântica Final ..................................................................... 318 APÊNDICE H – Definições para os Conceitos da Amostra ........................................... 329 ANEXO A – Estrutura Hierárquica da Taxonomia de Intensificação Agropecuária .... 337 17 1 INTRODUÇÃO A escrita é a procura difícil, por vezes exasperante, do inacessível dizer do imediato e do transcendente que a vida concede, mas só a escrita constrói porque permanece. Nazaré Trigo Coimbra. Esta pesquisa tem sua ambientação dentro de um convênio de parceria de pesquisa entre a Universidade Federal de Minas Gerais (UFMG), o Grupo MHTX1 e a Embrapa Informática Agropecuária (EIA), sediada em Campinas, São Paulo. Essa cooperação visa ao desenvolvimento de estudos acadêmicos para a construção de instrumentos de representação de conhecimento que deem suporte à organização, compartilhamento, disponibilização e recuperação de recursos informacionais do domínio da Agropecuária brasileira. O conhecimento2 permeia todas as relações humanas, seja no ambiente institucional, familiar ou de lazer. As informações acerca desses conhecimentos são importantes para a sociedade e sempre há um valor de status ligado a elas. Pode-se também acrescentar a isso, o valor econômico do conhecimento, pois, muitas vezes, ele é decisivo para manter a competitividade nas atividades profissionais. Nesse contexto, muito antes da ideia visionária do MEMEX3, de Vanevar Bush (1945), são notáveis os esforços empregados para empreender soluções que têm como foco aprimorar as formas de armazenamento, organização, disponibilização, recuperação e acesso às informações contidas em diversificados bancos e bases de dados informacionais. A crescente expansão da informática, além de impor transformações em todos os setores de interação humana, também tem impulsionado as pesquisas no âmbito da organização e recuperação de informações. Nesse sentido, a expansão da World Wide Web (WWW), criada sobre a Internet como alternativa para conectar informações, foi um progresso importante para a web semântica. De maneira geral, em 1999, Bernes-Lee e Fischetti publicaram o livro Weaving the Web, quando o termo “web semântica” passou a ser utilizado para referendar os estudos que envolvem a incorporação de metadados aos recursos informacionais, como forma de permitir que possam ser reconhecidos pela máquina e ser interoperáveis entre distintos sistemas. Essa ideia parece ser simples, porém, 1 O Grupo de Pesquisa denominado Protótipo Mapa Hipertextual (MHTX) foi criado em 2004, desde então, é coordenado pela Dra. Profa. Gercina Lima, orientadora desta tese, cuja proponente é membro integrante desde 2006. 2 Não se pretende nesta tese discutir a questão, recorrente no campo da Biblioteconomia e Ciência da Informação (BCI), sobre a diferença entre “informação” e “conhecimento”. Ainda assim, nesta pesquisa os dois termos foram utilizados considerando-se “informação” como um dado que foi organizado e contextualizado e “conhecimento” como uma informação que foi processada de tal forma que provocou ou norteou um entendimento, aprendizado ou valor sobre determinado saber. 3 Bush imaginou uma espécie de máquina para facilitar o armazenamento de informações, para posterior recuperação e uso. 18 na verdade, sua aplicação envolve complexidade, pois demanda prover ferramentas ou mecanismos para que a máquina possa encontrar, trocar e interpretar as informações. O World Wide Web Consortium (W3C), principal organização internacional de padronização de protocolos e diretrizes para uso na web, propõe que o termo “web semântica” refere-se à visão “dos Dados Linkados [...] [o que] dá às pessoas a capacidade de criar repositórios de dados na web, construir vocabulários e escrever regras visando tornar esses dados interoperáveis” (W3C, 2014, on-line). Essa função pode tanto ser mais simples quanto muito complexa, exigindo o uso de distintos instrumentos de representação, conforme a circunstância e o objetivo desejado. Na web semântica, esses instrumentos contribuem com a determinação dos conceitos e na caracterização dos relacionamentos utilizados para descrever e representar um domínio, a partir de uma finalidade particular. No campo da Biblioteconomia e Ciência da Informação (BCI), os distintos tipos de instrumentos de representação têm sido agrupados sob a designação de Sistemas de Organização do Conhecimento (SOC). Essa nova denominação vem sendo adotada desde 1998, quando ocorreu a primeira Conferência da ACM Digital Libraries, em Pittsburgh (Pennsylvania). Nesse evento, o Networked Knowledge Organization Systems Working Group propôs o uso do termo “Knowledge Organization System” (KOS) para denominar os diferentes tipos de linguagens de representação de conhecimento, tais como taxonomias, listas de cabeçalho de assunto, tesauros, redes semânticas e ontologias. Os SOCs podem descrever conteúdos de informação, com vistas a uma organização que ofereça maior consistência desses recursos. Em um sentido mais amplo, esses instrumentos são linguagens construídas de forma normatizada. Sendo assim, elas são elaboradas a partir de normas, regras e regulamentos e de distintos princípios metodológicos, que as fundamentam. Em diferentes níveis, esses instrumentos têm em comum a tarefa de exercer o controle terminológico de um determinado domínio4 e indicar os relacionamentos existentes entre os conceitos de sua estrutura. Dentre os tradicionais instrumentos de representação do conhecimento, no âmbito da BCI, o foco desta pesquisa é o tesauro5, que se caracteriza como um vocabulário 4 Domínio pode ser uma área de conhecimento (especialidade), um conjunto literário ou ainda a tarefa de um grupo de pessoas trabalhando juntas num projeto ou numa organização (HJORLAND; ALBRECHTSEN, 1995). Ou seja, representa um campo do saber ou assunto, atividade corrente ou tarefa (ou missão, quando se referindo ao conceito de um grupo de pessoas, advindos de diferentes áreas, atuando em um trabalo conjunto, traduzido da expressão, em inglês, mission-oriented). 5 Há autores (CURRÁS, 1995; CAMPOS; GOMES, 2006) que consideram que os tesauros são construídos com base na sistematização de conceitos, suas categorias e relacionamentos, fato que explica a preferência do uso da expressão tesauros conceituais em lugar de denominá-los tesauros terminológicos ou linguagens terminológicas (LARA, 1999). Neste estudo, considera-se o tesauro como criado com base no conceito, porém, as três expressões são usadas como sinônimas, uma vez que se acredita que os tesauros são uma linguagem e, como tal, envolvem tanto uma questão terminológica, em relação aos descritores que compõem a estrutura do 19 controlado e especializado, composto por um conjunto de termos que representam um campo de estudo. Ele é utilizado também para o tratamento, organização e recuperação do conhecimento e, usualmente, desenvolvem-se tesauros para representar um dado domínio de especialidade, ainda que existam tesauros mais gerais. Em geral, os tesauros tradicionais são construídos a partir de princípios onomasiológicos (do conceito ao signo que o denomina), sobretudo a partir da Teoria do Conceito, desenvolvida por Dahlberg, que tem por base a Teoria da Classificação Facetada, proposta por Ranganathan, e a Teoria Geral da Terminologia (TGT), criada por Wüster. A perspectiva da TGT é considerada rígida e prescritiva, e confia na univocidade entre conceito e termo. Esse princípio contraria uma concepção contemporânea de que uma linguagem de especialidade possui a mesma característica da língua geral e, nesse sentido, a polissemia deve ser controlada, porém, reconhecida. Nesse sentido, esta pesquisa explora esses novos fundamentos para a construção de tesauros, adotando as bases da Teoria Comunicativa da Terminologia (TCT), desenvolvida por Maria Teresa Cabré. Quaisquer que sejam os fundamentos aplicados, o processo de representação de um domínio pressupõe a decomposição desse domínio em suas principais partes, de forma tal que o conjunto dessas partes possa manter o mesmo valor semântico e as relações que acontecem no campo de conhecimento do domínio a ser modelado. Com isso, é possível manter uma representação simplificada, porém significativa, desse domínio. Contudo, não se deve ignorar que, para garantir a permanência da mesma significação do domínio, em uma linguagem representativa, é necessária a construção de estruturas potencialmente ricas em semântica. Sabe-se que desde a década de 1960, com o início da criação e utilização comercial de bancos de dados, os estudos sobre construção de linguagens e de tesauros já se preocupavam em dar este enfoque mais semântico, visando a recuperação de informações, por meio de representações de modelos de dados hierárquicos e relacionais. Nesse contexto, os tesauros têm uma representação semântica bastante consistente, cujo conjunto de descritores se organiza em uma estrutura hierárquica, que estabelece relacionamentos entre si. Dessa forma, a estrutura conceitual do tesauro é construída, já com o intuito de minimizar a ambiguidade (imprecisão do significado) e a polissemia (pluralidade de significados) da linguagem natural. As relações básicas, estabelecidas na organização do tesauro, são as de equivalência (controle de termos em sinonímia e controle de variações linguísticas), as hierárquicas (grupos compostos por conceitos ordenados por níveis diferentes de generalidade e especificidade) e as associativas (ligações não- instrumento, quanto dos conceitos, cujos conteúdos estão materializados nas definições, permitindo inter-relacioná-los. 20 hierárquicas entre conceitos). Dentre essas, as ligações associativas são as mais difíceis de serem atribuídas, uma vez que exigem conhecimento do domínio e uma abordagem ad hoc. Com o uso mais recorrente dos tesauros como instrumentos de recuperação de informações em ambiente baseados na web, além desse conjunto de relações, surgiu a necessidade de criar, na construção de tesauros, mecanismos que possibilitassem o compartilhamento de informações. Nesse sentido, alguns tesauros já estão convertidos em linguagem HyperText Markup Language (HTML), mais estáticos, e em linguagens manipuláveis por computador, tais como a linguagem EXtensible Markup Language (XML) e Resource Description Framework (RDF). Ademais, as estruturas dos tesauros têm sido reutilizadas na construção de ontologias de domínio, uma vez que já estruturam o conhecimento de um domínio específico, com base em princípios teóricos da área da BCI e da Terminologia. Dessa forma, os tesauros expressam a codificação de conceitos e definições de classes, atribuídas com certo nível de consenso da comunidade de usuários. Algumas iniciativas, como a observada no tesauro multilíngue AGROVOC: Multilingual Agricultural Thesaurus (AGROVOC), do domínio da agricultura, têm utilizado o padrão Simple Knowledge Organisation System (SKOS) para a construção de tesauros. O objetivo desses empreendimentos é expressar, de maneira mais formalizada, a estrutura conceitual de tesauros, permitindo a utilização desses instrumentos em um servidor web. Assim, a representação dessa estrutura permite um tratamento com maior teor semântico, permitindo que se atribuam relações específicas entre conceitos, assim como relações entre seus termos, tais como ou . Com isso, o tesauro adquire novas características e se torna um sistema tanto com base em conceitos quanto com base em terminologia. O problema de investigação desta pesquisa foi evidenciado a partir da observação das tecnologias que possibilitam criar estruturas conceituais semanticamente mais refinadas e da necessidade de se especificarem as relações entre os conceitos de um tesauro, tal como as iniciativas já existentes, a exemplo daquela proposta pelos desenvolvedores do AGROVOC. 1.1 O PROBLEMA Tesauros são empregados na representação e estruturação semântica do conhecimento e no controle da terminologia de dado domínio. Ele permite que se mapeie todo o conhecimento, organizando-o, reunindo os assuntos correlatos e evitando a dispersão de temas associados, sendo composto pelo conjunto de descritores preferidos e não-preferidos. Esse instrumento apresenta os conceitos conectados de maneira 21 sistemática, através de referências cruzadas e de diferentes relações semânticas, e não apenas arranjados em ordem alfabética. Entretanto, uma análise de tal arranjo evidencia alguns problemas, sobretudo em relação à atribuição dos relacionamentos associativos (TR). Nesse sentido, concorda-se com Campos, Gomes e Motta (2004, on-line) quando afirmam que é preciso atentar para os fundamentos que envolvem a determinação dessas relações, visando a evitar a ocorrência de ligações inadequadas. Adicionalmente, há outras limitações encontradas na literatura, que incluem a falta de abstração conceitual e a escassa representação semântica encontrada na maioria dos tesauros (SOERGEL et al., 2004). A falta de abstração conceitual está relacionada com o que se pode denominar desnaturalização hierárquica, que se dá quando o tesauro posiciona inadequadamente conceitos em relacionamentos hierárquicos, vinculando um conceito que não é logicamente subordinado ao conceito superior, como se ele o fosse. Por outro lado, a escassa representação semântica refere-se, por exemplo, à falta de ampla e clara distinção entre o conceito (significado) e suas diferentes lexicalizações (palavras sinônimas e variações linguísticas). De um modo geral, os três tipos de relações tradicionais de um tesauro (de equivalência, hierárquica e associativa) apontam para ligações com sentidos mais genéricos, pois não têm os seus significados especificados no tesauro, o que, algumas vezes, os torna insuficientes para indicar toda a semântica conceitual de um domínio. Aliado a isso, alguns autores afiançam que os estudos acerca de metodologias para a formação da estrutura conceitual do tesauro vêm evoluindo (MOTTA, 1987; CAMPOS, 1995; CAMPOS; GOMES, 2003; CAMPOS, 2004, entre outros), e tal evolução traz como consequência instrumentos semanticamente mais ricos. Esse fato pode ser observado também nas normas internacionais de construção de tesauros como, por exemplo, a norma NISO Z39.19 (2005) e a mais recente ISO 25964, Parte 1 (2011) e Parte 2 (2013). Nessas normas, recomenda-se que todas as relações devem ser claramente sinalizadas nos tesauros, sobretudo as associativas, como forma de evitar problemas de decisões subjetivas que tragam como consequência estruturas inconsistentes. A literatura internacional oferece, desde a década de 2000, alguns modelos para o enriquecimento semântico de tesauros tradicionais, geralmente para convertê-los em ontologias. Segundo Villazón-Terrazas (2011), esse campo de pesquisa se fortaleceu desde 2007, quando foi estabelecido um novo paradigma para a criação de ontologias, que tem foco no reuso de conhecimento já estruturado, conforme é encontrado nos tesauros. Já no Brasil, sobre o tema de conversão de tesauros, há o trabalho de Campos et al. (2008), que apresentou a conversão de um tesauro em uma ontologia de domínio. Outra pesquisa, realizada por Teixeira (2013), selecionou quatro métodos para a conversão de tesauros em ontologias, disponíveis na literatura internacional, explorando-os e analisando os 22 procedimentos de conversão do tesauro de cada método. As conclusões da autora apontaram que pode haver aproveitamento da estrutura conceitual do tesauro na criação de uma ontologia, devido à semelhança da natureza das relações e entidades. Porém, a pesquisadora afirma que a aplicação da conversão necessita da supervisão de um especialista em ontologias, uma vez que a conversão de tesauros em ontologias não é uma tarefa fácil. Entre os modelos investigados por Teixeira (2013), encontra-se o método de reengenharia de tesauros desenvolvido por Soergel et al. (2004), cujo experimento foi aplicado no tesauro americano de agricultura, o AGROVOC. Nesse modelo, ainda que seu objetivo final seja a conversão do tesauro em uma ontologia, os autores propõem uma abordagem gradual de conversão. Com isso, acredita-se que ele é adequado para os propósitos desejados, pois é possível priorizar o trabalho intelectual contido nos procedimentos metodológicos para remodelar a estrutura do tesauro. Tendo em vista os problemas relacionados à necessidade de maior enriquecimento semântico na estrutura dos tesauros, decidiu-se estudar mais detidamente o modelo de Soergel et al. (2004) e aplicá-lo em um tesauro nacional, também da área da agricultura – o Thesaurus Agrícola Nacional (THESAGRO). A seleção desse tesauro se justifica pelo fato de ele ser o único tesauro brasileiro que representa o domínio da agricultura. Com o uso do THESAGRO, para a aplicação do modelo de conversão adotado, acata-se, também, o paradigma de reuso de conhecimento, já mencionado por Campos (1995), Dodebei (2002) e Villazón-Terrazas (2011). No percurso desta pesquisa, pretende- se responder às questões: (1) que elementos são necessários para desenvolver tesauros com relacionamentos semanticamente mais ricos?; (2) como desenvolver estruturas semanticamente enriquecidas para os tesauros?; (3) o modelo de Soergel et al. (2004) e Lauser et al. (2006) cumpre o propósito de auxiliar no enriquecimento semântico dos relacionamentos em um tesauro?. Diante dos problemas e questionamentos aventados neste Subcapítulo, apresenta-se a formulação dos objetivos propostos para respondê-los e, em seguida, os argumentos que justificam a adoção de tal proposição. 1.2 OBJETIVOS A partir dos problemas apresentados, esta pesquisa se propõe a alcançar os objetivos descritos nos itens 1.2.1 e 1.2.2. 23 1.2.1 Objetivo geral Estudar um modelo de reengenharia de tesauro tradicional, aplicando-o ao tesauro THESAGRO, com vistas ao enriquecimento semântico de sua estrutura conceitual. 1.2.2 Objetivos específicos - Testar um modelo de reengenharia de tesauro, visando a determinar a sua aplicabilidade; - Demonstrar a viabilidade da conversão de um tesauro tradicional em uma estrutura conceitual semanticamente mais rica; - Dar subsídios para que a interoperabilidade entre sistemas e diferentes linguagens seja possível, a partir da explicitação dos relacionamentos semânticos entre os conceitos de um tesauro. - Contribuir para a organização e o gerenciamento de informações da área da agricultura, através da reengenharia do THESAGRO, visando a atender diferentes usuários (humanos e máquinas). 1.3 JUSTIFICATIVAS O tesauro é considerado uma ferramenta que se propõe a organizar o conhecimento e auxiliar o entendimento de dado domínio, a partir de sua estrutura conceitual. Para uso em aplicações web, é desejável que, na construção desses instrumentos, as relações entre os conceitos sejam explicitadas, definidas e desambiguizadas. Com isso, espera-se que a estrutura conceitual de um tesauro seja compreendida não somente por especialistas desse domínio, mas por usuários em geral. A estrutura do Thesaurus Agrícola Nacional (THESAGRO) é composta por 9.351 termos, interligados a partir das três relações básicas de um tesauro tradicional: equivalência (USE, UP), hierárquicas (TG, TE) e associativas (TR). Essas relações são muito generalizadas, não deixando explícitas as significações dos tipos de inter-relação existentes entre os conceitos na estrutura do tesauro. Em ambiente web, esse nível de formalização é insuficiente para ser interpretado pela máquina, dificultando o compartilhamento de informações. Além disso, o THESAGRO não foi modelado a partir de classes gerais ou facetas temáticas que poderiam permitir agrupamentos de conceitos de mesma natureza. Com isso, o entendimento semântico da estrutura conceitual desse tesauro é bastante limitado e, consequentemente, nem sempre é possível determinar a relação entre seus conceitos ou a abordagem aplicada na modelagem. 24 Para exemplificar essa afirmação, em uma situação hipotética, a estrutura conceitual de um tesauro tradicional, tal como a utilizada pelo THESAGRO, teria a seguinte demonstração sistemática: AGRICULTURA INTENSIVA TG SISTEMA DE EXPLORAÇÃO AGRÍCOLA TE CULTIVO INTENSIVO TE PECUÁRIA INTENSIVA TR UTILIZAÇÃO INTENSIVA DA TERRA TR PRODUÇÃO Observando essa hierarquia, na qual os tipos de relacionamentos estão apenas parcialmente explícitos, nota-se que ela dificulta uma maior apreensão do conhecimento do domínio. Pela estrutura sistemática fornecida no exemplo, é possível perceber que AGRICULTURA INTENSIVA está em uma relação hierárquica com SISTEMA DE EXPLORAÇÃO AGRÍCOLA (TG), que é um descritor mais amplo. Contudo, se o usuário não for um especialista nessa área específica, não conseguirá compreender se a ligação de hierarquia entre esses dois conceitos é uma relação gênero-espécie, partitiva ou de instância, pois essa informação está apenas implícita na estrutura conceitual. Da mesma maneira, é possível entender que AGRICULTURA INTENSIVA é um descritor de sentido mais amplo (TG) e está em uma relação hierárquica com CULTIVO INTENSIVO (TE) e PECUÁRIA INTENSIVA (TE), porém, não é possível precisar a qual tipo de relacionamento hierárquico eles se referem, pois essa informação não está explícita. Na verdade, a relação hierárquica entre esses conceitos é de gênero-espécie, mas isso somente pode ser percebido por um especialista na área. De forma ainda menos clara está a relação associativa (TR) entre AGRICULTURA INTENSIVA, UTILIZAÇÃO INTENSIVA DA TERRA e PRODUÇÃO, pois somente pode ser apreendido que, de alguma forma especial, esses três conceitos estão ligados, mas não há qualquer pista sobre os tipos de relacionamentos que mantêm entre si, tornando-se importante representá-los na estrutura sistemática do tesauro. A partir desse exemplo, é possível perceber o problema que motivou esta pesquisa, pois as características e elementos da estrutura semântica do tesauro tradicional e, nesse caso específico, do THESAGRO, ainda são insuficientes para representar o conhecimento de um domínio, podendo, assim, ser semanticamente mais bem estruturadas. Confirmando essas necessidades, no percurso desta pesquisa acompanhou-se a reformulação6 da estrutura conceitual do tesauro AGROVOC, com a inclusão explícita dos relacionamentos associativos, o que ocorreu em outubro de 2014. Essa transformação, 6 Essa reformulação pode ser observada no portal de busca do AGROVOC. Disponível em: . 25 confirmou a necessidade da reengenharia do THESAGRO, o que constitui a proposta deste estudo. Além disso, ressalta-se que na literatura brasileira sobre o assunto, não foi encontrada iniciativa semelhante, o que reforça a relevância do presente estudo. Acrescenta-se que, na aplicação do modelo de conversão, pretende-se explicitar as relações de equivalência e as hierárquicas, e não somente especificar as relações associativas, como ocorreu no AGROVOC. Sendo assim, é nessa perspectiva que se apresenta esta proposta de reengenharia do THESAGRO, que busca remodelar o seu sistema conceitual em uma estrutura com maior grau semântico, facilitando o seu uso em ambiente web. Acreditando estarem os objetivos propostos justificados de forma plena, apresenta-se o Subcapítulo com a estrutura da tese e, a seguir, o Capítulo Dois, no qual será fornecida a ambientação desta pesquisa. 1.4 ESTRUTURA DA TESE O conteúdo textual desta tese é estruturado em nove Capítulos, cuja organização se apresenta da seguinte forma: Capítulo 1 – Introdução: apresenta o tema de pesquisa, traçando um percurso dentro do campo da Biblioteconomia e Ciência da Informação (BCI). Problematiza a questão de pesquisa, descrevendo os objetivos geral e específicos, assim como as justificativas para a proposta desta pesquisa. Capítulo 2 – Ambientação da pesquisa: trata da trajetória da seleção da instituição EMBRAPA como local de ambientação desta investigação, descrevendo as suas características e as suas demandas por soluções para compartilhamento de informações, foco desta tese. Também apresenta informações gerais para o entendimento do domínio da agropecuária brasileira e, mais especificamente, descreve o recorte temático desta pesquisa: a Intensificação Agropecuária. Capítulo 3 – Caracterização e definição da metodologia: caracteriza a tipologia deste estudo, indicando as escolhas adotadas e descrevendo as estratégias de busca para a pesquisa bibliográfica, os critérios para a composição do conjunto de trabalhos para a revisão de literatura, assim como os elementos de delimitação da pesquisa. Capítulo 4 – Revisão de literatura: apresenta os trabalhos já publicados, relacionados à proposta desta pesquisa, mostrando diferentes modelos de conversão de tesauros em ontologias. Indica os parâmetros que foram utilizados na análise dos documentos, no intuito de sistematizar a exposição da revisão. Examina os resultados que foram obtidos nesses trabalhos e estabelece uma relação entre tais resultados e a proposta desta pesquisa. 26 Capítulo 5 – Fundamentos teórico-contextuais: realiza uma discussão conceitual em torno dos elementos que, articulados, constituem o arcabouço teórico-contextual no qual tem se pautado a atividade de construção de tesauros. Oferece uma reflexão sobre essas bases teóricas, apresentando abordagens de características distintas, passando pelos aportes da Semântica, Pragmática e Terminologia. Discute sobre a relação desta última com o campo da BCI, explorando suas contribuições, desde a origem da Terminologia como disciplina, a partir da teoria desenvolvida por Wüster. Trata, de forma especial, da Teoria Comunicativa da Terminologia (TCT), cujos princípios se ancoram nas teorias do conhecimento (de natureza cognitiva), da comunicação (situações comunicativas) e da linguagem. Explora a noção de unidades léxicas na linguagem de especialidade e os contextos de seu uso, discutindo seus efeitos na representação do conhecimento de um domínio. Esclarece sobre os elementos básicos de uma terminologia (termo, conceito e definição), apresentando os conteúdos que os definem e caracterizam, evidenciando o papel desses elementos no âmbito da construção de tesauros. Focaliza o tema do conceito, discorrendo histórica e conceitualmente sobre as diferentes teorias que são as bases de sua determinação e definição. São realizadas reflexões sobre a Teoria do Conceito, desenvolvida por Dahlberg, apresentando uma proposta para o conceito de conceito. Os problemas da ambiguidade e da polissemia, fenômenos que devem ser levados em consideração na construção de tesauros, são analisados, e é evidenciada a necessidade de distintas formas para o controle desses fenômenos. Considera-se que esse controle pode ser alcançado durante a redação das definições dos conceitos, que podem incluir elementos que efetivem o controle da polissemia em domínios de especialidade. Apresenta o tesauro, como um tipo de SOC, indicando suas funções, características, as origens teóricas que embasam a sua construção e um breve relato histórico sobre as diretrizes e normas que orientam essa atividade. Discorre sobre as bases teóricas acerca dos três principais tipos de relações existentes nos tesauros (de equivalência, hierárquica e associativa). Por fim, apresenta os fundamentos da Teoria da Valência, desenvolvida por Borba (1996), na qual o autor determina valores semânticos distintivos para diferentes verbos em português, assim como é apontada a importância da identificação dos papéis Qualia, desenvolvida por Pustejovsky (1995), na determinação do significado específico dos relacionamentos semânticos. Capítulo 6 – Fundamentos teórico-metodológicos: trata dos fundamentos teórico- metodológicos que respaldam o desenvolvimento desta pesquisa, descrevendo o modelo adotado e os procedimentos da conversão aplicados, utilizando duas fontes: Soergel et al. (2004) e Lauser et al. (2006). Apresenta o sistema e-Termos, software que é um ambiente computacional colaborativo web, formado por um conjunto de procedimentos automatizados e semiautomatizados, que foi empregado para a gestão e desenvolvimento da estrutura 27 conceitual do THESAGRO. Faz a exposição de três tesauros (THESAGRO, AGROVOC e National Agricultural Library – NAL) e de uma taxonomia da área temática da Intensificação Agropecuária (recorte temático), que foram utilizados como insumos terminológicos para a composição da nova estrutura do THESAGRO. Capítulo 7 – Descrição dos procedimentos e resultados: apresenta uma complementação do Capítulo Três, tratando do detalhamento dos procedimentos específicos de reengenharia, que foram aplicados ao tesauro THESAGRO. Descreve a amostra, composta pelos termos que foram selecionados para a análise e validação do modelo, assim como apresenta a aplicação de cada uma das etapas. Apresenta, também, os resultados empíricos da aplicação do modelo adotado na estrutura do tesauro THESAGRO, fazendo uma análise dos resultados alcançados. Capítulo 8 – Conclusão: discorre sobre os principais objetivos desta investigação, buscando destacar e refletir acerca dos principais resultados, as contribuições verificadas e as limitações encontradas em relação aos mesmos, incluindo recomendações para trabalhos futuros. 28 2 AMBIENTAÇÃO DA PESQUISA Sim sou brasileiro e bem brasileiro. Na minha música deixo cantar os rios e os mares deste grande Brasil. Eu não ponho mordaça na exuberância tropical de nossas florestas e dos nossos céus, que transporto instintivamente para tudo que escrevo. Heitor Villa-Lobos É preciso descrever parte do percurso de desenvolvimento desta pesquisa, visando a subsidiar o entendimento de algumas decisões que foram delineando o caminho. Quando já se havia decidido aplicar a reengenharia ao tesauro THESAGRO, usando o modelo de Dagobert Soergel et al. (2004), a Embrapa Informática Agropecuária (doravante apenas EMBRAPA), sediada em Campinas (SP), fez um convite de parceria que foi uma motivação extra para este estudo. A solicitação aconteceu em meados do ano de 2012 e partiu do Dr. Ivo Pierozzi Júnior, coordenador do centro de pesquisa Organização do Conhecimento e Terminologia Agropecuária, e foi direcionado à Escola de Ciência da Informação (ECI) da Universidade Federal de Minas Gerais (UFMG), especialmente aos pesquisadores da área de Organização do Conhecimento, buscando o aporte de profissionais da área da Ciência da Informação para o desenvolvimento e a construção de instrumentos de organização e representação do conhecimento agropecuário. O convite de parceria foi aceito pela orientadora da proponente, que é também a coordenadora do Grupo MHTX7, Profa. Dra. Gercina Lima, com a ideia de que seria uma oportunidade de estudos para pesquisas acadêmicas e de PD&I (pesquisa, desenvolvimento e inovação). A partir dessa decisão, o Contrato de Cooperação foi elaborado e os setores jurídicos da EMBRAPA e da UFMG discutiram sobre os acordos de proteção recíproca de interesses. Finalizados os ajustes, o Contrato foi assinado pelas partes, em agosto de 2014, porém, o desenvolvimento desta pesquisa já havia se iniciado. A cooperação entre a EMBRAPA e MHTX/UFMG está sendo importante, uma vez que permite estabelecer laços para além das fronteiras da academia. Com isso, cria-se uma união entre o conhecimento, a produção científico-acadêmica e o sistema produtivo, de forma a trazer benefícios aos atores envolvidos, resultando em melhorias para a sociedade. Conforme anunciado pelo representante da EMBRAPA, o Laboratório de Organização e Tratamento da Informação Eletrônica está desenvolvendo, desde 2009, trabalhos envolvendo sistemas de organização do conhecimento (SOC), para serem aplicados especificamente ao domínio da agropecuária. Também já firmaram parcerias com profissionais da área de linguística e com a equipe da Food and Agriculture Organization, 7 O grupo de pesquisa denominado Protótipo Mapa Hipertextual (MHTX), do qual a proponente é integrante, é um modelo para organização hipertextual de documentos, e foi originado da tese de doutorado da coordenadora do grupo e transformado em um projeto-laboratório. 29 Knowledge and Capacity Development (OEKC/FAO), em Roma, responsáveis pelo desenvolvimento e manutenção do tesauro multilíngue AGROVOC. Em diferentes frentes, o grupo de pesquisadores já trabalha com terminologias agrícolas, Processamento de Linguagem Natural (PLN), incluindo o desenvolvimento de software próprio, em plataforma web – o e-Termos –, usado para a gestão terminológica. Na parceria EMBRAPA-UFMG, a parte que cabe à presente pesquisa é a aplicação da proposta de reengenharia a um tesauro da área da agricultura que, neste caso, ficou acordado ser o THESAGRO, principalmente com o reuso do conhecimento contido no AGROVOC. Com isso, espera-se a validação de um modelo conceitual para o mapeamento e organização da terminologia do domínio, de forma a possibilitar o retratamento da complexidade e da dinamicidade do conhecimento agrário, e sua utilização em ambiente web. Ressalta-se que o trabalho cooperativo e compartilhado, propiciado pelo ambiente web, tem sido também almejado e utilizado nas unidades de informação de todo tipo e porte, seja de bibliotecas tradicionais ou de quaisquer outras instituições. Nesse contexto, os tesauros tradicionais ainda têm estrutura semântica que pode ser considerada insuficiente. Concluída essa breve descrição dos encaminhamentos desta pesquisa, passa- se a delinear o perfil da EMBRAPA e do domínio da agropecuária brasileira. 2.1 A EMBRAPA A Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA)8 é vinculada ao Ministério da Agricultura, Pecuária e Abastecimento (MAPA), e foi criada em 26 de abril de 1973. Ela é composta por unidades descentralizadas e possui a missão de viabilizar soluções de pesquisa, desenvolvimento e inovação para a sustentabilidade da agricultura, em benefício da sociedade brasileira. A EMBRAPA é coordenada pelo Sistema Nacional de Pesquisa Agropecuária (SNPA), constituída por instituições públicas federais, estaduais, universidades, empresas privadas e fundações, que têm como meta trabalhar de forma cooperada para executar pesquisas nos diferentes campos do conhecimento científico. Ademais, desenvolve pesquisas por meio de cooperação internacional, envolvendo parcerias para desenvolvimento de pesquisa e de transferência de tecnologia. Buscando descentralizar as frentes de trabalho, sua estrutura é formada por distintas Unidades de Pesquisa e Serviços e de Unidades Administrativas, estando presente em quase todos os Estados brasileiros. A EMBRAPA é detentora de um valioso patrimônio científico e tecnológico, resultante de suas atividades de Pesquisa, Desenvolvimento e Inovação (PD&I), voltadas 8 A maior parte das informações dessa seção, sobre a Embrapa, foi coletada em seu site oficial. Disponível em: . Acesso em: 12 jul. 2013. 30 para a sustentabilidade da agricultura, em benefício da sociedade (EMBRAPA, 2008). Esse patrimônio vem de diferentes campos, dentre os quais, destacam-se as áreas de agricultura, agroenergia, agroindústria, tecnologia de alimentos, biotecnologia, nanotecnologia, produção animal, floresta e silvicultura. Desde a sua criação, a EMBRAPA dedica-se à geração de conhecimento, tecnologia, produtos e serviços para a agricultura nos trópicos. A incorporação de inovações tecnológicas garantiu ao Brasil grandes saltos de qualidade e produtividade agrícola e, ainda, o provimento de alimentos e insumos para a população urbana e o setor industrial. Diante da relevância da agricultura para o país, a EMBRAPA mantém o compromisso permanente de divulgar e de viabilizar o acesso on-line às informações e às tecnologias por ela produzidas. Essas informações referem-se aos interesses imediatos dos produtores rurais e dos agentes de desenvolvimento, da assistência técnica e de extensão, assim como da sociedade em geral. A exceção é feita para informações classificadas, cujas confidencialidade e sigilosidade estão restritas, por leis ou regulamentos, a classes ou pessoas específicas. Dentre as diversas unidades descentralizadas da Empresa, destaca-se a EMBRAPA Informática Agropecuária (EIA), alocada em Campinas (SP), que foi criada com o objetivo de fortalecer a informatização, em especial no setor agropecuário. A EIA pretende ser referência nacional e internacional em gestão e em difusão de informações, valorizando o trabalho cooperativo entre as diversas instituições e a sociedade. Para isso, desenvolve soluções tecnológicas para reunir e disponibilizar todo o conhecimento científico de diferentes temáticas, visando ao aumento de produtividade de pequenas, médias e grandes propriedades rurais. Devido ao aumento da produção de informações e à compartimentação de sua organização, há uma genuína preocupação em manter essas partes interligadas. Nesse sentido, há uma constante busca por soluções de qualidade para a organização e gerenciamento de informações. Nos encontros realizados com o Grupo MHTX, o pesquisador da Embrapa, Dr. Ivo Pierozzi Jr. ressaltou que a empresa carece de modelos de organização e de representação do conhecimento que possam ser adotados no desenvolvimento de soluções tecnológicas para compartilhamento de informações. Segundo o cientista, na EMBRAPA já há o trabalho tradicional de catalogação e indexação de todo o recurso informacional da empresa. Contudo, aponta que a EIA almeja o desenvolvimento e a implantação de SOCs que possam alinhar o conteúdo informacional digital da EMBRAPA, dentro do contexto de Web Semântica, fazendo uso de tecnologias emergentes que possam minimizar a ambiguidade da informação disponibilizada. Uma vez que a EIA já dispõe de meios para atuar nas questões de tecnologia da informação e dos recursos tecnológicos, o Dr. Ivo buscou interlocutores, na área da Ciência da Informação (CI), para agregar competências ao 31 trabalho que vem sendo realizado. Como interesses comuns, o cientista destaca a concepção teórico-conceitual, a construção, validação e implantação tecnológica de SOCs, de forma gradual, visando a atender subdomínios do conhecimento agropecuário. O pesquisador sugere trabalhar com recortes em subdomínios, relacionados a grupos específicos de PD&I da EMBRAPA, devido à amplitude do domínio de conhecimento agropecuário e de sua característica multifacetada. A partir dessa estratégia, acredita ser possível agregar valor aos recursos informacionais disponibilizados pelas distintas unidades da EMBRAPA, com vistas a oferecer ao usuário uma recuperação de informação mais relevante. É no contexto dessa demanda teórico-conceitual que esta pesquisa se insere, com a proposta de reengenharia do THESAGRO, tesauro da área da agricultura, estudando e aplicando o modelo desenvolvido por Soergel et al. (2004). Com o objetivo de alinhar o entendimento sobre o que caracteriza o domínio da agropecuária brasileira, apresenta-se o próximo Subcapítulo. 2.2 O CAMPO DE INVESTIGAÇÃO: AGROPECUÁRIA BRASILEIRA As questões acerca do entendimento do domínio da agropecuária brasileira têm sido estudadas pela Geografia, História, Sociologia e Economia, a partir de diferentes abordagens (GIRARDI, 2008). Esse domínio é bastante complexo devido, sobretudo, por sua agrodiversidade. O Instituto Brasileiro de Geografia e Estatística (IBGE)9 aponta que o Brasil é composto por seis grandes biomas: a Amazônia, Mata Atlântica, Caatinga, Cerrado, Pantanal e Pampa. O termo “bioma” designa um complexo conjunto de elementos que compõem a agrobiodiversidade, pois é um conjunto de vida (vegetal e animal) constituído pelo agrupamento de tipos de vegetação contíguos e identificáveis em escala regional, com condições geoclimáticas similares e história compartilhada de mudanças, o que resulta em uma diversidade biológica própria (IBGE, 2012, on-line). Conforme informações disponíveis no site do Ministério do Meio Ambiente10 (MMA), a agrobiodiversidade é um termo que inclui todos os componentes da biodiversidade que têm relevância para a agricultura e alimentação, assim como todos os componentes da biodiversidade que constituem os agroecossistemas. Esses componentes englobam as variedades e a variabilidade11 de animais, de plantas e microrganismos, seja nos níveis 9 As informações apresentadas de autoria do IBGE referem-se a dados disponibilizados pela instituição no ano de 2012, no site oficial do IBGE. Disponível em: . Acesso em: 15 jul. 2013. 10 BRASIL. Ministério do Meio Ambiente. [Site com informações sobre a área agropecuária brasileira]. Disponível em: . Acesso em: 20 jul. 2013. A maior parte das informações acerca da complexidade da agrodiversidade brasileira foi retirada desse site governamental. 11 Capacidade de submeter-se a variações, adaptações ou mudanças. 32 genético, de espécies ou de ecossistemas, os quais são necessários para sustentar as funções básicas dos agroecossistemas, suas estruturas e processos. Ou seja, a agrobiodiversidade é a parcela da biodiversidade utilizada pelo homem na agropecuária, ou em práticas correlatas, de forma domesticada12 ou semidomesticada. A biodiversidade de flora e fauna brasileira é a maior do planeta, contando com grande variedade de animais, plantas, micro-organismos e ecossistemas, muitos deles únicos em todo o mundo. Toda essa riqueza deve-se, entre outros fatores, à extensão territorial e aos climas diversificados nas distintas regiões do país. Por exemplo, o MMA possui relatórios e publicações sobre a biodiversidade brasileira, comprovando que o Brasil possui o maior número de espécies conhecidas de mamíferos e de peixes de água doce, o segundo de anfíbios, o terceiro de aves e o quarto de répteis. Ademais, o Brasil ocupa o primeiro lugar em biodiversidade vegetal, com mais de 50 mil espécies de árvores e arbustos. O MMA ressalta que, apesar de todos esses dados, o registro da biodiversidade pode representar apenas 10% da vida no país, uma vez que há regiões ainda pouco conhecidas e estudadas pelos cientistas da área. Nota-se, assim, que o domínio da agropecuária brasileira é de alta complexidade, o que exige do agricultor e dos pesquisadores maior conhecimento sobre aspectos ecológicos, sociais, econômicos, culturais, políticos e éticos da área (GEMMA, 2008). Gemma (2008) afirma que isso envolve coletar informações sobre solos, climas, vegetação, animais e ecossistemas. A autora sugere que haja investimento em tecnologias organizacionais que possam facilitar o acesso a informações que auxiliem o agricultor e os pesquisadores nas tomadas de decisões. Gonçalves e Souza (2008) acrescentam que as transformações ocorridas na atividade agropecuária no Brasil, nas últimas cinco décadas, exercem profundos impactos sobre a reorganização do território brasileiro e, a autora desta tese acrescenta, sobre a organização de seu recurso informacional. Com isso, há uma exigência por mudanças nas estruturas rurais mais conservadoras, sobretudo relacionadas ao emprego de tecnologias para coleta, processamento, armazenamento e disseminação de informação (YAMAGUCHI, 2002). Dessa maneira, há a necessidade de integrar as distintas dimensões dos conhecimentos acerca do domínio da agropecuária, de forma a criar uma organização dinâmica para esses saberes, com intercâmbio de experiências, que possam se adequar às diferentes demandas de informação (GEMMA, 2008). 12 A domesticação de animais ou plantas é um processo utilizado desde a pré-história e consiste na seleção e adaptação de certos seres vivos, considerados úteis para suprir necessidades humanas. Esse processo acarretou modificações em várias características originais dos seres vivos domesticados. Por um lado, ela é benéfica para o desenvolvimento da humanidade. Por outro lado, é prejudicial à natureza e à ecologia, pois provoca uma seleção artificial de alguns seres vivos, sendo um fator de redução da biodiversidade. 33 Nesse contexto, a EMBRAPA possui unidades que se empenham no desenvolvimento de soluções tecnológicas para a disponibilização compartilhada de informações, tanto para os agricultores quanto para pesquisadores. Entre essas unidades, a EMBRAPA Informática Agropecuária (EIA), já citada, propôs o projeto INTAGRO, que visa à organização e representação dos processos de Intensificação Agropecuária. 2.2.1 O projeto INTAGRO13 O projeto “Intensificação Agropecuária em Polos de Produção de Soja e Cana- de-Açúcar: Territorialidade, Sustentabilidade e Competitividade” (INTAGRO), foi desenvolvido pela EIA, contando com a participação da EMBRAPA Monitoramento por Satélite (Campinas/SP), EMBRAPA Solos (Rio de Janeiro/RJ), EMBRAPA Soja (Londrina/PR), EMBRAPA Arroz e Feijão (Santo Antônio de Goiás/GO), EMBRAPA Amazônia Oriental (Belém/PA) e EMBRAPA Rondônia (Porto Velho/RO). O principal objetivo do projeto foi mapear a realidade das atividades de Intensificação Agropecuária em regiões brasileiras, e buscar identificar se o crescimento da produção de grãos está associado à expansão da área agricultável ou à adoção de processos produtivos mais intensivos. Essa questão norteou o projeto INTAGRO durante o período de 2008 a 2011, em uma investigação sobre a produção de duas das mais expressivas commodities agrícolas brasileiras: a soja e a cana-de-açúcar. A produção desses dois alimentos envolve oferta de alimentos e bioenergia, abarcando vários elementos que integram os processos de Intensificação Agropecuária, tais como a dinâmica de uso da terra e a utilização de tecnologias na produção de alimentos, que está associado a expressivos índices de produtividade. O mapeamento das características desses elementos, que envolvem a produção de soja e cana-de-açúcar, permitiu perceber os aspectos agroambientais e socioeconômicos que englobam o processo de Intensificação Agropecuária. Os resultados dessa investigação geraram conhecimentos que devem ser apropriados e disseminados nos núcleos de pesquisa da EMBRAPA. Para isso, vêm sendo desenvolvidas iniciativas relacionadas à criação de uma terminologia e de SOCs que possam representar a área de especialidade da Intensificação Agropecuária. O conhecimento sobre a área temática Intensificação Agropecuária, derivados das investigações realizadas no âmbito do projeto INTAGRO, tem como fundamento as bases teóricas desenvolvidas por Boserup, em 1965. Essa área temática foi selecionada como recorte desta pesquisa, cujas características estão descritas no Subcapítulo 2.3, a seguir. 13 As informações deste Subcapítulo foram obtidas no site da Embrapa e em Boletins de Pesquisa disponibilizados por Ivo Pierozzi Jr. 34 2.3 RECORTE TEMÁTICO DA PESQUISA: INTENSIFICAÇÃO AGROPECUÁRIA O desenvolvimento da agropecuária brasileira tem seu marco após a Segunda Guerra Mundial, por volta de 1945. Depois, com os princípios da Revolução Verde (uso de fertilizantes, defensivos, corretivos do solo, sementes melhoradas, combustíveis e máquinas industriais), esse desenvolvimento foi ainda maior, e contou ainda com políticas estatais de modernização e crédito subsidiado, o que incrementou a produção agropecuária. Todas essas mudanças geraram diferentes concepções sobre o processo e os fatores intervenientes no crescimento rural, com discussões acerca das desigualdades nas microrregiões brasileiras, que se instituíram ao longo do tempo. O conceito de Intensificação Agropecuária (IA) adotado nesta tese segue a teoria de Boserup (1965). De acordo com essa teoria, a IA é a relação entre o aumento total da produção agrícola, em uma mesma unidade de área, por unidade de insumos, ou a manutenção de uma mesma produção, usando uma menor quantidade de insumos (OLIVEIRA, 2011). Sendo assim, a IA é qualquer prática agropecuária que aumenta a produção em uma mesma área, levando em consideração aspectos tais como a biodiversidade, a sustentabilidade e segurança alimentar. A teoria de Boserup opõe-se à Teoria Malthusiana, formulada no final do século XVIII, que se baseia no princípio da escassez. O economista e demógrafo inglês, Tomas Robert Malthus (1766-1834), criou a primeira teoria populacional ao indicar uma relação entre o crescimento da população e a fome, alegando que a população humana tende a crescer mais rapidamente que a produção de alimentos. Como consequência disso, sugeria que a produção de alimentos não conseguiria suprir as necessidades da população, dado o seu (ritmo de) crescimento (BOSERUP, 1965). Malthus desenvolveu sua ideia em um momento de grande crescimento demográfico, durante a Revolução Industrial, em um período no qual a produção de alimentos aumentou e a taxa de mortalidade decresceu (ALVES, 2002). Alves (2002) afirma que Malthus defendia que o crescimento demográfico iria superar a capacidade de produção de alimentos, o que geraria fome, miséria e doenças. Malthus indicava como solução que o Governo obrigasse o controle da natalidade, aumentasse o preço dos alimentos e reduzisse os salários dos trabalhadores, principalmente da população mais pobre (ALVES, 2002). Contrariando a teoria de Malthus, a economista dinamarquesa Ester Boserup (1910-1999) desenvolveu uma nova proposta sobre o assunto. Durante sua vida ativa, Boserup trabalhou em distintas organizações internacionais, incluindo a Organização das Nações Unidas. Também contribuiu com as discussões acerca de problemas de gênero e o 35 papel do trabalho da mulher no desenvolvimento econômico, sobretudo no Terceiro Mundo, publicando, em 1970, o primeiro trabalho sobre esse tema. Estudando o desenvolvimento econômico e agrícola, Boserup (1965) faz uma relação entre a população, o meio ambiente e a tecnologia. Lele e Stone (1989) afirmam que, para Boserup, o conceito de população engloba a densidade populacional, incluindo o seu tamanho absoluto e crescimento. Os autores acrescentam que a expressão “meio ambiente”, quando utilizada por Boserup, refere-se, principalmente, aos recursos da terra e a fatores tais como os climáticos e a qualidade do solo. Uma vez que a teoria foi criada após a Revolução Industrial e durante a Revolução Verde14, a tecnologia para Boserup tem estreita relação com ferramentas (por exemplo, tratores), técnicas (por exemplo, períodos de pousio) e insumos (por exemplo, adubos e fertilizantes) utilizados na agricultura (LELE; STONE, 1989). A teoria de Boserup defende que o crescimento do consumo de alimentos implica aumento na frequência de cultivo, com um menor período de pousio15, principalmente em áreas de uso extensivo e de baixos níveis tecnológico e de subsistência (LAMBIN, 1994). Lambin (1994) acrescenta também que a IA é uma relação entre o crescimento da densidade populacional e o emprego de maior quantidade de trabalho a ser executado. Para o autor, a ideia de Boserup sugere que sempre haverá a aplicação de um sistema mais extensivo de plantio quando a densidade populacional pressionar pelo aumento da produção de alimentos. Nessa perspectiva, a geração de uma produção maior de alimentos em uma mesma área para plantio indica que houve a aplicação de técnicas de conservação do solo, que buscam manter ou maximizar a sua fertilidade. A fertilidade não é algo imutável e inerente ao solo, pois é bastante variável e intimamente associada ao método agrícola utilizado. Como consequência desse ajuste, pode haver maior produção relativa (produtividade) e absoluta de alimentos, porém, com um retorno de produção por hora de trabalho menor (LAMBIN, 1994). Para Boserup, mesmo se não pudermos ter certeza de que os sistemas de uso extensivo da terra precedem os de uso intensivo, em todas as partes do mundo, parece haver pouca razão para duvidar que a sequência típica de desenvolvimento da agricultura tem sido uma mudança gradual – mais rápida em algumas regiões do que em outras –, de um tipo de uso extensivo da terra para um tipo intensivo (BOSERUP, 1965, p. 17-18). Nesse sentido, a IA pode ser associada às mudanças no uso da terra e no período de pousio, pois, se a densidade demográfica aumenta, primeiramente há a 14 Amplo programa, iniciado em meados do século XX, visando a aumentar a produção agrícola no mundo a partir de melhorias genéticas em sementes, do uso intensivo de insumos industriais, mecanização e redução do custo de manejo. 15 Período de descanso ou repouso proporcionado às terras cultiváveis. 36 expansão da área cultivada e, quando a terra fica escassa, há o encurtamento do tempo de pousio, visando a atender à maior demanda por alimentos. Para Boserup (1965), o prejuízo causado pela diminuição no período de pousio é compensado pela disponibilização de mais trabalho, uma vez que intensificar o cultivo implica em oferta de atividades agrícolas o ano inteiro. Com isso, a economista afirma que a própria pressão populacional dá origem a uma solução, porque a escassez de terras gera a alta nos preços dos alimentos, levando ao seu uso mais intensivo. Lele e Stone (1989) afirmam que o ponto de vista da teoria de Boserup foi aprofundado e adotado por Pingali, Bigot e Binswanger (1986). Por outro lado, Mortimore (1993) considera a teoria de Boserup uma simplificação da realidade, negligenciando, por exemplo, o mercado. Porém, é preciso ressaltar que, analisando a teoria de Boserup, é possível perceber a inclusão da variável “mercado”, uma vez que o superávit gerado pelo cultivo intensivo contribui para o crescimento, em efeito cadeia, de outros setores, tais como os de infraestrutura, crédito e serviços, afetando o mercado (LELE; STONE, 1989). Assim, não procede, o argumento de que Boserup desconsiderou o mercado na formulação de sua teoria, pois ela fez uma relação entre população, o meio ambiente e a tecnologia, indicando a inter-relação desses elementos com outros setores na sociedade. Conceitualmente, Pierozzi Júnior, Oliveira e Souza (2010) esclarecem que, De maneira genérica, pode-se entender a Intensificação Agropecuária como qualquer prática agropecuária que aumenta a produtividade por unidade de área. Desse modo, Intensificação Agropecuária pode representar desde a redução no período de pousio e multissafras, até irrigação, fertilização, uso de animais de carga, maquinaria, variedades de vegetais ou animais modificados geneticamente, defensivos químicos, etc. (PIEROZZI JR; OLIVEIRA; SOUZA, 2010, p. 3). Nota-se, assim, que esse campo de estudo representa um complexo processo agrossocioeconômico, oponente à Teoria Malthusiana. Segundo Boserup, uma maior intensificação agrícola poderá levar a maior racionalidade na utilização de insumos e, mesmo que a quantidade total de uso desses insumos seja aumentada, esse fato poderá ser compensado pelo aumento proporcional da produção (OLIVEIRA, 2011). Sobre o uso da terra para maior produção, Girardi (2008) relata que, até o século XX, antes da industrialização, a extração vegetal e a agricultura monocultora de exportação no Brasil determinaram a forma de ocupação do território. O autor destaca que, naquela época, a ocupação de novas áreas, com o aparecimento de diferentes cidades, aconteceu, sobretudo, devido às características das atividades de Intensificação Agropecuária. Pierozzi Jr, Oliveira e Alencar (2012) afirmam que o estado atual da pesquisa conceitual na área da Intensificação Agropecuária, especialmente evidenciado pelos resultados do projeto INTAGRO, demonstrou o caráter multifacetado e multidisciplinar de seus processos. Os autores indicam que, para a completa interpretação e compreensão dos 37 processos dentro desse campo, é preciso levar em consideração as distintas variáveis, dentre as quais situam-se as ambientais, agronômicas, territoriais, socioeconômicas e os contextos institucionais específicos. Nesse sentido, Pierozzi Jr, Oliveira e Alencar (2012) almejam a construção de distintos SOCs para subdomínios da agropecuária, que possam ser integrados e interligados, tornando-se interoperáveis. Assim, os pesquisadores esperam que os SOCs sejam capazes de evoluir para formatos mais refinados em estrutura conceitual, de forma que estejam alinhados ao uso conjunto com as aplicações computacionais emergentes. 38 3 CARACTERIZAÇÃO E DEFINIÇÃO DA METODOLOGIA Se soubesse que o mundo se desintegraria amanhã, ainda assim plantaria a minha macieira. Luther King Neste Capítulo estão apresentadas a caracterização e a definição da metodologia de pesquisa, incluindo detalhes de como foi realizada a pesquisa bibliográfica e a seleção dos trabalhos descritos no Capítulo da revisão de literatura. A aplicação da metodologia do modelo de conversão será exposta no Capítulo Sete, denominado “Descrição dos procedimentos e resultados”, logo após o Capítulo da fundamentação teórico-metodológica. Essa foi uma decisão pautada na ideia de conduzir o leitor para um melhor entendimento do percurso escolhido. Ademais, esta pesquisa é caracterizada como um estudo de caso, especificamente do tipo instrumental, pois busca estudar e validar uma única metodologia de reengenharia de tesauro. Nessa perspectiva, acredita-se conveniente manter as informações acerca do fundamento metodológico – que é, basicamente, a descrição do método – próximo aos procedimentos que foram, de forma efetiva, adotados nesta investigação. Dessa maneira, pressupõe-se que a leitura e a compreensão do caso estudado se tornarão mais fáceis e inteligíveis. (1) Caracterização da pesquisa Com base nos fundamentos oferecidos por Gil (1994), nesta pesquisa houve procedimentos de natureza: (1) exploratória, pois não houve a formulação de hipóteses e, sim, a busca por informações sobre determinado assunto sobre o qual há pouco ou insuficiente conhecimento, visando a um trabalho preliminar e preparatório, sendo que o levantamento bibliográfico forneceu insumos para a investigação, facilitando a delimitação e a concretização desta pesquisa; (2) aplicada, pois envolveu a aplicação e teste de um método de reengenharia de tesauro, com o objetivo de obter e ampliar o conhecimento sobre esse método, com vistas à sua utilização em situações similares; (3) empírica, que se traduz como um estudo empírico sobre um fenômeno, dentro de determinado contexto (GIL, 1994), pois a reengenharia foi aplicada a um tesauro já existente, o THESAGRO; (4) estudo de caso, uma vez que a investigação foi realizada para estudar e validar uma única metodologia de reengenharia de tesauro, com procedimentos adotados para essa finalidade específica; (5) qualitativa, porque abrange análise de questões do mundo real, dos significados e da semântica dos relacionamentos entre conceitos e termos, por exemplo, sem uso de dados estatísticos. 39 (2) Pesquisa bibliográfica A pesquisa bibliográfica é uma técnica que tem como finalidade explorar, na literatura da área (livros, revistas, teses, entre outros), material sobre determinado assunto de interesse da pesquisa (MARCONI; LAKATOS, 2010). Nesse sentido, a busca bibliográfica foi feita de forma exaustiva, visando encontrar documentos sobre o tema da reengenharia de tesauros tradicionais e temas adjacentes. Esta etapa foi feita nas bases de dados do Portal Capes e de outros provedores, incluindo (mas não se limitando) à base de dados Web of Science, E-Prints in Library and Information Science (E-LIS), Educational Resources Information Center (ERIC), Library and Information Science Abstracts (LISA), CiteSeer, Dedalus, Metasearch da Universidade de Hanover, Elsevier Science Direct, Portal ACM, Base de Dados Referenciais de Artigos de Periódicos em Ciência da Informação (BRAPCI), Google Acadêmico, às revistas científicas nacionais da área da BCI, dentre as quais destacam-se as internacionais Annual Review of Information Science and Technology (ARIST), com artigos de revisão, e as duas revistas da ISKO16, a Knowledge Organization Journal e a Advances in Knowledge Organization, assim como Bibliotecas Digitais de Teses e Dissertações de diferentes instituições, a Biblioteca Professora Etelvina Lima, da ECI-UFMG, e também acervo pessoal. A pesquisa bibliográfica foi um processo contínuo durante todo o percurso desta tese, até julho de 2014, e na estratégia de busca foram formuladas queries com as seguintes expressões (também traduzidas para os idiomas: inglês, espanhol, francês e italiano): sistemas de organização do conhecimento, linguagens documentárias, linguagens de indexação, reengenharia de tesauros, conversão de tesauros, transformação de tesauros, adaptação de tesauros, conversão de recursos não ontológicos, reengenharia de recursos não ontológicos, além de combinações dessas expressões com outros tipos de SOCs: sistemas de classificação bibliográfica, taxonomia e dicionários. (3) A revisão de literatura A revisão de literatura envolve localizar, analisar, sintetizar e interpretar trabalhos já publicados, relacionados com o tema de uma determinada pesquisa (BENTO, 2012). Ela compôs a parte inicial da pesquisa bibliográfica, quando foram recuperados documentos que indicaram trabalhos com propostas similares à desta investigação. Noronha e Ferreira (2000) definem a revisão de literatura como o reconhecimento de novas ideias e métodos, sobre um tópico específico, encontrados nas publicações da área de conhecimento. Essas informações podem contextualizar e dar o entendimento necessário acerca do tema que está sendo investigado, apontando em que 16 International Society for Knowledge Organization, fundada em 1989, é a principal sociedade científica responsável pela área de Organização do Conhecimento. 40 nível de investigação se encontra aquele objeto de estudo. Figueiredo (1990) classifica a revisão de literatura a partir de duas funções interligadas: (a) função histórica e (b) função de atualização (descobertas recentes sobre um tema). Além do critério da função, Noronha e Ferreira (2000) acrescentam que as revisões de literatura podem ser classificadas quanto a: (1) propósito: analíticas (puramente revisões, com um fim em si mesmas) ou de base (dando suporte ao referencial teórico de trabalhos acadêmicos), (2) abrangência: temporal (recorte) e/ou temático (tema específico); (3) tratamento e abordagem: bibliográficas ou críticas (feitas por especialistas em tema específico). A revisão de literatura apresentada no Capítulo Quatro foi realizada a partir de um recorte temporal e temático, tendo por base as premissas expostas, das duas funções (histórica e de atualização) e dos três elementos descritivos (propósito, abrangência e tratamento/abordagem). Adotou-se a proposta de Flick (2009, p. 64), por se tratar de um estudo de caso, que recomenda descrever outros estudos na área, ou em área similar, que trabalham com o tema estudado, indicando sob qual perspectiva o estudo vem sendo feito. Utilizou-se, portanto, a estratégia de busca já apresentada17, investigando estudos com objetivos semelhantes ao proposto nesta pesquisa. Como resultados, foram recuperadas publicações que discorrem sobre o uso de vários instrumentos terminológicos que são utilizados para o enriquecimento da terminologia de ontologias, incluídos os tesauros, mas que também incluíam outras fontes tais como glossários, dicionários, sistemas de classificação bibliográfica e folksonomias. Para atender ao escopo específico desta pesquisa, foi feita uma seleção, dando prioridade somente àqueles trabalhos que tratavam sobre o tema de conversão de tesauros tradicionais em ontologias, usando processos semiautomáticos ou intelectuais na modelagem. A definição desse critério de triagem foi devido à inexistência de trabalhos que tratassem somente da reengenharia da estrutura de um tesauro, sem convertê-lo em uma ontologia. Contudo, esses estudos são adequados ao escopo desta pesquisa porque todos os métodos analisados incluem uma etapa intelectual, realizada para o refinamento semântico da estrutura conceitual de um tesauro tradicional. Assim, a seleção resultou em quinze trabalhos, sendo um brasileiro e quatorze estrangeiros (treze em inglês e um em francês), que estão apresentados no Capítulo Quatro. Ressalta-se que foram excluídos dessa seleção trabalhos com três diferentes características: (1) apenas fizeram o reuso de terminologia dos tesauros, sem que houvesse reuso de estrutura conceitual; (2) conversão puramente automática de tesauros em ontologias, uma vez que não indicaram atividades intelectuais de modelagem, ainda que estivessem implícitas, adequando-se mais a estudos nas áreas das Ciências da 17 Ver item (2) deste Capítulo, dentro do tópico “pesquisa bibliográfica”. 41 Computação ou Inteligência Artificial (CHUN; LU, 2004; YAO, 2006; KHOSRAVI; VAZIFEDOOST, 2007; CARDILLO et al., 2014); (3) apenas avaliação da estrutura conceitual do tesauro tradicional para a sua conversão em ontologias, sem apresentar qualquer experimento (SCHULZ et al., 2010). (4) Delimitação do universo de pesquisa O universo de uma pesquisa de natureza teórico-empírica é o conjunto de seres animados ou inanimados, representado por um grupo de pessoas, objetos, fenômenos ou eventos, que possui pelo menos uma característica em comum (APPOLINÁRIO, 2004; MARCONI; LAKATOS, 2010). Marconi e Lakatos (2010) afirmam que a delimitação do universo de uma pesquisa pode ser realizada a partir de diferentes aspectos. Nesse sentido, foram estabelecidos os seguintes limites para o universo desta pesquisa: (a) quanto ao campo de investigação: o campo de estudo engloba a área da agricultura e os tesauros. Atendendo a isso, foi selecionado o tesauro THESAGRO, que é o único tesauro brasileiro especializado em literatura agrícola, desenvolvido segundo normas internacionais, cujas características estão detalhadas no Subcapítulo 6.3.1. A escolha do THESAGRO se justifica por ele ser da mesma abrangência temática do tesauro AGROVOC, no qual o modelo conceitual adotado foi experimentalmente aplicado, e por ser a área temática de PD&I da EMBRAPA, que é o ambiente desta investigação. (b) quanto ao recorte ou corpus da pesquisa: Bauer e Aarts (2002, p. 44) definem corpus como sendo “uma coleção finita de materiais (textos, imagens ou sons) determinada de antemão pelo analista, com inevitável arbitrariedade e com a qual se irá trabalhar”. Estabeleceu-se como corpus de pesquisa o conjunto de termos da área temática de Intensificação Agropecuária. A escolha desse recorte se justifica, sobretudo, pela sugestão do especialista da EMBRAPA, ligado ao convênio de parceria entre a MHTX/UFMG e a EMBRAPA, pois o assunto é a sua especialidade. (c) quanto à amostra: uma amostra é “uma parcela convenientemente selecionada do universo (população); é um subconjunto do universo” (MARCONI; LAKATOS, 2010, p. 146), cuja escolha é feita a partir de alguma técnica de amostragem. Assim, foi aplicada a técnica de amostragem não-probabilística, a partir de uma amostra intencional. Nesse tipo de amostra, usam-se critérios decorrentes da experiência profissional e do conhecimento da área de especialidade (MARCONI; LAKATOS, 1990). No caso desta pesquisa, considera-se que a amostra é adequada e representativa, tendo sido validada pelo especialista da área temática Intensificação Agropecuária. 42 (d) quanto ao objeto de estudo: para a proposta de reengenharia do THESAGRO foi analisado e selecionado o método desenvolvido por Soergel et al. (2004) e Lauser et al. (2006). A escolha desse modelo foi determinada de forma arbitrária, pela proponente, em comum acordo com a sua orientadora. A razão mais forte se deve ao fato, já mencionado na introdução, de que o modelo desenvolvido pelos autores foi aplicado experimentalmente no AGROVOC, sendo o único que apresenta procedimentos gradativos de conversão de um tesauro tradicional em uma ontologia, permitindo uma aplicação parcial da formalização do instrumento. Ademais, um dos autores do modelo, o professor Dagobert Soergel, é um pesquisador com reconhecida competência internacional e relevante na área de Organização do Conhecimento, campo no qual esta pesquisa se insere. Esclarece-se que os fundamentos do modelo estão descritos no Capítulo Seis. (5) Aplicação do modelo O detalhamento da aplicação do modelo de Soergel (2004; 2006) está descrito no Capítulo Sete, no qual também está a análise dos resultados obtidos. Após esta exposição, da caracterização da metodologia utilizada, passa-se à apresentação do Capítulo Quatro, da revisão de literatura, sobre trabalhos com objetivos similares à proposta desta pesquisa, que será seguida pelo Capítulo Cinco, que aponta e discute os fundamentos teórico-contextuais que orientam este estudo. 43 4 REVISÃO DE LITERATURA A primeira condição para modificar a realidade consiste em conhecê-la. Eduardo Galeno (1940-2015) Neste Capítulo estão apresentados os trabalhos pautados em estudos sobre propostas de métodos para o refinamento das relações existentes em tesauros tradicionais, com o objetivo de transformá-los em ontologias de domínio. Como já esclarecido no Capítulo Três (Caracterização e Definição da Metodologia), no item três (Revisão da Literatura), esses estudos foram selecionados porque a pesquisa bibliográfica não recuperou estudos que abordassem apenas o refinamento da estrutura semântica de tesauros tradicionais, sem convertê-los em ontologias de domínio, o que evidenciou a incipiência desse tipo de estudo no campo da Biblioteconomia e Ciência da Informação (BCI). Esta revisão é um mapeamento do estado atual do tema investigado, entre os anos de 1991 e julho de 2013. O ano de 1991 representa um marco, porque corresponde à data na qual o tema começou a ser discutido com maior frequência, nas publicações da área BCI, de acordo com estudo realizado por Nascimento et al. (2007). Ficou evidente, pelos resultados da pesquisa bibliográfica, que este recorte temporal foi adequado, porque somente a partir do ano 2000 foram recuperados os estudos sobre a conversão de tesauros tradicionais em ontologias. A análise dos trabalhos recuperados foi realizada a partir da identificação dos seguintes parâmetros: (a) objetivo do estudo descrito; (b) tipo de conversão utilizado: automática, semiautomática ou intelectual; (c) descrição do modelo e dos procedimentos de conversão utilizados; (d) uso das relações representadas no tesauro e a sua explicitação semântica; (e) resultado do estudo descrito. Ao final, foi realizada uma relação entre os resultados dos estudos apresentados e a proposta desta pesquisa. Para a apresentação dos trabalhos selecionados, optou-se por descrever, primeiramente, o estudo brasileiro sobre o tema, de Campos et al. (200818), proveniente da área da BCI. Posteriormente, foram apresentados os quinze artigos estrangeiros selecionados, na ordem cronológica das datas de publicação. O trabalho brasileiro foi apresentado por Campos et al. (2008) e é intitulado “O uso de tesauro como base terminológica para a elaboração de ontologias de domínio: uma experiência com o domínio do Folclore e Cultura popular”. Esse estudo teve como objetivo o emprego da estrutura hierárquica e das relações conceituais, oriundas do Tesauro de 18 Já citado no Subcapítulo 1.1. 44 Folclore e Cultura Popular Brasileira19, na criação de uma ontologia desse mesmo domínio (folclore). O escopo incluiu verificar se havia obtenção de expressividade no refinamento das relações já existentes e descoberta de novas associações entre termos, a partir das definições contidas no tesauro. A metodologia desenvolvida pelos autores é composta por cinco etapas: (1) criação das classes; (2) criação das relações hierárquicas e associativas; (3) criação das relações partitivas; (4) criação de relações obtidas por inverso de relações existentes; (5) organização das classes não hierarquizadas. A ontologia foi desenvolvida de forma semiautomatizada, uma vez que envolveu análises intelectuais e ferramentas computacionais, utilizou a linguagem Web Ontology Language (OWL) e o editor de ontologias Protégé. Durante esse processo, ficou evidenciado que as relações hierárquicas podem ser facilmente modeladas usando o próprio princípio de atribuição utilizado no tesauro. Quanto às relações associativas, notou-se a necessidade do uso de uma propriedade denominada “ehAssociado”, conectando-as com as suas classes. Também foram descobertas algumas classes que não estavam incluídas na estrutura hierárquica do tesauro. A solução encontrada para sanar essas questões suscitadas, foi criar uma classe mais ampla, denominada , na qual foram agrupados esses novos termos, o que tornou a estrutura mais consistente. Outra dificuldade encontrada na conversão realizada foi com a utilização da linguagem OWL, pois, como esta linguagem representa as relações de equivalências em forma de hierarquias (iguais às relações hierárquicas), houve similaridade em suas representações gráficas (ou visuais), o que exigiu que se criasse uma propriedade específica para elas. Na modelagem das relações associativas, também houve problemas, por dois motivos: (1) tipo de ligação não muito clara sobre a natureza do vínculo; (2) conexões realizadas manualmente. Isso tornou a tarefa morosa, o que permitiu atribuir somente um número pequeno de relações, a saber: , e . Apesar dessas questões, a ontologia criada permitiu que fossem feitas inferências sobre o domínio representado no tesauro do folclore, o que facilitou as buscas e aprimorou a visualização dos relacionamentos entre os conceitos do tesauro, em sua aplicação na web. Como resultado esse estudo originou dois recursos de visualização: um denominado Árvore Hiperbólica e, outro, denominado Árvore de Palavras, projeto conhecido como “Many Eyes” (ou “Word Tree”). No âmbito internacional, o primeiro trabalho foi publicado por Jian Qin e Stephan Paling, no ano de 2001, intitulado “Converting a controlled vocabulary into an ontology: the case of GEM”. Os autores tiveram como finalidade realizar a conversão do tesauro do Portal para Materiais Educacionais (GEM20) em uma ontologia, visando a descrever objetos digitais desse repositório. O desenvolvimento da ontologia foi realizado de forma semiautomática, 19 Desenvolvido pelo Instituto do Patrimônio Histórico e Artístico Nacional (IPHAN), em 2003. 20 Gateway to Educational Materials. 45 foram usados processos intelectuais de análise e ferramentas computacionais. Os procedimentos da conversão incluíram: (1) descrição mais detalhada dos objetos digitais; (2) atribuição de uma semântica mais profunda para as classes, subclasses e relacionamentos; (3) expressão dos conceitos e relações em uma linguagem de descrição; (4) reutilização e compartilhamento do conhecimento da ontologia em sistemas heterogêneos. Os autores ressaltam que, quando utilizavam somente o tesauro para indexar os itens informacionais, os objetos digitais eram descritos apenas por sua característica geral, deixando de descrever os seus conteúdos. Assim, ao representar um plano de aula somente pelo descritor “Plano de Aulas”, deixavam-se de fora informações sobre o seu conteúdo, tais como amostras de avaliações ou atividades em sala de aula. No processo de estruturação da ontologia foi utilizado o mesmo método, o top-down, adotado na elaboração da estrutura conceitual do tesauro. A terminologia empregada nessa estrutura foi a já existente no tesauro, acrescida de novos termos somente quando necessário. A Ontolíngua foi utilizada como linguagem de descrição, permitindo uma representação expressiva e interativa. Ela foi utilizada para a edição dos formalismos de representação de conceitos, hierarquias, relações n-árias (que ocorrem entre mais de duas entidades), axiomas (princípio básico) e instâncias na ontologia. A estrutura do tesauro GEM foi reestruturada em oito novas classes, que foram reorganizadas dentro da proposta da ontologia. Como o tesauro já possuía um conjunto de relações específicas, o processo de conversão foi facilitado, mesmo exigindo uma análise mais detalhada dos objetos digitais. Os resultados demonstraram que, como o Ontolíngua permite exportação de dados em código LISP21, isso imprimiu uma dimensão formal para as relações, de maneira que tornaram os registros mais facilmente manipuláveis por mecanismos de recuperação. O produto final foi uma estrutura relativamente simples da ontologia, mas que refletiu a simplicidade básica do tesauro GEM e a necessidade específica do portal. Também no ano de 2001, Bonne Jan Wielinga et al. apresentaram o artigo intitulado “From thesaurus to ontology”, no qual os autores expõem um modelo para a conversão do tesauro Art and Architecture Thesaurus (AAT), da área de arte e arquitetura, em uma ontologia de domínio. Os autores tiveram como objetivo estudar as questões relacionadas com a captura de conhecimento já existente sobre objetos de arte. Para isso, realizaram um estudo de caso para a criação de uma ontologia para a descrição de objetos de arte, usando como recorte um subconjunto temático, os mobiliários antigos. A criação da ontologia foi realizada de forma semiautomática, por meio de processos intelectuais de análise e ferramentas computacionais. O software Protégé foi utilizado como editor da ontologia, representado na linguagem Resource Description Framework Schema (RDFS). 21 O Lost In Stupid Parenthesis (LISP) é uma linguagem que possibilita criar novas construções sintáticas, eliminar duplicações de códigos e abstrair padrões no código. 46 Na edição da ontologia, o conceito de “mobiliário antigo” foi representado como uma classe geral, e o conjunto de descritores do tesauro AAT foi descrito como padrões de slots, dentro dessa classe. Assim, os slots representaram as propriedades em RDFS, e os qualificadores, as subpropriedades. Destaca-se que a criação da estrutura da ontologia apenas considerou a relação “subClassOf”. O método desenvolvido levou em consideração o modelo de dados interno do tesauro, bem como padrões de metadados como entrada, sendo aplicado a partir das etapas: (1) construção de um modelo de descrição para mobiliário antigo; (2) ligação de propriedades de objetos de mobiliários a subconjuntos específicos do tesauro AAT, que podem ser utilizados como valores para propriedades de mobiliário; (3) descrição de conhecimento adicional do domínio, em particular sobre as restrições entre mobiliário e seus valores de propriedades, incrementando a estrutura conceitual; (4) ampliação dos relacionamentos para outros campos ainda não cobertos pelo tesauro. Além disso, na entrada dos dados descritos, foi utilizado o padrão de metadados Dublin Core22. Uma dificuldade encontrada foi relativa ao uso da linguagem RDFS, que não permitiu a representação das relações de restrições, o que exigiu a criação de um formato para esse propósito específico. Ao final, foi produzida uma ontologia leve23, composta por classes, atributos e relações, implementados em RDFS. Em 2003, dois distintos artigos apresentam uma proposta de método: (1) “Towards a broad-coverage biomedical ontology based on description logics”, de Udo Hahn e Stefan Schulz; e (2) “Turning informal thesauri into formal ontologies: a feasibility study on biomedical knowledge re-use”, de Udo Hahn. O objetivo do trabalho, descrito nesses dois artigos, foi oferecer um modelo semiautomático de engenharia de ontologias no qual o conhecimento conceitual é extraído de um tesauro da área médica, o Unified Medical Language System – UMLS Metathesaurus, armazenado em arquivos American Standard Code for Information Interchange (ASCII), e convertido em um sistema formal de descrições lógicas (LOOM)24. Os autores utilizaram como recorte de estudo a subtemática das anatomias e patologias médicas. Esse método leva em consideração a estrutura original do tesauro, e é composto por quatro etapas: (1) geração automática de definições conceituais; (2) verificação automática da integridade das hierarquias, utilizando o classificador LOOM; (3) eliminação manual de inconsistências; (4) refinamento manual da base de conhecimento, apoiado por um especialista de domínio. Os pesquisadores também introduziram procedimentos para a conversão automática de relacionamentos, utilizando: 22 Conjundo de metadados que visa a descrever objetos digitais, com aplicações que utilizam XML (EXtensible Markup Language) e RDF (Resource Description Framework). 23 Ontologias leves incluem conceitos, taxonomias dos conceitos, relacionamentos entre conceitos e propriedades que descrevem os conceitos. 24 Linguagem de programação de alto nível, usada na construção de sistemas especialistas e outras aplicações inteligentes. 47 , , e . Foram observados alguns problemas para a conversão e curadoria25 do conhecimento, tais como: (a) adequada integração de conhecimento, a partir de fontes heterogêneas; (b) diferenças verificadas nos níveis de granularidade do conhecimento representado no tesauro UMLS; (c) dificuldade no tratamento da pluralidade de acepções no domínio modelado; (d) problemas para a adequada organização e conceitualização dos níveis de maior abstração na ontologia; (e) falta de definições explícitas de qualidade para todos os conceitos; (f) escolhas entre conceitualizações alternativas de termos médicos, cujos significados nem sempre são exatamente os mesmos. Na conclusão, os autores afirmam que é relativamente simples restituir a consistência da base de conhecimento do tesauro UMLS, mas que é quase impossível chegar a um elevado grau de adequação e abrangência, devido à enorme quantidade de trabalho manual necessário nessa atividade. Como resultado, o método aplicado permitiu aos pesquisadores extrair conhecimento conceitual do tesauro UMLS, possibilitando sua conversão em uma descrição lógica formal26 em LOOM, com classes e relacionamentos, e a atribuição de maior significado semântico ao domínio de especialidade biomédico. O artigo “The National Cancer Institute's thesaurus and ontology” foi publicado por Jennifer Goldbeck et al., em 2003. Nele, os autores propuseram a conversão do tesauro da National Cancer Institute, o NCI Thesaurus, do domínio da bioinformática, que originalmente estava em linguagem XML, para uma ontologia em linguagem OWL. A abordagem utilizada pelos autores considerou que sempre há uma relação unívoca entre o símbolo (termo) e o conceito. Eles desenvolveram o método composto por oito etapas: (1) edição dos conceitos e relações, conforme instruções detalhadas, a partir de uma série de listas; (2) exportação das listas editadas através do gerenciador de terminologia, o Apelon Workflow Manager (AWM), para os respectivos modeladores, que têm uma cópia, de uso individual, do NCI Thesaurus; (3) edições necessárias feitas por cada modelador em sua cópia particular; (4) envio da cópia individual, de cada modelador, de volta ao gestor da ferramenta AWM; (5) análises das edições e, se for necessário, realização de outras correções, por especialistas, que, depois, validam-nas, repetindo-se o ciclo até não haver mais conflitos no conteúdo; (6) liberação semanal para os modeladores da cópia do NCI Thesaurus com as alterações validadas e consolidadas, para atualização de seus bancos de dados locais; (7) liberação do resumo com a lista dos termos candidatos a conceitos para os desenvolvedores dos projetos envolvidos com os testes automatizados, visando à 25 Curadoria de informação é a seleção, preservação, manutenção, coleção e armazenamento de dados informacionais. 26 Estuda a lógica segundo a sua estrutura ou forma, consistindo em um sistema dedutivo de enunciados que tem como objetivo criar um grupo de leis e regras para determinar a validade dos raciocínios. 48 identificação e solução de conflitos e problemas de consistência; (8) publicação da versão final na web. Nesse processo, a análise da estrutura conceitual do tesauro permitiu o mapeamento e a definição de classes e propriedades para a ontologia. Os resultados apontaram que o conhecimento contido na ontologia facilitou o acesso do usuário às informações. Ao final, a estrutura do tesauro pôde ser expandida, de uma descrição lógica para uma estrutura semanticamente rica, resultando em uma ontologia em linguagem OWL. Em seus artigos “A method for converting thesauri to RDF/OWL”, de 2004, e “A method to convert thesauri to SKOS”, de 2006, Mark Van Assem et al. descrevem uma mesma proposta de modelo. Os autores tiveram como objetivo a conversão de tesauros para o formato RDFS e OWL de uma ontologia, utilizando o tesauro do Medical Subject Headings (MeSH) e o WordNet27 como estudos de casos. O método de conversão foi realizado de forma semiautomática, e os autores sugeriram quatro etapas para serem utilizadas nesse processo: (1) preparação inicial, em que ocorre a análise das características do tesauro, com identificação do uso de padrões para a atribuição das relações; (2) realização da conversão sintática, por meio da transformação da estrutura conceitual do tesauro (ou de outra fonte de terminologia) em uma representação em RDFS, refletindo a estrutura original, tanto quanto possível; (3) realização da conversão semântica, na qual as definições de classe e de propriedade são ampliadas e se tornam mais expressivas(explicitação da estrutura), usando-se restrições adicionais de RDFS e OWL (interpretação), que não estão presentes na estrutura original do tesauro; (4) etapa opcional na qual é adotado um padrão internacional para representar a estrutura do tesauro, visando à interoperabilidade entre linguagens. Para essa última etapa, os autores sugeriram o uso do SKOS, mas esclareceram que a experiência realizada no tesauro MeSH apontou a ineficiência desse esquema para representar toda a estrutura conceitual do tesauro. Todas as etapas compreenderam representações sintáticas e semânticas, norteados por um guia de recomendações. Os resultados evidenciaram que a aplicação do método tornou explícitos os relacionamentos semânticos existentes no tesauro e adicionou novas relações: e as ad-hoc. Ao final, foi criada uma ontologia leve, em linguagem RDFS/OWL, contendo classes, atributos e relacionamentos. Destaca-se que esse método foi utilizado por Deliiska (2007) e por Tordai, Omelayenko e Schreiber (2007), o primeiro para a conversão de um tesauro do domínio do ensino de geoinformática, e, o segundo, do tesauro holandês Bibliopolis, dentro do projeto E-Culture. Em 2004, foi publicado, no artigo “Representing the MeSH in OWL: towards a semi-automatic migration”, um método desenvolvido por Lina F. Soualmia, Golbreich e Darmoni, como parte do projeto Catalogue and Index of French-speaking Medical (CISMEF). 27 Nesta pesquisa, não se considera o WordNet um tesauro, mas um dicionário com base nos princípios do dicionário de Roget. 49 Nesse artigo, os autores apresentaram a primeira fase dos resultados, que teve por objetivo a definição dos princípios de modelagem para a conversão do tesauro MeSH, na sua versão francesa, em uma ontologia formal, em linguagem OWL-DL28. O modelo proposto pelos autores foi composto pelos seguintes procedimentos: (1) formalização da terminologia do tesauro em OWL; (2) importação da ontologia em OWL para o software editor Protégé, verificando a classificação da estrutura e a sua consistência no uso do mecanismo de inferência (MI) Racer; (3) distinção dos relacionamentos hierárquicos <éUm> e <éParte>; (4) diferenciação de conceitos (especialidade, descritor e qualificador) que denotam distintas noções; (5) levantamento das características do domínio, assim como de outros atributos que irão suportar o processo automático de conversão; (6) tradução dos qualificadores em propriedades, que são modelados, separadamente, aplicando-se algumas restrições (para se manter a consistência) que determinam onde podem ser aplicados. Esses procedimentos baseiam-se, principalmente, nas transformações sintáticas, obtidas a partir da organização hierárquica já existente no MeSH. A construção da ontologia usou o método top-down, que vai do conceito mais geral aos mais específicos e, depois, para os descritores e tipos de recursos. Como resultado, foi obtida uma ontologia parcialmente reforçada e os autores pretendem, no futuro, implementar procedimentos que permitam ampliar a representação semântica em OWL-DL. Dessa forma, esperam incluir a definição de todos os seus indivíduos (recursos), visando ao uso de um serviço lógico de recuperação, com base no processamento de consultas do usuário. Claude Chrisment et al. apresentou o artigo “D’un thesaurus vers une ontologie de domaine pour l’exploration d’un corpus”, em 2006, com a proposta de fazer a conversão do tesauro do International Astronomical Union (IAU) em uma ontologia para o domínio da astronomia. Nessa conversão, além da estrutura conceitual existente no tesauro, os autores utilizaram a terminologia expressa em documentos do domínio, visando à atualização terminológica do tesauro IAU. Dessa forma, o método proposto, denominado TERMINAE, teve por base tanto o tesauro IAU quanto o conhecimento contido nos textos representativos da área. Esse método foi composto pelos procedimentos: (1) especificação dos requisitos da ontologia; (2) especificação dos conceitos e dos termos do domínio, com suas variantes lexicais, obtidos do tesauro e dos textos; (3) agrupamento dos termos em classes mais amplas, para identificar objetos e conceitos referenciados nos documentos; (4) determinação de relações hierárquicas e associativas, para permitir maior semântica; (5) formalização da ontologia em uma linguagem interpretável pelo sistema; (6) validação da ontologia por especialista do domínio. Os autores ressaltam que o uso do tesauro permite 28 A OWL-DL é uma linguagem de médio nível de expressividade e baseia-se em lógica descritiva, um fragmento de Lógica de Primeira Ordem, passível, portanto, de raciocínio automático, possibilitando-se computar automaticamente a hierarquia de classes e verificar inconsistências na ontologia (SOUALMIA; GOLBREICH; DARMONI, 2004). 50 automatizar a etapa (3) da metodologia, imprimindo maior rapidez no processo. O produto final resultou em uma ontologia leve do domínio da astronomia, em linguagem OWL, que é aplicada na exploração de documentos digitais. Martin Hepp e Jos de Bruijn, em 2007, publicaram outro método no artigo “GenTax: a generic methodology for deriving OWL and RDFS ontologies from hierarchical classifications, thesauri, and inconsistent taxonomies”. Os autores apresentaram a metodologia, denominada por eles como GenTax, na qual propuseram a conversão de sistemas de classificação bibliográficas, tesauros e taxonomias em ontologias em OWL e RDFS, suportado por SKOS. O método permite a conversão de forma semiautomática, para contextos específicos, a partir dos procedimentos: (1) especificação informal da estrutura hierárquica a ser utilizada; (2) determinação do contexto de uso; (3) verificação humana de propriedades conceituais e identificação de anomalias29 e elaboração de um roteiro de conversão; (4) geração da ontologia a partir desse roteiro. A ideia básica da metodologia GenTax é derivar duas classes de cada categoria da ontologia: (a) um conceito genérico, para determinado contexto; (b) um conceito taxonômico mais amplo, que permite preservar a estrutura hierárquica original. Dessa forma, não foi necessário o mapeamento de dados de instância, ou qualquer outra informação adicional, que geralmente é utilizado em abordagens para aprendizagem de ontologia (LearnOnto). Como problemas, os autores observaram a fraca semântica oferecida pela ontologia criada e o número pequeno de axiomas incluídos. Ao final, as ontologias resultantes, em RDFS ou OWL-DL, foram leves e com base somente em relacionamentos do tipo . Em 2008, Eero Hyvönen et al. publicaram o trabalho “Building a national semantic web ontology and ontology service infrastructure: the FinnONTO Approach”, como parte do projeto FinnONTO. Os autores tiveram como objetivo fazer a conversão do tesauro General Finnish Thesaurus (YSA) em uma ontologia. Os autores utilizaram um processo semiautomático de conversão, a partir dos seguintes procedimentos: (1) conversão sintática usando OWL e SKOS; (2) definição da estrutura da ontologia, com base nos princípios DOLCE30, com a atribuição de subclasses nas hierarquias, que foram divididos em três classes: abstratas, resistentes e persistentes, evitando a herança múltipla; (3) desambiguação dos relacionamentos Broader Term (BT) e Narrowed Term (NT), expressos por subclasse, parte de e instâncias; (4) reorganização dos conceitos, com atribuição de transitividade nos relacionamentos entre conceitos, sobretudo nas relações BT/NT; (5) 29 As anomalias podem estar relacionadas a questões tais como inconsistências de dados (dados incorretos), necessidade do usuário não atendida ou problemas na integração de dados oriundos de múltiplas fontes de informação. 30 DOLCE (Descriptive Ontology for Linguistic and Cognitive Engineering) é uma ontologgia de fundamentação (negociação de significado), para cooperação eficaz e estabelecimento de consenso, sendo o primeiro módulo da Library of Foundational Ontologies. 51 desambiguação e definição dos conceitos; (6) alinhamento da ontologia. Outros artigos também discorrem sobre esse mesmo estudo (RUOTSALO, T. et al., 2008; SAARTI; HYPÉN, 2010). Ao final, foi realizada uma conversão nos níveis sintático e semântico, com o refinamento e enriquecimento dos relacionamentos na estrutura da ontologia, explicitando tanto as relações quanto a , gerando uma ontologia pesada31, a General Finish Ontology (YSO). Assim, a ontologia ficou composta por classes, atributos e relações, todos expressos em linguagem RDFS. Boris Marcelo Villazón-Terrazas, Mari Carmen Suárez-Figueroa e Asunción Gómez-Pérez apresentaram um estudo sobre conversão de tesauros, em 2009, no artigo “Pattern for re-engineering a term-based thesaurus, which follows the record-based model, to a lightweight ontology”. Nesse estudo, os autores desenvolveram um método de conversão de tesauros em ontologias, aplicando-o ao tesauro European Training Thesaurus (ETT), do domínio da educação e formação profissional na Europa. Os procedimentos desse modelo são compostos pelas seguintes etapas: (1) conversão dos termos do tesauro em instâncias de metaclasses, de modo que representam, simultaneamente, as instâncias e as classes; (2) identificação de termos sem ligação superordenada, com adição de relacionamentos específicos; (3) transformação das relações BT e NT tradicionais em , ou ; (4) inclusão dos termos, mapeados no item (2), em classes existentes ou em uma nova classe que deverá ser atribuída; (5) reorganização da estrutura hierárquica das classes da ontologia; (6) identificação de termos equivalentes; (7) aplicação de relacionamento específico do tipo nos termos equivalentes mapeados. Como resultado final, os autores criaram uma ontologia leve, do domínio educacional, que pode ser, segundo os autores, implementada em qualquer linguagem. Em 2011, Boris Marcelo Villazón-Terrazas apresentou a sua tese “A method for reusing and re-engineering non-ontological resources for building ontologies”. Nessa tese, o autor teve como objetivo estudar os métodos e ferramentas que pudessem ser utilizadas para acelerar o processo de desenvolvimento de ontologias de domínio, a partir de recursos não-ontológicos disponíveis (classificações bibliográficas, tesauros, dicionários). De forma específica, no capítulo que aborda a conversão de tesauros em ontologias, o autor apresentou os padrões para a reengenharia, que foram criados a partir de dois tipos de procedimentos: (1) transformação polinomial TBox: construído através de declarações que descrevem os conceitos gerais, seus papéis e suas propriedades (linguagem descritiva), contendo o conhecimento intensional da ontologia, impondo uma semântica formal que se ajusta às mudanças na estrutura, usando como recurso externo o WordNet, que auxilia na 31 Ontologias pesadas: adicionam axiomas e restrições para ontologias. 52 explicitação de relações associativas; (2) transformação linear ABox: mecanismo que permite determinar as propriedades dos elementos, que são específicos para os indivíduos do domínio, criado a partir do conhecimento extensional, também denominado de conhecimento “assercional”. Nesse método, os descritores preferenciais do tesauro são transformados em classes e instâncias; as relações hierárquicas, em relações do tipo ; e os termos equivalentes, em etiquetas na ontologia. Essa metodologia de reengenharia de tesauros em ontologias produziu um conjunto de padrões de conversão, que têm como foco a construção de ontologias que estão conectados com outras ontologias, em uma rede de ontologias, e não, na criação de uma ontologia individual e personalizada. Os resultados das avaliações do método demonstraram ganhos na construção de ontologias, principalmente como orientação a modeladores inexperientes. Todos os métodos de conversão, criados pelo autor, podem ser realizados de forma automática ou semiautomática e consistem em um conjunto de diretrizes metodológicas para os processos, atividades e tarefas envolvidas, específicos para cada tipo de recursos não-ontológicos. Esse mesmo modelo também está descrito no artigo de Villazón-Terrazas e Priyatna (2012). No texto “A method for re-engineering a thesaurus into an ontology”, publicado por Daniel Kless et al., em 2012, os autores propuseram fazer a conversão do Tesauro AGROVOC, usando como recorte a subárea temática de fertilizantes agrícolas, em uma ontologia de domínio. O escopo do estudo incluiu dois elementos: (1) estudar as diferenças e semelhanças entre ontologias e tesauros, sobretudo aquelas relativas às atribuições de relacionamentos; (2) verificar a possibilidade de fazer a reestruturação do tesauro, transformando-o em uma ontologia, a partir de um estudo de caso. A comparação entre os dois instrumentos demonstrou que os tesauros precisam de uma reengenharia estrutural, assim como de definições mais formalizadas, para serem reutilizados na criação de ontologias. Nesse sentido, os autores concluíram que os tesauros construídos com base em normas e padrões internacionais são os candidatos potenciais para conversão em ontologias. Ademais, os relacionamentos representados no tesauro devem ser classificados, antes de serem reutilizados na formalização da ontologia. Em relação ao segundo objetivo, da reestruturação do tesauro em uma ontologia, os resultados apontaram soluções para evitar problemas que poderão surgir na integração do conhecimento em ontologias, caso não passe por tal procedimento de reestruturação. A partir do estudo de caso, os autores propuseram a sistematização de um método geral para a reengenharia de tesauros em ontologias, cujos procedimentos compõem oito etapas: (1) verificação e refinamento preparatório e do tesauro; (2) conversão sintática; (3) identificação de critérios de inclusão de terminologia nas classes (em linguagem natural); (4) escolha e alinhamento das classes de nível superior e das relações formais; (5) especificação formal das classes; (6) eliminação de poli-hierarquias na declaração da ontologia; (7) dissociação de entidades 53 independentes; (8) ajustes de ortografia, pontuação e outros aspectos das classes e dos padrões de rótulos das propriedades. Os autores concluíram que a reengenharia de um tesauro em ontologia requer mais do que apenas uma conversão sintática e uso de uma linguagem formal. Além do mais, verificaram que as etapas (2), (6) e (8) podem ser parcialmente automatizáveis, enquanto as outras etapas exigem uma tecnologia que ainda não está disponível. Os pesquisadores consideram que as etapas (3) e (5) representam o núcleo da modelagem ontológica, pois requerem um maior esforço qualitativo e intelectual de implementação. Para eles, essa qualidade está ligada às medidas de correção, precisão e completude com que os critérios de inclusão de termos nas classes são especificados, uma vez que irão afetar a exatidão das relações <éUm> na estrutura hierárquica da ontologia. A descrição desse mesmo método também se encontra registrado em outros artigos (KLESS, 2012; KLESS; JANSEN; MILTON, 2014). Esse método também pode ser adaptado para a reengenharia de outros tipos de vocabulários ou terminologias, além dos tesauros. Em 2012, o artigo “On transformation from the thesaurus into domain ontology”, publicado por Ping Li e Yong Li, apresenta a conversão de um tesauro da área agrícola (não identificado) em uma ontologia de domínio, usando como recorte a subárea temática de culturas de cereais. A criação da ontologia foi realizada de forma semiautomática, usando processos intelectuais de análise e o uso do software Protégé como editor da ontologia, utilizando a linguagem OWL. Os autores desenvolveram um método, com base em lógica descritiva, composto pelos seguintes procedimentos: (1) definição do propósito da ontologia; (2) determinação do conjunto de conceitos fundamentais no campo da cultura de cereais; (3) descrição de propriedades dos conceitos da ontologia, para identificação de relacionamentos; (4) adição de instâncias para cada conceito; (5) determinação dos relacionamentos entre conceitos: (a) equivalência: ; (b) hierárquica: ; (c) associativa: (relações recíprocas). No experimento, os autores criaram uma ontologia na qual a estrutura original do tesauro foi quase totalmente mantida, adicionando uma maior semântica com a especificação dos relacionamentos entre conceitos. Os autores ressaltam que a pesquisa sobre a conversão de tesauros em ontologias está em fase inicial de exploração, sendo ainda necessário muita intervenção intelectual de modeladores e especialistas de domínio no processo. O último trabalho internacional descrito nesta revisão foi publicado por Mouhim Sanaa et al., em 2013, e apresentado no artigo “A methodological approach for converting thesaurus to domain ontology: application to tourism”. Essa proposta teve como objetivo a conversão do Thesaurus of Tourism and Recreation, da Organização Mundial do Turismo, em uma ontologia de domínio. A criação da ontologia foi realizada de forma totalmente intelectual e os procedimentos para a sua elaboração incluem: (1) transformação dos termos 54 do tesauro em conceitos, associando cada termo ao seu conjunto de sinônimos, variações lexicais, e elaborando uma definição em linguagem natural; (2) criação de relação de equivalência entre descritores preferidos e não-preferidos; (3) determinação dos descritores não-preferidos como etiquetas do conceito; (4) estruturação dos conceitos, formando a estrutura hierárquica de classes e subclasses, e identificação das relações <éGêneroDe>, <éEspécieDe>, <éParteDe> e <éInstânciaDe>; (5) gestão de poli-hierarquia, por meio do teste de validade “alguns/todos”; (6) remoção de redundância em relações hierárquicas; (7) exploração e explicitação da relação de associação, a partir da garantia literária; (8) enriquecimento da terminologia usando bancos de dados lexicais e dicionários. O resultado mostrou o enriquecimento da estrutura conceitual do tesauro, transformando-o em um protótipo de ontologia que ainda será implantada na segunda fase do estudo dos autores. Foi observado, após análise geral de todos os trabalhos descritos nesta revisão, que os resultados alcançados demonstraram que uma maior expressividade semântica dos relacionamentos sempre traz ganhos na recuperação de informações. Isso foi percebido mesmo quando não foram utilizadas todas as possibilidades de formalidade que uma ontologia pode oferecer, gerando estruturas leves ou pesadas. Dentre os trabalhos descritos, o que mais se assemelha à proposta desta pesquisa foi o trabalho de Sanaa et al. (2013), que, tal como Soergel et al. (2004) e Lauser et al. (2006), descreve uma metodologia de conversão de um tesauro em uma ontologia de domínio, incluindo aprimoramentos nos níveis semântico e sintático. Assim, Sanaa et al. (2013) fizeram o refinamento das relações hierárquicas e associativas, preocupando-se com o tratamento isolado dos termos, ligando-os às suas equivalências, tal como às suas variações linguísticas. Contudo, os autores realizaram a modelagem de forma totalmente intelectual, enquanto Soergel e Lauser determinaram procedimentos para a automatização de parte do processo. Tal como Soergel et al. (2004) e Lauser et al. (2006), Sanaa et al. (2013) deixaram explícitas as relações e as ad-hoc (atribuídas a partir de consulta aos especialistas do domínio), mantendo a estrutura original do tesauro ao máximo possível. Os autores tiveram como resultado uma ontologia pesada, gerando componentes tais como classes, atributos e relacionamentos, expressos em OWL-DL. Notou-se que alguns dos modelos se restringem à conversão sintática dos tesauros (VAN ASSEM et al., 2004; SOUALMIA; GOLBREICH; DARMONI, 2004), conservando, no produto final, uma estrutura conceitual muito próxima do tesauro utilizado no processo, resultando em ontologias leves. Outros autores (QIN; PALING, 2001; WIELINGA et al., 2001; HYVÖNEN et al., 2008) criaram um método desenhado para as características particulares de um tesauro específico, não elaborando procedimentos que possam ser reutilizados para conversão de outros tesauros. Os autores Qin e Paling (2001), por exemplo, apresentaram pouca informação sobre a metodologia proposta, e 55 Wielinga et al. (2001), não descreveram os processos que utilizaram no refinamento dos relacionamentos que introduziram na estrutura conceitual da ontologia. De maneira diversa, Van Assem et al. (2004) e Van Assem et al. (2006) descrevem, com detalhes, um método que leva em consideração o refinamento das relações, mas, por outro lado, não apontam qualquer processo para automatizar parte da conversão, como fizeram Soergel et al. (2004) e Lauser et al. (2006). Sobressaem-se, porém, os trabalhos mais completos, apresentados por alguns autores (KLESS et al., 2012; SANAA et al., 2013), que adicionam soluções que buscam evitar problemas que poderão surgir na integração do conhecimento dos tesauros em ontologias. Essa questão não é abordada pela grande maioria dos autores, nem mesmo por Soergel et al. (2004) e Lauser et al. (2006). Kless (2012), por exemplo, verificou que a tradução entre o modelo de origem para o modelo RDF é uma tarefa complexa, com muitos mapeamentos alternativos, especialmente se for utilizado um tesauro que não foi construído em conformidade com normas internacionais, com padrões International Organization for Standardization (ISO) ou American National Standardization Institute (ANSI). Para Kless (2012), a reengenharia da estrutura conceitual e uma maior formalização das definições dos conceitos existentes em um tesauro tradicional, para a criação de ontologias de domínio, devem ter como requisito que o tesauro seja construído segundo essas normas e padrões. Destaca-se a abordagem utilizada por Goldbeck et al. (2003), que propõem uma metodologia convergente aos princípios da univocidade entre conceito e termo, adotados por Wüster e Dahlberg, porém, que está em oposição à visão da Teoria Comunicativa da Terminologia (TCT), que será utilizada nessa pesquisa. As bases teóricas da TCT consideram que a polissemia também está presente em domínios de especialidade. É importante ressaltar que esse enfoque da TCT pode ser representado por meio do modelo de Soergel et al. (2004) e Lauser et al. (2006), pois os diferentes níveis de entidade (conceito, termo, string e relacionamentos) são tratados de forma separada, permitindo, por exemplo, que um termo possa estar ligado a mais de um conceito. Pôde ser percebido que o uso de tesauros tradicionais na criação de ontologias tem se intensificado, fato que pode ser explicado pela tendência de reuso de conhecimento já estruturado. Um conjunto de conhecimentos mais estruturado sobre um dado domínio pode ser encontrado em tesauros, cujo desenvolvimento e uso estão sempre pautados nos fundamentos teóricos da BCI e da Terminologia. Para Boccato, Ramalho e Fujita (2008, p. 207), esse “fato justifica as vantagens de se desenvolver ontologias a partir de tesauros, pois eles podem servir como substratos teóricos para a construção de ontologias”. Essa afirmação ficou evidenciada nesta revisão de literatura, uma vez que quase todos os trabalhos concluíram que o conhecimento já modelado e estruturado, encontrado nos 56 tesauros tradicionais, é uma fonte de informação que contribuiu e auxiliou na criação das ontologias de domínio. Finalmente, ao analisar os trabalhos aqui descritos, foi observado que todos os autores iniciaram seus relatos pautados na determinação das diferenças e semelhanças entre tesauro e ontologias. Entre elas, destaca-se aquela relativa à exigência de formalidade e explicitação dos relacionamentos nas ontologias, para que elas sejam passíveis de receber as inferências necessárias do domínio mapeado no sistema (ALMEIDA; BAX, 2003), situação essa que não é exigida nos tesauros tradicionais. Portanto, percebe-se que o processo de conversão de um tesauro em uma ontologia pressupõe, primeiramente, uma etapa intelectual de enriquecimento semântico da estrutura conceitual do tesauro tradicional para, depois, proceder-se às etapas seguintes de implementação da ontologia. É nessa etapa intelectual que está o foco desta pesquisa, trazendo subsídios para a área da CI no sentido que apresenta e valida um método de reengenharia de tesauros tradicionais, fundamentado em teorias da CI e da Terminologia, que é capaz de sistematizar a etapa intelectual de refinamento das relações semânticas. 57 5 FUNDAMENTOS TEÓRICO-CONTEXTUAIS Se consegui ver mais longe é porque estava em ombros de gigantes. Isaac Newton Neste Capítulo apresenta-se um panorama teórico-contextual sobre conceitos e temas que fundamentam os objetivos propostos nesta tese. Aqui estão expostas, também, as ideias que foram pontos de reflexão dos autores na literatura estudada, assim como reflexões próprias, de forma a oferecer subsídios para uma discussão qualitativa sobre o estudo que foi realizado. Para se tornar apta a cumprir a proposta, foi necessário à autora desta tese adicionar, aos seus, um conjunto de saberes adjacentes, tanto internos quanto externos à área BCI. Esses conhecimentos possibilitaram o entendimento do fenômeno estudado e a concretização dos objetivos propostos. Nesse sentido, inicia-se este Capítulo com aportes do campo de estudos da Semântica, com uma breve descrição sobre sua interface com a Pragmática. São duas áreas que têm uma ampla diversidade de correntes, as quais não foram exaustivamente discutidas aqui. O que se apresenta a seguir são aquelas correntes consideradas essenciais para o entendimento das etapas adotadas para enriquecer a estrutura conceitual do tesauro tradicional. Em seguida, apresentam-se os Subcapítulos sobre a Terminologia, sobre a Teoria Comunicativa da Terminologia (TCT) e sobre os elementos básicos que compõem uma terminologia. No primeiro, relata-se desde a consumação da Terminologia como disciplina, a partir dos estudos de Wüster, passando pelas críticas à teoria que ele desenvolveu, chegando aos avanços que foram consequência dessas censuras. Nesse ponto, expõem-se os aportes da TCT, criada por Cabré, como um dos fundamentos teóricos adotados por esta pesquisa. A autora, contrariando as bases da teoria de Wüster, acredita na similaridade existente entre as características da língua geral e as de especialidade. Finalizando esse bloco, descrevem-se os três elementos básicos de uma terminologia (termo, conceito e definição), sempre tentando apontar o ponto de vista da BCI e da Terminologia. Foi dada uma atenção especial ao Subcapítulo que aborda a noção de conceito, discutindo-se os princípios para a sua formação. Logo após, discorre-se sobre a ambiguidade e a polissemia, incluindo a homonímia, oferecendo definições que as distinguem, indicando os problemas que a primeira ocasiona na elaboração de definições terminológicas. Em relação à segunda, apontam-se quais são as características de sua ocorrência, visando a auxiliar na coleta e controle da polissemia na terminologia de uma área de especialidade. Esses conhecimentos são importantes aportes na construção de tesauros que têm por base a TCT. 58 Posteriormente, apresentam-se os Subcapítulos sobre os Sistemas de Organização do Conhecimento (SOC), sobre os tesauros e sobre os relacionamentos semânticos existentes em sua estrutura conceitual. No primeiro, apontam-se os tipos de SOCs e seus fundamentos na BCI, com enfoque maior nos tesauros, que é o instrumento empírico utilizado nesta pesquisa. Depois, expõe-se sobre o ponto central deste estudo, que são as relações conceituais que formam o sistema nocional nos tesauros. Finalizando os fundamentos teórico-contextuais, apresenta-se sobre a valência semântica dos verbos, uma vez que compreender esse valor é importante para usá-lo como expressão na representação dos relacionamentos que irão conectar os conceitos. 5.1 UM OLHAR SOBRE A SEMÂNTICA A Semântica é uma disciplina que pode ser conceitualizada como o estudo do significado das expressões linguísticas (fonemas, morfemas, palavras, sintagmas, frases), que dá atenção aos sentidos que as palavras ou lexias adquirem. Também atenta para as formas de relações de significado que essas expressões estabelecem entre si e com dado domínio ou com o mundo. Na contemporaneidade, “a definição de Semântica como ‘ciência ou estudo do significado’ tem sido atualizada para o ‘estudo da significação’ ou o estudo do ‘conteúdo’ dos signos linguísticos” (PEDROSA, 2001, on-line). Isso vem ao encontro de Katz (1982), que defende a ideia de que qualquer disciplina que se proponha a estudar o significado precisa postular sobre distintos fenômenos semânticos: sinonímia e paráfrase, antonímia, hiperonímia/hiponímia; ambiguidade, redundância semântica; contradição; sinteticidade (ser sintético, abreviado) e do fenômeno das informações implícitas (pela implicação ou pressuposição). É nesse sentido que a Semântica se torna um tema importante na modelagem de SOCs, pois é preciso criar uma linguagem que faça o controle de elementos que podem induzir à ambiguidade e à polissemia. Pedrosa (2001) identifica duas distintas unidades de análise no campo da semântica: (1) a semântica da palavra, que foca nas relações de significado (sinonímia, antonímia, hiperonímia, hiponímia, ambiguidade lexical, polissemia, homonímia, metáfora e metonímia) entre palavras ou entre morfemas; (2) a semântica da frase, que prioriza a ambiguidade estrutural, as anomalias no arranjo das palavras na frase, as relações de paráfrase e contradição, a implicação semântica e a pressuposição. No contexto desta pesquisa, interessa, sobretudo, a primeira unidade de análise, a palavra, pois, dentro da semântica da palavra, há o plano da semântica do nome, que pode ser entendido como o rótulo do objeto ao qual se refere (PEDROSA, 2001). Isso tem relação com a análise do desempenho das classes semânticas dos nomes e dos processos aplicados para estabelecer a relação entre os nomes e objetos do mundo. Ademais, Pedrosa (2001) 59 também discorre sobre o plano da semântica do verbo, afirmando que alguns verbos já estabelecem uma restrição formal de seleção do seu significado e do seu uso (por exemplo: na frase “Rosa cacarejou”, nota-se uma imposição de sentido e uso, pois, de forma denotativa, o verbo cacarejar só pode ser atribuído à espécie dos galináceos). Esse plano, da semântica do verbo, é de interesse no escopo desta pesquisa e está descrita no Subcapítulo 5.8. Como subárea da Linguística, a origem do termo “semantics” remonta a 1894, em um artigo do American Philological Association, com o título “Reflected meanings: a point in semantics”32, que trata da mudança sobre o entendimento de significado (ULLMANN, 1964). Por outro lado, Barros (2003) destaca que o brasileiro Pacheco Jr. (1842-1899) usou esse termo nos manuscritos de seu livro, em 1883. Infelizmente, a obra foi publicada somente após sua morte, em 1903, impossibilitando qualquer reivindicação de autoria do termo. Já como disciplina e campo de estudo, o termo “Semântica” foi cunhado por Michel Bréal, em uma publicação de 1897, cuja obra33 aborda a composição e a forma das palavras, tentando chegar a um termo que pudesse ligar a fonética e a morfologia (SEIDE, 2006). Pedrosa (2001) afirma que, apenas após a publicação de Bréal, os linguistas passaram a se interessar pelo estudo da significação e dos signos. Com o avanço desses estudos, outro importante conceito criado na área foi o de campos semânticos, desenvolvido pelos autores Ipsen, Porzig e Trier34, entre o final da década de 1920 e a década de 1930 (GRITTI, 2010). Os campos semânticos estão ligados à existência de uma rede de traços semânticos, que envolve uma unidade lexical, fazendo com que seja criada uma rede de significação para esse item. Por exemplo, “a prova empírica de que não são aleatórios os processos semânticos é o exemplo de que as pessoas, ao lerem ‘carne’ ao invés de ‘bife’, fazem associação, não ao acaso, mas com palavras que levam ao significado da palavra que foi trocada” (GRITTI, 2010, p. 139). Nesse sentido, as ligações que a mente faz entre unidades lexicais não é um fato fortuito, elas são realizadas por meio dos traços semânticos que carregam, em algum tipo de equivalência. Ressalta-se que não se deve confundir o conceito de campo semântico com o de campo conceitual (nocional, rede de conceitos), uma vez que este último é referente a um conjunto de conceitos, agrupados ao redor de um conceito-chave, que estão relacionados entre si e formam um subconjunto em um sistema maior de conceitos (BARROS, 2004). 32 LANMAN, C. R. Reflected meanings: a point in semantics. In: TRANSACTIONS OF THE AMERICAN PHILOLOGICAL ASSOCIATION (1869-1896), Philadelphia, Pa., December, 1894. Proceedings of the Special Session… Philadelphia, Pa.: APA, 1895. v. 26, p. xi-xv. 33 A obra Les lois intelectuelles du language: fragment de sémantique é composta por três partes, e há indícios de que a primeira parte foi publicada em 1883, na forma de um artigo (SEIDE, 2006). Contudo, não foi possível acesso ao documento para confirmar a veracidade dessa informação. 34 Obra alemã de 1931, intitulada Der Deutsche Wortschatz in Sinnberzirk der Verstandes. Die Geschichte eines sprachlichen Feldes [O vocabulário alemão no campo semântico do entendimento. A história de um campo linguístico]. 60 Mesmo antes de Platão (428- 348 a.C.), os gregos foram os primeiros a refletir sobre o significado e a relação entre a palavra e o ser (ou objeto), questões ainda discutidas na contemporaneidade (BARROS, 2003). Platão priorizava o mundo das ideias, afirmando que é nesse lugar que a significação se encontra, exemplificando que distintas árvores se assemelham por causa da ideia que os indivíduos têm de árvore. Contradizendo, em parte, a visão de Platão, os estudos de Aristóteles (384-322 a.C.) tiveram um caráter mais empírico, definindo os objetos a partir das suas finalidades e uso. Aristóteles defendia que o que caracteriza um objeto (o que o torna o que ele é) não é a matéria de sua composição, mas o modo como este objeto se organiza em função de algo. Assim, distintas árvores se assemelham porque possuem uma estrutura comum, e não pela ideia que os indivíduos têm do que seja uma árvore. Com esses princípios, Aristóteles elaborou a primeira doutrina sobre semântica e lógica (BARROS, 2003), sendo o pioneiro na atribuição de um referente ao significado de uma palavra. Já John Locke (1632-1704) se opôs a Aristóteles, pois não reconheceu o significado ligado à coisa (objeto). Para Locke, o significado de uma palavra é a ideia a ela associada, pois é com o uso da ideia que se pode expressar o entendimento de um objeto (imagem, noção, espécie, ou seja, qualquer conteúdo cognitivo). Ademais, Barros (2003) alerta que apenas no século XIX, com W. Humboldt, o significado é associado a um elemento da língua. Seide (2006) acrescenta que, na visão de Saussure, o significado passa a ter um caráter subjetivo e interno, é uma entidade que pertence à língua, modificando-se e definindo-se a partir dela. Outro percussor nos estudos sobre Semântica, o alemão Hermann Paul (1846- 1921), focou em temas que incluíram os estudos estilísticos de metáfora, eufemismo e prosopopeia, realizando uma oposição do abstrato e do concreto (ILARI; GERALDI, 1985). Para o filósofo, por um lado, o abstrato é apreendido por meio de conceitos tais como amor, saudade, tristeza, amizade, felicidade. De outro lado, está o concreto, que em sentido lógico, está relacionado aos termos que designam seres ou objetos reais no mundo (onça, Pedro). Hermann Paul deu importância à questão da mutação semântica, tanto na extensão quanto na especialização (intensão) do significado (HENRIQUES, 2011). Nesse sentido, Henriques (2011), em seus estudos sobre o léxico e a semântica, os exemplifica a partir de dois casos: (a) a palavra “sorte” que é algo visto como positivo (restrição de sentido), mas que também pode significar “destino”; (b) o verbo “ficar”, que na contemporaneidade está sendo utilizado, no Brasil, no sentido de “namorar sem compromisso” (expansão de sentido). Hermann Paul separa a apropriação de sentido em “significação usual” (conteúdo ideológico compartilhado por indivíduos de um mesmo idioma) e em “significação ocasional” (conteúdo ideológico que o falante impõe a uma palavra, esperando que o receptor estabeleça a mesma relação que ele). Nessa mesma linha de mudanças semânticas, Antoine Meillet 61 (1866-1936) é outro autor que defende que as mutações35 acontecem, basicamente, a partir de contingências linguísticas, sociais e históricas (HENRIQUES, 2011). Assim, no amplo campo de estudo da Semântica, há grande variedade de correntes teóricas, sobretudo porque existem diferentes postulados sobre a forma de apreensão do sentido e sobre os conceitos de significado e significação, dando origem “a correntes que delineiam enfoques mais ou menos linguísticos”, tais como a lexicológica, a estrutural, a de fundamento referencial (valor de verdade das sentenças) e a cognitiva (KRIEGER; FINATTO, 2004, p. 40). Dentre essas correntes desenvolvidas nos últimos cem anos, Barros (2003) destaca cinco modelos para estudo da semântica, focados na linguística: (1) semântica diacrônica (histórica) pré-estruturalista, (2) semântica estruturalista, (3) semântica lexical gerativa (ou generativa), (4) semântica lógica e (5) semântica cognitiva. O primeiro modelo, a semântica diacrônica pré-estruturalista, predominava no final do século XIX, seguindo a linha darwinista (mutação semântica), e se caracteriza pelo interesse sobre a mudança de significado das palavras ao longo do tempo. Esse modelo não se atém ao significado gramatical e tem por base o princípio de que os significados lexicais são entidades de natureza psicológica, pois os processos psicológicos explicam as mudanças de significado (SEIDE, 2006). Sobre o segundo modelo, a semântica estruturalista, Seide (2006) afirma que foi consolidado pelos estudos de Saussure e N. S. Troubeztkoy, originado no Círculo Linguístico de Praga36. Nele, o conceito de campo semântico, aliado aos princípios de Saussure (tais como sistema, valor, relações sintagmáticas e paradigmáticas), fundamentam a teoria sobre essa área, dando início à semântica estrutural (GRITTI, 2010). Para a autora, a semântica estruturalista defende que não se pode considerar o significado de um signo linguístico de forma isolada, mas por sua posição em relação às estruturas linguísticas às quais pertence. No contexto desse modelo, Lyons (1963) estudou as relações lexicais de sinonímia, antonímia e hiponímia, lançando as bases metodológicas da análise em semântica estrutural. Segundo Gritti (2010), para se aprofundar sobre esse tema, é preciso consultar obras de autores relevantes na área, tais como Apresjan, U. Weinrich, Katz e Fodor. O terceiro modelo, a semântica lexical gerativa ou neo-estruturalismo, tem seus estudos ancorados, em especial, em Katz e J. A. Fodor, tendo por base o desenvolvimento 35 Esse é o princípio da Teoria da Variação e Mudança Linguística e dos estudos diacrônicos (de linguística histórica), sobretudo estudados por William Labov, que é considerado o pai da teoria variacionista. 36 Criado na Europa, em 1926, é uma corrente inspirada em conceitos estruturalistas, focada em ideias como a função estrutural de uma sentença, avaliada em um contexto real, o papel dos fonemas na distinção das palavras, entre outros (SEIDE, 2006). 62 de uma linguagem formal, a partir de modelos matemáticos (SEIDE, 2006). Essa abordagem pressupõe que a semântica é dependente da competência individual para a interpretação das frases e, por isso, exige o estabelecimento de regras para sua interpretação, tais como uma gramática, um dicionário (para restrições contextuais) e regras de projeção (para combinações semânticas). Portanto, essa metodologia é considerada adequada para a análise em semântica lexical, pois é um conjunto de traços binários e de condições necessárias e suficientes para a análise (SEIDE, 2006). Na semântica lógica, o quarto modelo, há um aperfeiçoamento na maneira de análise do significado, com a reelaboração e o refinamento da lógica clássica (SEIDE, 2006). Segundo Seide (2006), essa visão afasta-se do estudo individual da palavra para focar em regras lógicas e traços semânticos objetivos para a explicação sintática de uma linguagem. Dessa maneira, importam as propriedades da proposição e os princípios da lógica filosófica, que buscam formular generalizações semânticas que sejam adequadas ao propósito da linguagem criada. No âmbito da Filosofia, autores como Frege e Russel criaram linguagens formais, desenvolvendo-as para representar os sistemas lógicos (AUROUX, 2009), que incluíam a calculabilidade, quantificação, significação e atitudes proposicionais. Auroux (2009) afirma também que este viés técnico sempre esteve presente nos estudos da filosofia da linguagem anglo-saxônicos (com autores como Austin, Moore, Ludwig Wittgenstein e Urmson). Já os filósofos ocidentais, seguidores da visão de Edmund Husserl (1859-1938), estão voltados para a questão da significação. Oliveira (2008) aponta que, apoiado neste tema, desde a obra Investigações Lógicas até a obra Origem da Geometria, Husserl deixou um substancioso legado, englobando a hermenêutica, a desconstrução, neurociências, filosofias da linguagem, teorias semânticas e teorias da comunicação. A semântica lógica, especificamente, está representada por estudos como os de Donald Davidson e de Richard Montague (SEIDE, 2006). Finalmente, o quinto modelo, a semântica cognitiva, originou-se dos estudos de E. Rosch (organização categorial das cores) e de B. Berlin (organização categorial das plantas), em alternativa aos modelos dos estruturalistas e dos gerativistas (SEIDE, 2006). O foco desses estudos está nos processos que um indivíduo usa para categorizar o mundo em sua construção linguística, ou seja, o processo semântico e o cognitivo. Seide (2006) indica que é uma abordagem em expansão, que considera a semântica como mecanismo mais especializado para a categorização (processos de generalização, abstração e discriminação). Isso se explica porque permite a simplificação da complexa gama de elementos disponíveis ao indivíduo, que são apreendidos através dos sentidos e filtrados pela experiência social e cultural desse indivíduo. Os principais estudos em semântica cognitiva foram desenvolvidos por George Lakoff, Ronald Langacker, Dirk Geeraerts, C. Fillmore e G. Fauconnier, entre outros (SEIDE, 2006). 63 O interessante sobre a adoção dos fundamentos da Semântica é que não há a obrigatoriedade de se limitar a uma só corrente, pois elas nem sempre são antagônicas. Muitas vezes, há também distintas correntes concorrendo em uma mesma abordagem. Assim, entende-se que elas podem ser complementares, dependendo da formalidade empregada e do propósito pretendido em seu uso. Sendo assim, todas as cinco abordagens têm contribuições a oferecer no âmbito da construção de linguagens terminológicas enriquecidas semanticamente, sobretudo no momento da modelagem dos relacionamentos entre os conceitos, termos (nomes, na semântica) e seus referentes. Por exemplo, a semântica diacrônica revela a dinamicidade do conhecimento, mostrando as transformações dos significados das palavras, podendo orientar o estabelecimento de relações tais como de precedência e sucessão. Com a semântica estruturalista, pode-se entender que uma linguagem artificial de especialidade é parte integrante da linguagem natural, sendo, de forma similar, complexa (ambiguidade e polissemia). Sendo assim, o significado de um signo, nessa linguagem artificial, também deve ser determinado a partir da estrutura linguística adotada para a sua construção, representando e controlando essa complexidade. Acrescentando a semântica gerativa, que atualiza a estruturalista, adiciona-se a interpretação (hermenêutica), contribuindo com a representatividade da linguagem construída, com o estabelecimento de critérios para a formação de relacionamentos (que é a ordem lexical) e, também, com a elaboração de definições para todos os elementos que a compõem. Nesse contexto, a semântica lógica contribui no que se refere à necessidade de explicitar as propriedades dos relacionamentos, representados na proposição, visando a encontrar padrões que possam ser generalizadas em determinado domínio, o que possibilitaria a automatização de, pelo menos, parte desse processo intelectual. E, por fim, a semântica cognitiva traz a linguagem terminológica de especialidade centrada no usuário e no seu comportamento informacional, cuja construção deve estar alinhada ao conhecimento das necessidades de seus usuários. A combinação desses cinco processos oferece, prioritariamente, análises no nível de interpretação entre a língua (forma) e as coisas do mundo, com abordagens da escola denotacionalista, na qual os símbolos substituem os objetos, pois estão unidos aos seus respectivos significantes, assim como da escola funcionalista, que determina que o significado de um texto (palavra ou sintagma) tem estreita relação com a função que desempenha no domínio ou no mundo (SANTOS; CARDOSO, 2007). Ademais, para efeito de construção de linguagens de especialidade, há de se considerar o sentido também definido a partir do contexto, ainda que a semântica cognitiva considere o receptor em sua abordagem. É preciso lembrar que toda linguagem especializada tem paridade com a linguagem natural, pois é parte desta, na qual não existe uma denotação fixa, devido a questões, por exemplo, relativas a polissemia e ambiguidade. 64 Para focar no ambiente de uso, é preciso levar em consideração a função significativa do símbolo, em conjunto com o contexto real de utilização desse símbolo (SANTOS; CARDOSO, 2007). Assim, adicionam-se os fundamentos da Pragmática, que se detém no conhecimento acerca do domínio ou do mundo físico em que a comunicação acontece e das relações sociais estabelecidas nesse lugar. 5.1.1 Uma interface entre Pragmática e Semântica O termo “pragmática” foi cunhado por Morris, ainda no século XIX, motivado pelos estudos sobre o pragmatismo (ou pragmaticismo) de Pierce (MARCONDES, 2000). Pragmática e pragmatismo algumas vezes são utilizados como termos sinônimos, mas é necessário distinguir suas diferenças: a pragmática é um campo de investigação da Linguística e o pragmatismo é uma corrente de estudo filosófica (idem). A doutrina filosófica do pragmatismo teve origem no século XIX, nos Estados Unidos, e se estendeu à Inglaterra, Itália e outros países, como um método que determina os significados a partir da contextualização de uso, cujo princípio “fundamenta os fatos ocorridos na dimensão econômica, política e cultural” (MENEGHETTI, 2007, p. 2). Tal doutrina é discutida por diversos autores, tais como Chauncey Wright (1830-1875), Francis E. Abbot (1836-1903), Charles Sanders Peirce (1839-1914), William James (1842-1910), John Dewey (1859-1952), F. C. S. Schiller (1864-1937), entre outros, sendo possível encontrar distintas abordagens, o que torna difícil precisar um significado único para o pragmatismo. De forma geral, a maior parte dos pensadores aponta o pragmatismo como um método científico e como uma teoria acerca da verdade, cujo princípio “fundamenta os fatos ocorridos na dimensão econômica, política e cultural” da sociedade (MENEGHETTI, 2007). Nessa perspectiva, a verdade é arquitetada em sentido dinâmico, uma vez que não há uma verdade absoluta, que se encontra no objeto. Antes, ela está na ideia que se tem do objeto e nas relações que os objetos apresentam entre si, em uma situação específica. A dinamicidade da verdade está expressa no pragmatismo de Pierce, como afirma Meneghetti (2007): o pragmatismo de Pierce não adere meramente a verdade à utilidade, mas estrutura-se na lógica da pesquisa ou na norma metodológica que vê a verdade como entendimento por se fazer. Dessa forma, a verdade jaz no futuro e nunca é definitiva. O pragmatismo de Pierce é empirismo, mas diferente do empirismo clássico inglês, volta-se para o futuro na construção do conhecimento. Não poderia ser diferente, pois toda ação é partir de algo para realizar algo, ir de um ponto de partida até um ponto de chegada. A lógica do conhecimento repousa, por conseguinte, no movimento (MENEGHETTI, 2007, p. 4). 65 Nesse sentido, não há uma verdade absoluta, generalizável a qualquer situação, mas um construto social de sentido e, como tal, sujeito a mudanças no tempo e no espaço. Contudo, não é uma verdade relativa, o que reduziria o valor da noção de verdade, mas estabelecida para “dar conta especificamente da consideração da linguagem como ação, como produzindo efeitos e consequências em contextos determinados” (MARCONDES, 2000, p. 41). Assim a validação dessa verdade pode ser determinada a partir dos efeitos práticos alcançados. Souza e Hintze (2010, p. 108) afirmam que, com a semiótica de Pierce, o pragmatismo “tem na linguagem uma de suas questões fundamentais”. Pierce estabeleceu as bases para a apreensão da natureza do signo, da significação e da comunicação, tendo a semiose (ação de qualquer signo: produção de significados) como seu objeto de estudo. Isso contribuiu para o entendimento da linguagem e promoveu os “estudos da língua, dos mecanismos de estruturação da gramática, do léxico e da comunicação”, dando origem à pragmática como parte integrante da Linguística (SOUZA; HINTZE, 2010, p. 109). Também os estudos de Ferdinand de Saussure (1857-1913) deram subsídios à origem da pragmática ao incluir, em sua concepção da significação, os aspectos extralinguísticos que compõem a prática discursiva (COSTA, 2008). Segundo Costa (2008), Saussure fez distinção entre a fala (apropriação individual do sistema linguístico) e a língua (sistema diferencial de signos), sendo a significação dependente da estrutura da língua, que é constituída por um sistema de relações paradigmáticas (combinatórias) e sintagmáticas (articulatórias). Nesse sentido, Saussure aponta que a linguagem pode ser investigada a partir de dois componentes básicos: “a langue, o componente essencial, social por natureza, e a parole, o componente secundário, cuja natureza era a manifestação individual da langue” (COSTA, 2008, p. 14). Com essa divisão, a vertente de Saussure estabeleceu a langue como objeto da Linguística e deixou a parole para outras ciências, dentre as quais está incluída a Pragmática que, com isso, passou a ter caráter de ciência, independente da Linguística. Outra importante contribuição da filosofia para a Pragmática veio de Wittgenstein (1889-1951), na publicação do livro Investigações Filosóficas, quando critica a concepção tradicional da função da língua (designar seres ou objetos). Para esse filósofo, cada contexto possui diferentes regras de uso da linguagem (jogos de linguagem), o que sugere uma alteração na filosofia, na qual a pragmática está anterior à semântica, uma vez que o significado de uma palavra somente pode ser alcançado se, antes, é determinado o contexto de seu uso. Wittgenstein explica que o emprego de uma palavra está correto se houve um acordo de seu emprego dentro de uma comunidade linguística que faz uso dela, em um contexto pragmático de comunicação (SOUZA; HINTZE, 2010). No âmbito da BCI, Capurro (1992) aponta que as discussões de Wittgenstein deram origem ao que denominou de 66 virada pragmática nos estudos no campo da organização da informação. Wittgenstein afirma que a linguagem é compartilhada dentro de uma comunidade e não própria de um indivíduo. Assim, a importância do uso ganha uma dimensão mais complexa em Wittgenstein porque não se refere apenas à inserção de palavras em frases, mas a uma situação de ação com finalidade prática, como um exercício de influência de uns sobre os outros em um ambiente complexo. A esse ambiente, o autor denominou “jogo de linguagem” ou Sprachspiel, uma atividade regulada e partilhada (SOUZA; HINTZE, 2010, p. 115). Logo, as regras a serem seguidas no uso do vocábulo é um “jogo” entre os sujeitos, que devem estabelecer consenso de conceitos em ambientes de uso da linguagem, visando à comunicação. Nesse sentido, prioriza-se o uso concreto da linguagem em distintos contextos sociais ou de especialidade, cujos significados são construídos pela interação de seus atores sociais, visando a alcançar determinados efeitos ou objetivos práticos. É nesse contexto filosófico que nasce a Pragmática, com investigações que se debruçam sobre a estrutura linguístico-discursiva da linguagem. Ou, de outra forma, da construção de sentido que consideram as interações verbais do usuário e do contexto, cujos estudos se intensificaram após a década de 1970. Morris (1983), um dos representantes da Pragmática, defende uma organização linguística que determine a relação entre o signo e seus interpretantes. Para o autor, isso seria realizado a partir da interseção da Sintaxe (relações formais entre os signos), da Semântica (relação entre os signos e seus objetos) e da Pragmática (relação entre os signos e seus interpretantes). Dessa forma, a Sintaxe tem como foco de estudo a relação entre as expressões, e a Semântica e Pragmática se complementam, ao unirem os referentes e os interlocutores. Enquanto a Semântica se ocupa do emprego e do significado das palavras, a Pragmática se preocupa com o uso, sendo o significado entendido como intenção, pois a Pragmática enfatiza o enunciado, estudando a relação entre a linguagem, o usuário, o uso e o lugar de enunciação. Oswald Ducrot (1987) denomina essa abordagem de “Semântica Pragmática”, pois entende que a Pragmática não trabalha com os resultados da Semântica e, sim, está integrada a ela, estando vinculada à linguística da enunciação. O autor discorda da concepção da unicidade do sujeito, acreditando na corrente da teoria polifônica37. Nessa teoria, considera-se que, em um mesmo contexto social, cada sujeito pode concordar com algumas partes do discurso dessa comunidade, mas não com outras (BARBI, 1999), da qual 37 Em seus estudos acerca da questão da polifonia, Ducrot desenvolve a teoria polifônica em 1984, cujos princípios definem a complexidade do ato de enunciar, pois apontam que o sujeito enunciador possui uma heterogeneidade discursiva, possuindo três níveis de polifonia subjacentes a cada ato de enunciação: sujeito falante (ser do mundo), locutor (responsável pelo conteúdo do enunciado, quase um autor) e o enunciador (responsável pelo ato de fala, oposto ao destinatário) (BARBI, 1999). 67 decorre que, assim, os sujeitos (seres do mundo) têm vários enunciados, mesmo dentro de um mesmo contexto de discurso, o que mostra a heterogeneidade enunciativa. Para Ducrot (1987), as teorias semânticas e pragmáticas são carregadas de ideologias (não referenciais) e demonstram uma interdependência das palavras, por meio do contexto e das condições de produção dos diversificados discursos. Representar esse contexto exige caracterizá-lo adequadamente, descrevendo todas as suas propriedades e aquelas que decorrem das relações entre ele e seus interlocutores, internos e externos. Nesse contexto, Ilari e Geraldi (1985) chamam a atenção para o fenômeno dos dêiticos38 no desenvolvimento de linguagens artificiais. Para os autores, as palavras e formas dos dêiticos possibilitam representar determinados contextos, que podem ser analisados de forma pragmática. No âmbito da Pragmática, os dêiticos são acionados a partir da necessidade de se situar o contexto de uso dos enunciados. Já no campo da Semântica, eles garantem a ligação entre os elementos, de forma a dar sentido aos enunciados. Dessa forma, Pragmática e Semântica são indissociáveis na análise para se entender aquilo que foi dito e o contexto de tal enunciado (DUCROT, 1987). Nesse sentido, e fazendo uma correlação com a construção de tesauros, Lima assegura que “ao converter os conceitos e suas relações, expressas em linguagem natural, para uma linguagem controlada, o tesauro demonstra que a informação tem sua existência atrelada aos sistemas de significação” (LIMA, 2007, p. 120). Nesse campo de significação, a Semântica tem importante papel, pois um termo, assim como as palavras, pode ganhar um sentido conotativo ou valorativo, por exemplo, ampliando ou restringindo o seu significado. Por outro lado, esse significado é também dependente de fatores contextuais e de uso, que ocorrem na área da Pragmática. Corroborando com a indissociabilidade da Semântica e Pragmática, Rendón Rojas (1996) argumenta que, assim como a semântica, os princípios pragmáticos são importantes, pois a informação como uma qualidade secundária dos objetos, [...] é produzida pelos sujeitos, a partir da estruturação de propriedades presentes nesses objetos. Isto é, a informação é produto de uma síntese de elementos objetivos e subjetivos, de propriedades reais dos objetos com a atividade do sujeito (RENDÓN ROJAS, 1996, p. 26). Dessa forma, a atividade do sujeito se encontra no âmbito de uso dos objetos do mundo real, influenciada pelo contexto social, histórico e cultural no qual está inserido. Para o autor, a subjetividade não conduz a um relativismo informacional, uma vez que o elemento pragmático está condicionado às circunstâncias e aos significados semânticos, divididos por 38 Os dêiticos (ou dêixis) relacionam os enunciados do sujeito a aspectos tais como o lugar da enunciação, as atividades, os processos, os objetos ou a qualquer outro aspecto. Assim, eles identificam os distintos elementos de uma linguagem, natural ou artificial, em uma situação específica, facilitando a comunicação em dado domínio. 68 um grupo social. Nesse contexto, Lara (2006, on-line) assinala que a pragmática da informação pode ser vista como resultado da “construção institucional e intencional que tem nos valores simbólicos e funcionais a condição para a construção do sentido e para circular socialmente, desencadeando processos de conhecimento”. Assim, a geração de sentido não é uma questão individual do sujeito, porém, um construto social, político e econômico (KOBASHI; TÁLAMO, 2003). Dessa forma, tem-se que Semântica e Pragmática se complementam na modelagem de um domínio. Neste Subcapítulo foram apresentadas as relações entre os processos de geração de sentido e dos contextos de uso desses significados. Passa-se, portanto, ao próximo Subcapítulo, que discorre sobre os fundamentos da Terminologia na modelagem de um tesauro. 5.2 O PAPEL DA TERMINOLOGIA O termo “terminologia” é polissêmico e pode ser entendido de, pelo menos, três maneiras: a) como uma disciplina; b) como uma prática; c) como um produto gerado pela prática. Como disciplina, se ocupa do estudo de termos especializados; como uma prática, é o conjunto de princípios utilizados na compilação de termos; como um produto, é o conjunto de termos de uma especialidade particular (CABRÉ, 1995, p. 2). Nota-se que esse termo é polissêmico como tantos outros exemplos de polissemia, mesmo em áreas de especialidade. Assim, ele pode ser tanto o conjunto de fundamentos de uma teoria (disciplina), uma atividade (prática) terminológica ou um vocábulo (conjunto de termos de dado domínio) de especialidade. Por convenção, utiliza-se terminologia, com inicial minúscula, para denominar um vocábulo ou linguagem especializada, e emprega-se Terminologia, com a inicial maiúscula, para designar a atividade e a teoria. O campo da Terminologia como disciplina tem se desenvolvido de forma substancial, gerando revisões e novas teorias que visam à sua adequação às inovações do conhecimento científico. Conceitualmente, a Terminologia “estuda as chamadas línguas (ou linguagens) de especialidade e seu vocabulário” (BARROS, 2004, p. 21). Ela é uma “área teórica e aplicada, com atividade e diretrizes voltadas a diferentes perspectivas e interesses sociais” (KRIEGER; FINATTO, 2004, p. 24). A prática da terminologia é antiga, tendo origem pela necessidade de se nomear todas as coisas do mundo (animadas ou inanimadas), assim como pelo imperativo de entender as designações formuladas por outros povos (BARROS, 2004). Assim nascem os dicionários bilíngues e de domínios especializados, que unem os conceitos e os termos que os representam. Segundo Barros (2004), desde 2600 a.C. existem, por exemplo, dicionários 69 temáticos monolíngues, elaborados pelos sumérios, e, entre 460-377 a.C., o primeiro glossário de termos médicos elaborado pelo médico Heródoto e o gramático Herodianus. Desde então, houve crescente produção de obras terminográficas e, com o rápido desenvolvimento científico e tecnológico, o homem não se limitou “à compilação dos termos e passou a refletir sobre a linguagem” (BARROS, 2004, p. 30). Essa reflexão teve início na filosofia de Platão, que queria determinar a origem das palavras e como elas são atribuídas nos campos de saberes, e passou pelo Renascimento, com a valorização de um conjunto de termos como nomenclatura das artes, assim como pela necessidade de normalização39 de termos técnico-científicos (BARROS, 2004). Chegando aos dias de hoje, manifesta-se na preocupação de se representar uma inter-relação entre teoria e prática, com questionamentos ao modelo normalizador. Krieger e Finatto (2004) afiançam que a aceitação da existência formal de vocábulos de especialidade só aconteceu no século XVII. Já no século XVIII, as práticas dos enciclopedistas estimularam os estudos acerca das propriedades e problemas que giram no entorno dessas práticas, sobretudo por ter sido um período de profícua criação de nomenclaturas desenvolvidas no âmbito das ciências taxonômicas como, por exemplo, Biologia e Química (KRIEGER; FINATTO, 2004). Nesse contexto, nota-se a substancial contribuição de Lineu, com seu sistema universal de nomenclatura binominal, com regras precisas para a criação de nomes científicos para a flora e fauna (BARROS, 2004). Adicionalmente, a Revolução Industrial, com a criação de novos aparelhos e máquinas, impulsionou a indústria e a necessidade de novas palavras para designar essas inovações. Essa proliferação de denominações teve como consequência a urgência em organizá-las em terminologias especializadas. Assim, do século XVII ao século XIX, Krieger e Finatto (2004) afirmam que foram impulsionadas as discussões acerca das propriedades, particularidades e problemas que envolvem as terminologias em domínios tais como nas ciências, no comércio ou na administração. A partir disso, entre os séculos XIX e adentrando o século XX, a internacionalização das ciências exige estratégias de padronização terminológica das especialidades e elaboração de regras para a formação dos termos, assegurando a univocidade da comunicação científica internacional (KRIEGER; FINATTO, 2004). São esses elementos que forneceram a base para estudos que fundaram as Escolas de Terminologia (de Viena, de Praga, da Rússia, do Canadá, entre outras). Dentre essas, há dois básicos aspectos: “privilégio ao enfoque cognitivo do fenômeno terminológico [...] [e] uma visão do funcionamento linguístico do termo” (idem, p. 30). O primeiro dá importância 39 Na Terminologia, “normalizar” é aparelhar as línguas para todas as formas de expressão, e, “normatizar”, é fixar uma expressão como a mais adequada (KRIEGER; FINATTO, 2004). 70 ao elemento normativo da terminologia e, o segundo, à base descritiva do léxico especializado. De acordo com Krieger e Finatto (2004), as reflexões das primeiras Escolas de Terminologia deram origem a metodologias para tratamento das unidades terminológicas, ancoradas na máxima de que os termos são denominações de conceitos, determinados por léxicos padronizados. Esses princípios cognitivo e normativo foram seguidos pelo engenheiro austríaco Eugen Wüster, fundador da Escola Terminológica de Viena, para o desenvolvimento da Teoria Geral da Terminologia (TGT), que é um marco na história do campo da Terminologia. Os fundamentos dessa teoria estão registrados em sua tese, intitulada “A normalização internacional da terminologia técnica”, defendida em 1931, demonstrando a sua dedicação com a padronização terminológica. De forma teórica e prática, Wüster propôs métodos para a compilação, padronização e organização da terminologia da eletrotécnica, visando a garantir a comunicação entre os profissionais da área (KRIEGER; FINATTO, 2004). Suas ideias também estão expostas em obra póstuma, intitulada “Introdução à Teoria Geral da Terminologia e à Lexicografia Terminológica”, preparada por seu discípulo Helmut Felber e publicada, originalmente, em 1979, na qual foram compilados os manuscritos e notas de aulas ministradas na Universidade de Viena entre os anos 1972 e 1974 (KRIEGER; FINATTO, 2004). Como síntese, a TGT possui as seguintes características fundamentais: a) a prioridade do conceito em detrimento do termo; b) a precisão do conceito, o que retoma, de certo modo, a eliminação da ambiguidade e a busca da univocidade; c) a consequente abordagem onomasiológica, já que toda a atividade terminológica parte do conceito; d) a proeminência do nível lexical em detrimento dos demais níveis de descrição linguística (morfológico, sintático, textual, discursivo); e finalmente; e) a prescrição (ALMEIDA, 2006, p. 86). Com esse conjunto de princípios, a rigidez dos trabalhos terminológicos clássicos fica evidente, pois, como destaca Kamikawachi (2010), a TGT “tem como foco principal o componente conceitual, em detrimento do significado [...] os conceitos, nesta perspectiva, são estáveis, paradigmáticos e universais, como idealiza o lógico-positivismo” (KAMIKAWACHI, 2010, p. 21). Dessa forma, a autora afirma que em situações reais de comunicação, isso se torna muitas vezes inviável e insuficiente. A despeito dessas críticas, Cabré (1993) afirma que a TGT contribuiu para a distinção entre a atividade lexicográfica e a terminológica, apontando que, no primeiro, parte-se da palavra para chegar ao conceito, em um percurso semasiológico (do interpretante), e, no segundo, segue-se do conceito para o termo, em um percurso onomasiológico (do enunciador). Sendo assim, Wüster determina o estatuto terminológico de uma unidade lexical, altamente prescritivo, em detrimento de outros fatores envolvidos na 71 descrição linguística, assim como rejeita qualquer abordagem diacrônica (descrição das mudanças que sofreu). As ideias de Wüster também marcaram significativamente a Organização Internacional de Normalização (ISO), pois elaborou diversas normas e recomendações a respeito da terminologia, normalização, documentação, teoria dos símbolos, classificação, Classificação Decimal Universal (CDU), lexicologia, vocabulários, entre outros (FELBER, 1984, p. 25). Segundo Finatto, a necessidade de categorização de tudo o que circunda e constitui a comunicação técnico-científica tem [...] como fim tornar sua expressão mais “exata”. A partir e em função dessa perspectiva, Wüster propôs a expressão, a constituição e o estudo das terminologias baseados principalmente em relações lógicas como as de parte-todo, gênero-espécie. Utilizou-se também de oposições binárias e categorias lógicas aristotélicas, estabelecendo categorias fixas e universalmente válidas para a classificação de objetos, produtos de conhecimento e técnicas (FINATTO, 2001, p. 59-60). Todo esse aparato teórico, com princípios positivistas e caráter prescritivo, não leva em consideração os aspectos comunicativos e pragmáticos inerentes ao léxico temático (KRIEGER; FINATTO, 2004), trazendo críticas e novas reflexões e abordagens. Cabré (1993) aponta que, entre 1930 e 1990, houve quatro períodos de reflexão sobre a Terminologia, aos quais Barros (2004) acrescenta mais um período, após 1990: (1) de 1930 a 1960: é a origem da Terminologia como disciplina científica, com ênfase ao caráter sistemático da terminologia, com importante fundamentação teórica e metodológica a partir dos estudos de Wüster e Lotte. (2) de 1960 a 1975: surgem os primeiros bancos de dados terminológicos, provocados pelas inovações tecnológicas e a preocupação com a recuperação da informação, adquirindo caráter estrutural e normativo, internacionalmente. (3) de 1975 a 1985: há proliferação de normas e a eclosão de terminologias, encorajadas pela facilidade para o levantamento e tratamento automático e semiautomático de dados, que foi propiciada pela popularização da informática. (4) de 1985 a 1990: a Terminologia passa a ser interesse de estudos de vários pesquisadores, alastrando-se em países europeus, Canadá e também na América Latina, diversificando-se as questões investigadas e os projetos de terminologias para áreas de especialidade, englobando trabalhos em cooperação e intercâmbio científico, o que fortificou a sua articulação no plano internacional. (5) a partir de 1990: expansão das reflexões acerca das bases teóricas e metodológicas da Terminologia, com revisões que levam à elaboração de novas abordagens, com enfoque linguístico dos termos e fundamento descritivo da comunicação especializada, dando origem ao empuxo da monorreferencialidade e de univocidade do termo. 72 Essa expansão das reflexões sobre o aspecto linguístico do termo teve como consequência o desenvolvimento de novas teorias, como a da Socioterminologia, por exemplo. Essa abordagem tem início na década de 90, com François Gaudin, como uma crítica à rigidez encontrada na concepção de Wüster. Em 1993, Gaudin estuda as terminologias na análise da língua, com foco em seu uso social, econômico e comercial, opondo-se à atribuição formal de rótulos postulados pela teoria de Wüster (SALES, 2007, p. 7). Gaudin (1993) discorda da concepção wüsteriana de que o conceito é subordinado à significação do termo, como uma metalinguagem, pois acredita que pode ter utilidade normativa, mas não para a noção linguística de comunicação. Nas palavras de Faulstich (2006), a Socioterminologia é um ramo da terminologia que se propõe a refinar o conhecimento dos discursos especializados, científicos e técnicos, a auxiliar na planificação linguística e a oferecer recursos sobre as circunstâncias da elaboração desses discursos ao explorar as ligações entre a terminologia e a sociedade (FAULSTICH, 2006, p. 29). Nota-se, a partir desse conceito, que a Socioterminologia preocupa-se com a criação de uma linguagem para facilitar a comunicação dentro de uma comunidade discursiva, porém, estando atenta para as características específicas dessa comunidade, para o seu uso social. Enquanto Wüster descarta a possibilidade de haver termos homônimos, polissêmicos ou sinônimos, Faulstich (2006, p. 30) afirma que, para a Socioterminologia, a terminologia de uma área não pode abster-se de reconhecer tais fenômenos, pois os termos “são entidades passíveis de variação e de mudança e que as comunicações entre membros da sociedade são capazes de gerar conceitos interacionais40 para um mesmo termo ou de gerar termos diferentes para um mesmo conceito”. Gaudin (1993) foi, assim, o primeiro a reconhecer a variação terminológica ocorrendo também nas linguagens especializadas, que foi o eixo central de desenvolvimento da Socioterminologia (KRIEGER; FINATTO, 2004). Outra abordagem, a Teoria Sociocognitiva da Terminologia (TST), tem origem em 2000, a partir de estudos de Rita Temmerman, que vê o termo como uma construção advinda do contexto social de comunicação de especialidade. Nessa perspectiva, não há um conceito do mundo real que é designado por um termo existente a priori, mas, sim, um termo criado a partir de um processo de conceitualização e categorização sociocultural. Esse processo tem um enfoque hermenêutico e leva em consideração os modelos cognitivos das comunidades discursivas em uma estrutura prototípica da realidade observada, no contexto da comunicação (TEMMERMAN, 2000). Nesse sentido, a autora 40 O termo “interacionais” alude à relação existente nas trocas entre pares sociais, aos processos de interação (o indivíduo interage com a sua própria cultura) e mediação (o indivíduo percebe a ligação do signo com as idéias veiculadas em sua comunidade de prática). 73 recomenda definições enciclopédicas para os dicionários e glossários, uma vez que as definições aristotélicas clássicas (da TGT) não atendem às necessidades do usuário. A despeito dessas novas abordagens, interessa nesta tese a Terminologia do ponto de vista da Linguística, a partir de um novo paradigma, desenvolvido na Teoria Comunicativa da Terminologia (TCT), de Maria Teresa Cabré. A TCT passou a ser referência teórica em grande parte das pesquisas terminológica realizadas no Brasil [...] haja vista que uma teoria descritiva de base linguística parece ser muito mais adequada ao contexto brasileiro: país monolíngue com grande variedade dialetal. Só mesmo uma teoria descritiva para dar conta das especificidades das terminologias aqui praticadas (ALMEIDA, 2006, p. 86). Considera-se que o princípio da univocidade entre o conceito e seu respectivo termo, da TGT, nem sempre é adequado para a representação do conhecimento na construção de um tesauro. Dependendo do objetivo proposto na construção do instrumento, como é o caso desta pesquisa, acredita-se que usar um princípio que não aceita a existência de qualquer variação terminológica nos campos de especialidade não é apropriado. Como fundamento desta investigação, parte-se da ideia de que uma linguagem de especialidade é parte da linguagem natural e, como tal, tem natureza polissêmica e ambígua. Considera-se que é preciso reconhecer essa característica e adotar fundamentos e metodologias que possibilitem a representação dessa particularidade, assim como o controle da ambiguidade e da polissemia. Dessa forma, neste estudo, adotam-se as bases teóricas da TCT, que levam em consideração esse atributo da linguagem de especialidade, que é análoga à linguagem natural. Aceitam-se, portanto, propriedades tais como a polissemia, sinonímia e elementos metafóricos e metonímicos como uma condição inerente aos discursos da linguagem técnico-científica. Dada a importância da TCT para o desenvolvimento desta tese, passa-se a apresentá-la no próximo Subcapítulo. 5.3 APORTES DA TEORIA COMUNICATIVA DA TERMINOLOGIA (TCT) No início da década de 1990, os estudos de Maria Teresa Cabré, sua principal expoente, e de outros pesquisadores da Universidade Pompeu Fabra de Barcelona, seguem a influência de Gaudin e desenvolvem a Teoria Comunicativa da Terminologia (TCT). É um período de grande reflexão sobre a Terminologia e um momento no qual a Teoria Geral da Terminologia (TGT) recebe duras críticas por seu caráter reducionista e idealista (SALES, 2007, p. 8). Cabré, em entrevista realizada em 2013 (KRIEGER; SANTIAGO; CABRÉ, 2013), aponta que entrou para a área da Terminologia pela prática, pois, em 1985, foi contratada pelo Governo catalão para criar um centro de terminologia para a língua catalã. Esse fato deu origem ao Centro de Terminologia Catalão (TERMCAT), que colabora com diversas universidades catalãs ao firmar contratos de assessoria, colaboração, cessão de 74 especialistas em seus projetos terminológicos e formação universitária de graduação e pós- graduação. Nesse trabalho, era preciso atualizar a terminologia catalã, que havia sido negligenciada, quando foi iniciado o processo de sua normalização institucional e linguística. Nesse contexto, a terminologia clássica usada para a padronização de conceitos e termos não era adequada, o que teve como consequência o desenvolvimento de uma nova teoria, a TCT. Cabré (1999) indica que as bases da TCT começam a se delinear ancoradas em três distintas teorias: (1) do conhecimento, com as bases, de natureza cognitiva, sobre tipos possíveis de conceitualização da realidade e da relação dos conceitos entre si e com as suas designações, e esclarece sobre as correlações, identidades e diferenças dessas designações; (2) da comunicação, com fundamentos sobre as situações comunicativas e sua relação com cada tipo de comunicação, incluindo elementos tais como características, perspectiva, propósito e limitações; (3) da linguagem, que respalda a compreensão das unidades léxicas, seja na linguagem natural ou na particularidade de uma linguagem de especialidade, em seu contexto de uso, incluindo a variação dialetal e funcional. Com isso, tenta atender à dinâmica da linguagem de especialidade e à demanda da comunicação científica e técnica (MARTINS, 2011). Na perspectiva da TCT, havia a necessidade da compreensão das unidades terminológicas a partir de seus aspectos linguísticos e comunicativos, pois “aparentemente, considerados sob uma perspectiva formal e semântica, os termos não parecem se diferir muito das palavras; ainda que, notadamente, se difiram delas sob critérios pragmáticos e comunicativos” (CABRÉ, 1993, p. 167). Nesse sentido, os termos são elementos da linguagem natural e não podem ser apreciados como elementos artificiais e, sim, como componente do léxico de uma língua geral, não tendo, portanto, comportamento diverso das palavras. Logo, um termo é uma unidade linguística que tem uma função comunicativa e pragmática. Cabré (1993) parte da premissa de que há diferenças entre Linguística e Terminologia, e traça bases mais gerais, nas quais considera a Terminologia um campo interdisciplinar, que interage com a Linguística e com as Ciências Cognitivas e Ciências Sociais. Também pressupõe que a Terminologia atua em todas as disciplinas de forma transdisciplinar, uma vez que tanto a representação quanto a comunicação prescindem de uma terminologia (SALES, 2007). Sob essa perspectiva, Cabré (1993) afirma que toda linguagem é um sistema complexo e heterogêneo de subsistemas inter-relacionados, e o que difere a linguagem natural da linguagem de especialidade são os seguintes princípios: (1) a linguagem natural é um conjunto de regras, unidades e restrições, sendo de conhecimento da maior parte dos falantes de uma língua; (2) as unidades linguísticas da linguagem natural são utilizadas em situações que podem ser classificadas como não-marcadas; (3) a linguagem de 75 especialidade é parcialmente coincidente com o subcódigo da linguagem natural; (4) as linguagens especializadas possuem características específicas, tais como interlocutores, temática, contexto de comunicação, entre outros, que as tornam linguagens marcadas. Nesse sentido, uma unidade lexical pode ser um termo, desde que aplicado a uma determinada situação de comunicação, estando, portanto, sujeito aos fenômenos típicos dos sistemas linguísticos, tais como as variações. Cabré (1999) se contrapõe à TGT porque acredita que esta limita a comunicação profissional, por sua característica inflexível na forma de tratar os termos, seus conceitos e características. A autora afirma que a TGT pressupõe que os conceitos preexistem às expressões e o conhecimento técnico-científico são uniformes e universais, que o contexto não tem influência na estruturação de uma área de conhecimento, que o termo normalizado apresenta as características mais significativas para todas as situações, e que os domínios de especialização são neutros e consensuais. Em contrapartida, a TCT defende o caráter funcionalista da linguagem, pois os termos são estudados no âmbito de uso, situação em que ocorre a real comunicação. Assim, o processo se inicia na denominação (lugar de ocorrência; o nome ou termo) e vai em direção ao conceito. Esse processo é denominado “processo semasiológico”. FIGURA 1 – Processos onomasiológico e semasiológico Fonte: elaborado pela autora desta tese. No sentido observado na Figura 1, o “conteúdo de um termo não é fixo, mas relativo, variando conforme o cenário comunicativo em que se insere” (KRIEGER; FINATTO, 2004, p. 35), o que leva à ideia de que não há termos e nem palavras a priori, e, sim, unidades lexicais. Assim, essas unidades, quando termos, designam conceitos técnicos e científicos, contudo, continuam sendo signos de uma linguagem natural (BARROS, 2004). Para Martins (2011), a mudança de perspectiva, da TGT para a TCT deve-se em parte à utilização de tecnologias que permitiram o desenvolvimento da Linguística de Corpus. A aproximação aos dados impôs uma nova necessidade, a partir dos textos reais produzidos pelos especialistas em situações distintas de produção e, consequentemente, uma nova perspectiva metodológica, aliada a novos critérios de reconhecimento das unidades terminológicas (MARTINS, 2011, p. 1602). 76 Nota-se, portanto, que o uso de tecnologias informáticas no desenvolvimento de terminologias, a partir de dados retirados dos textos, sinalizou a ideia de que, fora do texto, as unidades linguísticas não podem ter estatuto de termos. Nesse sentido, sem o contexto, do qual foram extraídos, esses termos não podem representar um conhecimento e nem ser traduzidos na forma de um conceito ou definição. Dessa maneira, a significação somente pode acontecer nos textos, a partir do contexto, ou seja, da realidade social de comunicação. O diferencial da TCT está na compreensão do termo (unidade terminológica) do ponto de vista descritivo, tratando das questões da terminologia técnico-científica como um construto semelhante ao da linguagem natural, e não uma idealização formal restrita a um grupo de especialistas (KRIEGER; FINATTO, 2004). Isso porque, mesmo dentro de uma única comunidade de especialidade, muitas vezes, convivem distintas correntes e abordagens teóricas e metodológicas, o que minimiza a possibilidade de haver isenção de polissemia. Para Cabré (1999), as palavras são unidades léxicas (como todo signo linguístico) de um dado código e seu caráter de termo é ativado de acordo com seu uso em um contexto e situação adequados [...] que incluem os traços morfossintáticos gerais da unidade e uma série de traços semânticos e pragmáticos específicos que descrevem seu caráter de termo dentro de um determinado domínio (CABRÉ, 1999, p. 123). Nesse sentido, o termo, como unidade lexical, deve ser compreendido como um todo, tanto a partir de sua classe gramatical (função desempenhada), quanto em relação ao seu significado em um contexto de especialidade. A TCT defende, então, que na linguagem (natural ou não) há variações, fenômeno também reconhecido pela Socioterminologia, assim como existe o fenômeno da polissemia, elementos que devem ser consideradas no trabalho terminológico. Ademais, o sentido onomasiológico da TGT, que é categórico e obrigatório, passa a aparecer na TCT apenas de forma predominante, sem qualquer exclusividade (BARROS, 2004). Também é descartada a ideia de que um termo pode pertencer a um domínio em particular, uma vez que, nos campos de especialidade, um termo apenas pode ser usado por esse dado domínio. Assim, os sistemas conceituais são mais flexíveis, capazes de adequar-se à temática trabalhada, e as relações conceituais que se estabelecem entre as unidades terminológicas deixam de se limitar às ontológicas e lógicas, prescritas pela TGT. De maneira sistemática, o percurso onomasiológico e o percurso semasiológico podem ser observados nas Figuras 2 e 3, respectivamente, conforme modelo de descrição do percurso gerativo da enunciação, proposto por Pottier (1992). 77 FIGURA 2 – Percurso onomasiológico Fonte: POTTIER, 1992, p. 16. Na Figura 2, o ponto de vista é o do enunciador, que parte do mundo referencial (R), decide o que tem intenção (Co) de dizer e, a partir dessa conceitualização, se expressa por um processo de semiotização, por signos escolhidos da linguagem natural ou de especialidade (virtualidades da língua), através do que Pottier denomina “fenômenos de designação”. Já nos fenômenos da significação, está a concretização da enunciação, quando os signos escolhidos têm significado dentro de uma comunidade discursiva. Nota- se, assim, que o processo se inicia no conceito (conceitualização do mundo) em direção ao termo que representa o enunciado (semiotização e significação). Já no percurso semasiológico, o ponto de vista é do interpretante (receptor), e vai do termo ao conceito, conforme Figura 3. FIGURA 3 – Percurso semasiológico da TCT Fonte: POTTIER, 1992, p. 17. Observa-se que a Figura 3 apresenta o percurso de interpretação realizado pelo receptor, que se inicia a partir do discurso do enunciador. O receptor (interpretante) 78 consegue identificar os elementos discursivos do enunciado que o fazem compreender o que está sendo dito, através de representações e conceitualizações mentais que o levam ao mundo referencial (R), onde encontra a significação (reações eventuais). Dessa forma, percebe-se que o mundo referencial (R) é tanto o ponto de partida da Figura 2, quanto o ponto de chegada da Figura 3. O ponto R, segundo Pottier (1992), é o lugar das representações e conceitualizações mentais, não devendo ser o objeto de estudo dos terminólogos. O autor acredita que todo o trabalho terminológico se inicia no termo, cuja coleta é realizada a partir de um conjunto de textos que compõem o corpus. O pesquisador ainda acrescenta que considerar uma unidade lexical como termo exige encontrá-lo como designação para um conceito no próprio texto. Conforme os princípios da TCT, adotados nesta pesquisa, o trabalho terminológico deve ser realizado a partir de uma análise híbrida, que é feita nos dois sentidos: (1) semasiológico, partindo da unidade lexical de especialidade, encontrada nos textos (discurso do enunciador), para a identificação do conceito que essa unidade representa no mundo referencial (R); e (2) onomasiológico, que se inicia do conceito identificado e retorna ao significante, visando a delimitação e a seleção do termo mais adeqado para compor a terminologia (BARROS, 2004). Dessa forma, a Terminologia descritiva, seguindo a metodologia da TCT, adota um percurso dialético – semasiológico e onomasiológico. Para Cabré (1999), esses dois enfoques são complementares, com uma análise que leva em conta o termo (objeto de estudo) e a conceitualização mental, que é concretizada na definição que indica seu conteúdo semântico. Na perspectiva da metodologia da TCT, Almeida (2006) sugere um projeto terminológico, obedecendo aos seguintes princípios: (1) o objeto de estudo são as unidades terminológicas, e não os conceitos, com ênfase em uma perspectiva linguística e abordagem semasiológica; (2) a priori não há diferença entre termo e palavra, pois são signos linguísticos que se concretizam no discurso como termo ou palavra, dependendo da situação comunicativa; (3) o conhecimento especializado pode ser comunicado nos níveis lexical, morfológico, sintático e textual; (4) termos devem ser observados no seu ambiente real de ocorrência (contexto de uso); (5) deve-se considerar a variação conceitual e denominativa dos termos; (6) as unidades linguísticas, em relação ao caráter cognitivo, devem: (a) ser subordinadas ao seu contexto temático; (b) ter um lugar específico no mapa conceitual; (c) ter seu significado atrelado ao lugar que ocupam nesse mapa. 79 Além dessas premissas, Almeida (2006) recomenda que o projeto deve prever a compilação de um corpus, a elaboração de um mapa conceitual, o planejamento dos campos da ficha terminológica, a elaboração de definições, a organização micro e a organização macro do verbete. Buscando oferecer as bases para o entendimento sobre o termo, o conceito e a definição, os próximos Subcapítulos oferecem uma visão geral sobre esses temas. 5.4 OS ELEMENTOS BÁSICOS DE UMA TERMINOLOGIA A partir dos princípios da TCT, o objeto de estudo da Terminologia é o termo, que pode ser entendido como uma unidade lexical (uma palavra ou expressão), que foi considerada uma unidade terminológica ou signo terminológico, utilizado para designar um conceito mental, concretizado por meio da definição. Dessa forma, é necessário descrever esses três elementos: o termo, o conceito e a definição. Isso será feito nos próximos Subcapítulos. 5.4.1 O termo De forma geral, o termo é uma unidade-padrão, podendo ser constituído de uma ou mais palavras, formando uma expressão, e é considerado uma unidade lexical em um dado domínio (em seu sentido mais amplo), utilizada para designar um conceito. Na Terminologia, dependendo da abordagem teórica utilizada, haverá distintas acepções para termo. Na Terminologia clássica, a partir dos princípios da Teoria Geral da Terminologia (TGT), o termo, como unidade terminológica, “é, simultaneamente, elemento constitutivo da produção do saber, quando componente linguístico, cujas propriedades favorecem a univocidade terminológica” (KRIEGER; FINATTO, 2004, p. 75). Nessa visão, o conceito tem papel de destaque, pois é ele que faz com que uma palavra tenha valor de termo em uma área de especialidade, pois “a compreensão de uma unidade da língua, enquanto termo, está fundamentada no papel da dimensão conceitual do signo linguístico que responde, neste caso, pelo denominado conteúdo especializado” (KRIEGER; FINATTO, 2004, p. 76). Dessa forma, as autoras explicam que as unidades terminológicas, na TGT, possuem uma invariabilidade semântica porque se limitam a conteúdos de uma única especialidade, estando associadas também a características funcionais tais como de monossemia, monorreferencialidade e exclusividade denominativa. Enquanto na TGT o termo é tido como uma unidade terminológica, na Teoria Comunicativa da Terminologia (TCT), o termo é considerado uma unidade lexical, que é 80 ativada singularmente a partir de situações pragmáticas de uso e comunicação (CABRÉ, 1999). Na TCT, o termo é composto pela forma, que é constante, e um conteúdo, que é dependente do tipo de situação (âmbito temático, abordagem, tipo textual). Assim, ele é um objeto multidisciplinar, podendo ser analisado sob os aspectos cognitivo, linguístico e comunicativo (CABRÉ, 1999). Portanto, o termo é definido, dentro da abordagem TCT, como uma unidade lexical poliédrica, que comporta variação denominativa, conceitual e de sinonímia, pois pode ser analisado sob diferentes aspectos e modelos, dependendo do estudo em pauta. Cabré (1993) afirma que um termo, do ponto de vista da sua função, pode desempenhar distintos papéis funcionais, porque estes participam das mesmas categorias gramaticais de um léxico comum. Nesse sentido, o mais comum é que os termos sejam categorizados como substantivos, que designam objetos, mas não é raro encontrar um valor de termo em adjetivos (denominando propriedades ou qualificador, por exemplo), em verbos (expressando processos, por exemplo) e advérbios (indicando uma circunstância ou qualificando uma ação, por exemplo). Ademais, também um nome próprio pode ser um termo, pois muitas vezes fazem parte da comunicação de especialidade. Isso pode ser explicado pelos exemplos: (1) os nomes próprios “Convenções para Proteção de Ozônio” e “Tratados Ambientais” assumiram valor de termos, pois se tornaram um referencial no âmbito de leis ambientais; (2) na área da Filosofia, os nomes próprios Sócrates, Aristóteles e Escola de Alexandria, adquiriram valor de termo pela significação que representam. Também é preciso distinguir os termos lexicalizados, que são sintagmas lexicais ou terminológicos, ou seja, conjunto de elementos lexicais que compõem um sintagma, muitas vezes, formando uma nova palavra. Nesses casos, o reconhecimento de um termo sintagmático, ou a determinação do grau de lexicalização dos sintagmas, em um domínio de especialidade, pode ser facilitado pela observância de algumas características, que, igualmente, podem ser utilizadas na identificação de uma unidade lexical simples (BARROS, 2004). Assim, Barros (2004) afirma que para saber se uma sequência de unidades lexicais se transformou em uma única unidade léxico-semântica é uma problemática complexa, mas que pode ser facilitada ao serem observados alguns atributos na unidade léxico-semântica: (a) não-autonomia de um componente em relação a outros que compõem a unidade léxico-semântica, sem que haja alteração de sentido; ex.: quinta e feira em quinta-feira; (b) impossibilidade de comutação de um componente sem acarretar mudança de sentido; ex.: mesa-redonda (tipo de debate) / mesa quadrada; (c) não-separabilidade dos componentes; ex. terra fina [tipo de mistura] / esta terra é fina; (d) particularidade da estrutura interna; ex.: ausência de determinação significa integração dos elementos constitutivos: ter medo, fazer justiça, ser de bom tamanho; [...] 81 (e) existência de uma definição especializada para o sintagma analisado [...] se a sequência sintagmática em questão designa um conceito particular [...] essa sequência é um termo sintagmático; [...] (f) compatibilidade sistêmica do sintagma [...] [pois] a oposição do sintagma a outros termos não-sinônimos, mas semanticamente próximos, pode permitir a identificação do seu grau de lexicalização. Exemplo: terra apurada (= terra roxa, muito fértil), terra franca (= terra barrenta; terreno argiloso, amarelado e gordo); [...] (g) comutação sinonímica [...] Se a comutação provocar uma mudança de sentido na essência do elemento do elemento base do sintagma, significa que a ligação entre o determinado [...] e o determinante é muito estreita e que a sequência é um termo sintagmático. Exemplo: porta do leme [não é uma porta de abrir e fechar] / porta aberta; [...] (h) substituição de um sintagma inteiro por um termo lexemático; [...] estrada de ferro, o qual pode ser substituído pelo termo simples ferrovia. [...] (i) maneabilidade [...] [ou seja, facilidade (ou não) de uso e memorização] do sintagma na comunicação. [por exemplo: IPTU = Imposto sobre Propriedade Territorial Urbana, cujo acrônimo equivale a um sintagma de especialidade fácil de memorizar] [...] (j) imprevisibilidade semântica [...] ligado à ambiguidade de um sintagma [...] (ex.: erva-de-Santa-Luzia [nome de uma flor, que tem extensão do sentido, pois esse sintagma não pode ser entendido a partir dos significados de seus elementos, isoladamente: do lexema erva, da preposição de e do nome Santa Luzia]) [...] (k) frequência de coocorrências [...] no domínio estudado [essa frequência indica que os sintagmas estão associados e podem compor um único sintagma, tais como os sintagmas Ciência da Informação e Organização da Informação, no domínio da BCI] [...] (l) uso [...] [que indica] a estabilidade da relação entre a sequência sintagmática e um significado único [...]. O sintagma adquire, assim, uma estabilidade de forma e de sentido (BARROS, 2004, p. 103-105, grifos da autora citada). Nota-se que há diversas formas de se identificar um termo sintagmático ou de lexicalização, sobretudo a partir do conteúdo semântico que ele carrega dentro de um contexto de uso. Os critérios de identificação são importantes, pois em diferentes línguas e linguagens de especialidade, assim como em distintas épocas, as lexicalizações podem acontecer de diferentes maneiras, até mesmo dentro de um mesmo campo conceitual. Quando não são suficientes isoladamente, esses critérios podem ser combinados para facilitar a identificação do termo. Contudo, Krieger e Finatto (2004) alertam que a determinação do grau de lexicalização de um sintagma é mais imprescindível no trabalho terminológico de tradução. Na área da BCI, o termo é definido como uma “palavra (ou expressão) empregada para a inclusão temática de um item em sistemas de informação e para recuperação posterior” (CUNHA; CAVALCANTI, 2008, p. 360). Para os autores, o termo indica sempre um assunto simples, mas pode ser composto por uma ou mais palavras. Lara (1993) aponta que, quando as informações de um texto são traduzidas para uma linguagem controlada, tal como um tesauro, trabalha-se com a significação, que é a representação 82 dessas informações sem que o seu significado seja comprometido. Para a autora, isso confere à representação um valor de signo documentário e, nesse sentido, ressalta que um tesauro é um conjunto de signos documentários. Na linguagem de indexação do tipo Listas de Cabeçalho de Assunto, o termo recebe a designação de cabeçalho de assunto. Por outro lado, quando utilizado pelo autor de um trabalho científico (tese; dissertação) para expressar os assuntos abordados no documento, o termo recebe o nome de palavra-chave. Já quando utilizado nos tesauros, o termo pode ser: (a) um descritor preferido, que representa o termo escolhido como autorizado para uso na indexação; (b) um descritor não-preferido, quando representa o termo não autorizado para uso na indexação; (c) um qualificador, quando utilizado para desambiguação de homógrafos, utilizados entre parênteses (BRASCHER, 1999). Quando incluído em um tesauro, o significado de um termo é assegurado em seu contexto de uso e, preferencialmente, deve ser capaz de expressar a sua denotação mesmo fora da estrutura conceitual do instrumento (DRAKE, 2003). Sobre essa questão, Lara (1993) indica que os termos, denominados por ela de signos linguísticos, só têm significação se forem referentes a um domínio específico. Nesse contexto, o termo é a menor unidade de representação de um conceito, podendo adotar distintas formas, tais como símbolos, fórmulas, siglas ou acrônimos. Dessa forma, o termo assume o valor de um descritor preferido ou não-preferido, havendo sempre uma relação de equivalência entre eles, mantendo-se, assim, a estrutura semântica do instrumento. Além das relações de equivalência, Lara (1993) aponta que é preciso estabelecer um sistema de relações possíveis para cada signo documentário, levando-se em consideração o domínio e o contexto de uso. Lancaster (2004) ainda alerta para o fato de que um termo pode ter mais de um significado (conceito) dentro de um mesmo domínio, e recomenda o uso de qualificadores como forma de distinguir os significados. Campos e Gomes (2006, p. 349) acrescentam que, na atividade de construção de tesauros, o termo, como um signo verbal, designa um conceito, pois “o vocabulário do tesauro não é constituído de palavras da linguagem natural [...] mas de uma lista de termos, entendendo-se aqui como termo o signo verbal que designa um referente, ou, num nível maior de abstração, que denota o conceito”. Para as autoras, a construção do tesauro tem por base o domínio, e, não, o discurso, uma vez que a determinação do termo é realizada a partir da análise de um contexto e, através dessa análise, se estabelece a forma final do termo que irá representar um conceito, que é uma unidade de conhecimento dentro de dado domínio. Contudo, considera-se necessário reconhecer que o discurso é complementar ao domínio, porque é por meio do enunciado, verbal ou não, que se materializa o conhecimento de um domínio. Nessa visão, o discurso é composto por um “conjunto de afirmações que, 83 articuladas através da linguagem [palavras ou termos], expressam os valores e significados das diferentes instituições (religiosas, políticas, mercadológicas, educacionais, etc.)” (MEURER; MOTTA-ROTH, 1997, p. 16). Nesse sentido, segundo Foucault (1969), os elementos de um dado discurso são dispersos e somente podem ser identificados através das regras de formação adotadas nesse discurso, incluindo: (a) os objetos que coexistem nele e o transformam; (b) os diferentes tipos de enunciação; (c) o sistema de conceitos, desde sua origem à sua variação histórica; (d) os temas e teorias que o interessam e respaldam, definindo a estratégia usada por esse universo discursivo. Corroborando com essa posição, Bakhtin (2006) aponta que Todo signo, como sabemos, resulta de um consenso entre indivíduos socialmente organizados no decorrer de um processo de interação. Razão pela qual as formas do signo são condicionadas tanto pela organização social de tais indivíduos como pelas condições em que a interação acontece. Uma modificação destas formas ocasiona uma modificação do signo. É justamente uma das tarefas da ciência das ideologias estudar esta evolução social do signo linguístico. Só esta abordagem pode dar uma expressão concreta ao problema da mútua influência do signo e do ser; é apenas sob esta condição que o processo de determinação causal do signo pelo ser aparece como uma verdadeira passagem do ser ao signo, como um processo de refração realmente dialético do ser no signo (BAKHTIN, 2006, p. 43, grifos do autor citado). Nessa acepção, o significado (conceito) do termo está atrelado às concepções ideológicas que, por sua vez, estão ligadas às relações sociais que ocorrem em dado domínio. Dessa maneira, entende-se que o domínio e o discurso se complementam como fonte terminológica na construção de tesauros. Outro enfoque é dado por Saussure41, que, para termo adota a designação de signo linguístico, cuja abordagem pressupõe uma ligação indissociável entre o significado e o significante (NASCIMENTO, 2008). Saussure também aponta que, sendo o signo um ente mental e arbitrário, seu compartilhamento implica que ele seja visto como um fato social, atendendo às características indicadas por Durkheim: (a) generalidade: conjunto de saberes aceitos por um grupo; (b) exterioridade: apreensão do conhecimento, a partir de formação educacional, por exemplo; (c) coercitividade: poder de teorias estabelecidas, cuja mudança requer alteração de paradigmas (FERRATER-MORA, 2004). Essa visão do signo como um ente psíquico retirou a natureza nominalista do signo, pretendida por Platão, assim como sua relação de verdade com o objeto, como postulava Aristóteles (SILVEIRA, 2005). Analisando as acepções sobre o termo, nota-se sempre uma associação entre o termo e o seu significado – o conceito –, sendo este o tema do próximo Subcapítulo. 41 Mais discussões acerca da abordagem de Saussure estão descritas a seguir, no Subcapítulo 5.4.2, sobre o conceito. 84 5.4.2 O conceito O termo “conceito” tem origem no Latim conceptus (do verbo concipere), significando “coisa concebida” ou “formada na mente”. Na língua geral, há ambiguidade e esse termo é usado em distintas acepções, podendo significar “noção”, “juízo”, “opinião”, “ideia” ou “pensamento” (FERRATER-MORA, 2004). Os estudos acerca do conceito têm origem na Filosofia clássica, havendo distintas concepções para o seu significado. Como Hjorland (2009) afirma, hoje não há consenso sobre o que são conceitos, quais teorias do conceito são mais importantes e como as teorias do conceito podem ser classificadas [...] [havendo] diferentes visões sobre conceitos, de grandes filósofos e cientistas, que estão associadas com distintas visões epistemológicas e do mundo e cada uma delas estão inclinadas a competirem entre si (HJORLAND, 2009, p. 1519). Nota-se, assim, que é possível atribuir distintas definições para conceito, dependendo da visão epistemológica adotada. A investigação sobre a natureza dos conceitos está em curso, sendo necessário um olhar reflexivo sobre esse tema. Assim, antes de tratar sobre o conceito nas áreas da Linguística, Terminologia e BCI, descrevem-se algumas teorias do conceito. O relato destaca alguns pensadores, iniciando na filosofia clássica e finalizando no século XX, expondo-os de forma cronológica. Ressalta-se que não se pretendeu esgotar o tema sobre as teorias do conceito existentes, mas buscou-se oferecer insumos para reflexões teóricas acerca do tema. 5.4.2.1 Breve panorama acerca dos estudos sobre o conceito42 Na filosofia clássica, as questões metafísicas43 envolvendo conceitos incluem o que é um universal e a distinção entre diferentes tipos de universais44, sendo Sócrates, Platão e Aristóteles, os pioneiros. Para Sócrates, a existência real dos conceitos (ou ideias) é obtida a partir de conceitos abstratos (piedade, coragem ou justiça) e de conceitos concretos (homem, árvore ou pedra), válidos para toda a humanidade, em qualquer tempo e lugar. Com Platão, considerado de um realismo absoluto, o conceito é analisado mais do ponto de vista de um universal real (essência) (FERRATER-MORA, 2004), existindo em um 42 É importante frisar que houve muita citação, na parte inicial deste Subcapítulo, de Ferrater-Mora (2004), autor do Dicionário de Filosofia, que foi professor de filosofia na Universidade do Chile e, desde 1949, do Bryn Mawr College (Pennsylvania, E.U.A.). Ele é membro do Instituto Internacional de Filosofia desde 1962, organismo que reúne um número restrito de membros (inferior a cem), recrutados em todos os países do mundo. O seu dicionário de filosofia é mundialmente conhecido e considerado por seus pares como um trabalho de qualidade e sem paralelo no gênero. 43 São as questões filosóficas sobre a essência das coisas do mundo, a quais categorias elas pertencem e quais são as relações que possuem entre si. 44 Dependendo da acepção, um universal pode se referir a um conceito na mente das pessoas, a uma entidade da realidade ou a uma etiqueta atribuída para representar objetos ou eventos particulares, de forma arbitrária. 85 mundo separado, a priori, que está fora dos objetos e fora da mente. Já com Aristóteles, destaca-se mais a natureza de substância do conceito, em uma filosofia mais conceitualista45 ou de um realismo moderado (FERRATER-MORA, 2004). Assim, o filósofo considera os aspectos ontológicos, do ser, juntamente com o aspecto lógico, da predicação (aplicado às coisas e às palavras). Nessa perspectiva, o universal é a essência de um objeto individual, juntamente com a forma desse objeto, ou seja, é composto por sua substância física – matéria (diferença que individualiza; a espécie) e forma (essência que determina o gênero). Dessa maneira, esse pensamento sobre o conceito trouxe contribuições, sobretudo, para o estatuto ontológico dos universais, dando subsídios à determinação das relações de gênero e espécie. Contudo, essa posição realista sobre a natureza ontológica dos universais fez com que Porfírio (234-305 d.C.) colocasse algumas questões: (1) os gêneros e as espécies existem de fato ou são construções do intelecto?; (2) se de fato os universais existem, são corpóreos ou incorpóreos?; (3) se os universais existem, estão separados das coisas ou estão nelas implicados, expressando suas características? (FERRATER-MORA, 2004). Essas perguntas refletem a busca pelo conhecimento sobre a natureza dos gêneros e espécies, para saber se são substâncias ou entidades mentais, se são substâncias corpóreas ou incorpóreas, assim como se estão separadas dos objetos ou inerentes a eles. Ferrater-Mora (2004) acredita que, para Porfírio, os objetos conhecidos a partir dos sentidos são todos individuais e que os gêneros e espécies são sempre universais, uma vez que são comuns a muitos indivíduos. Entretanto, parece ter restado um problema, que é definir se os gêneros e espécies existem nos objetos ou se são um construto mental. A questão dos universais continuou no pensamento filosófico durante grande parte da Idade Média (período entre os séculos V e XV), e houve forte tendência entre os filósofos e pensadores a se considerar a existência dos universais, que se dividiam entre as visões platônica e aristotélica. Entretanto, após a segunda metade do século XI, essa tendência se desvanece e ressurgem as questões acerca da existência e natureza dos universais (FERRATER-MORA, 2004), com debates abordando o estatuto ontológico dos universais. Nessa época, Abelardo (1079-1142) defende a ideia de que os universais não existem, pois não são objetos reais em si mesmos nem na mente humana. Utilizando uma abordagem semântica, Abelardo rejeita a ideia de universais e afirma que a universalidade está nas palavras, com uma função significativa (mental) e outra referencial (no mundo), pois é a denominação que faz os objetos existirem de fato (FERRATER-MORA, 2004). Com 45 No conceitualismo, os universais são apenas conteúdos de nossa mente (ou conceitos), pois são representações nominais do intelecto, e o princípio ativo da substância é derivado das coisas reais e, dessas, guarda alguma semelhança (FERRATER-MORA, 2004). 86 esse pensamento, Abelardo rompe com a ideia da existência de universais reais e lógicos, acatando a visão da filosofia conceitualista, aceitando-os como conceitos. Já a Idade Moderna (período entre os séculos XV e XVIII) traz a valorização do conhecimento racional e da análise do universo, em uma clara separação entre fé e razão. Nessa época, a compreensão do mundo passa a ser discutida por distintos pensadores, tais como Nicolau Maquiavel, Galileu Galilei, Francisco Suárez, Francis Bacon, Thomas Hobbes, René Descartes, Immanuel Kant, John Locke, Gottfried Leibniz, David Hume, Friedrich Hegel, entre outros (ELIAS, 1970). A racionalidade contribui para o estabelecimento de relações de semelhança entre objetos e conceitos, raciocínio que é realizado a partir de um conhecimento anterior do sujeito. Nesse sentido, há uma reinterpretação dos significados de conceitos concretos e abstratos da filosofia clássica, e o primeiro passa a ser apresentado como apreendido pela experiência sensorial (imutável e matemático), e o segundo, representando uma realidade subjetiva (inventada artificialmente), pois é um signo que denomina um conceito concreto (ILIENKOV, 1960). Nessa época, destaca-se a posição de alguns filósofos: (1) Descartes (1596-1650) e Leibniz (1646-1716): o sentido de conceito é estudado no plano da ideia (apreendida pelo pensar), em uma abordagem metafísica46 do conceito, que passa a receber uma interpretação epistemológica cartesiana (FERRATER- MORA, 2004); (2) Kant (1724-1804): todo conceito é abstrato em relação ao seu uso (em diferentes graus), e sempre expressa algo em geral, com um caráter genérico ou específico do objeto, podendo ser definido a partir de si mesmo, por meio de enunciados de suas características, tendo por base o fundamento da síntese de características para formar um conceito (ILIENKOV, 1960); (3) Hegel (1770-1831): o conceito é obtido através de um processo que se inicia no conceito subjetivo (mental), depois passa ao conceito objetivo (resultado do ato do sujeito), e, por fim, atinge o plano da ideia (apreendida pelo pensar), cujo significado se manifesta em domínios específicos (FERRATER-MORA, 2004). Nota-se que, durante a Idade Moderna, as formas racionalista e empirista de conceber o conceito têm relação com o seu contexto histórico, no qual teve origem o método científico, que determinou uma nova abordagem para a ciência e o conhecimento (ILIENKOV, 1960). Percebe-se que depois que Abelardo (já citado) descartou a existência dos universais, as discussões sobre o assunto ficaram em segundo plano, ainda que em 46 Enquanto a metafísica clássica se pauta no princípio de que o conhecimento da verdade é obtido a partir de sua referência no mundo e de suas causas, a metafísica em Descartes e Leibniz tem por base o princípio de que a verdade é algo constituído, construído e reconhecido pela razão. 87 Kant possa ser encontrada menção sobre o estatuto ontológico dos universais (gênero e espécie). Já no século XIX, quando o pensamento filosófico caminhava para o positivismo, não há tendência em discussões filosóficas sobre os universais. Passando do século XIX ao início do século XX, Frege (1848-1925) trabalhou com a lógica em uma concepção que se situa entre a filosofia e a matemática, fazendo uma distinção entre conceito e objeto: conceito é “aquilo a que se refere um predicado” (predicação), podendo ter função de argumento e valor de Verdadeiro ou de Falso; objeto, por sua vez, é um nome próprio (designação para um objeto singular) (FERRATER-MORA, 2004, p. 520). Ferrater-Mora (2004) também aponta que, para Frege, não há uma Verdade em si, pois o conceito de Verdade é construído pelos indivíduos, sem universalidade. Sendo assim, se uma palavra se refere a um conceito, isso não significa que a palavra é a Verdade (ou seja, o conceito). Há a necessidade de se nomearem as coisas, de maneira arbitrária, e essa representação não é a coisa em si, mas uma Verdade como um conceito semântico (FERRATER-MORA, 2004). Adentrando já no século XX, destacam-se as visões de alguns pensadores: (1) Gaston Bachelard (1884-1962): em uma vertente racionalista, defende a ideia de que a palavra, quando usada para representar um conceito na linguagem significativa, e não na linguagem poética, precisa se manter na precisão de seu sentido, por meio do pensamento lúcido da razão (CARVALHO, 2010). Assim, o conceito não preexiste ao processo cognitivo, pois ele é uma construção que se dá por meio do ato de conhecer; um objeto não pertence a um domínio, mas está incluído em um ambiente global (LIMA; MARINELLI, 2011), fato que é corroborado por Cabré (1999), com a TCT; (2) Ludwig Joseph Johann Wittgenstein (1889-1951): introduziu o conceito de jogos de linguagem, em uma analogia que trata a linguagem como um jogo, pois ela é guiada por regras de constituição (gramática); sendo o significado de uma palavra formado por regras que orientam o seu funcionamento no contexto de uso e, assim, o significado apenas é apreendido com a observação das associações com outros objetos e na prática das atividades; está mais próximo da teoria sociocognitiva, pois pressupõe que as categorias de conceitos são formadas pela experiência e cognição humana, para serem compartilhadas em sociedade (SUTCLIFFE, 1993; SANTOS; NASCIMENTO, 2010); (3) Mikhail Bakhtin (1895-1975): rompeu com as formas tradicionais de pensamento sobre a linguagem e dedicou seu trabalho à definição de noções, conceitos e categorias, afirmando que cada espaço discursivo exige uma escolha de palavras, que é determinada pelas relações sociais de composição e estilo do discurso, estando a língua em constante tensão, pois está sempre sob influência do contexto social, da ideologia 88 dominante e da luta de classes (política institucional) (BRAITH, 2005; SANTOS; NASCIMENTO, 2010). (4) Lev Semenovitch Vygotsky (1896-1934): no campo da psicologia desenvolve a teoria sobre o “sentido”, sendo um dos elementos que rompe com as principais correntes psicológicas do início do século XX; defende a ideia de que a abstração e a generalização, enquanto formas para a elaboração dos conceitos mais básicos, formulados pelos seres humanos, podem acontecer livres de atividades práticas ou de contextos; porém, como pensamento verbal, os conceitos não são inatos, pois são construções culturais, criados como consequência da socialização (contextualizados); além disso, as palavras têm uma função mediadora entre os homens e as coisas do mundo e, nessa mediação, cada palavra se refere a uma classe de objetos, pois é uma forma de representação do conceito dessa classe (VYGOTSKY, 1998; BARROS et al., 2009); (5) Thomas Samuel Kuhn (1922-1996): entende o conceito como um construto social e não isolado, que gera um comportamento conceitual; ademais, o conceito é apreendido por meio de um processo abdutivo (dado o caso, infere-se a regra), no qual o enunciado de uma evidência (um fato ou conjunto de fatos), aliado às hipóteses alternativas à explicação dessa evidência e à indicação de um valor para essas explicações, possibilita determinar o exemplar para representar esse conceito; assim, não importa se o conceito “é uma representação mental ou uma habilidade adquirida, preocupações de ordem genética ou ontológica propícias para a justificação dedutiva e indutiva do tipo de inferência privilegiado pela escolha” (ALMEIDA, 2010, p. 262); com isso, o pensador descontrói a ideia da objetividade e insere elementos da metafísica (bem próxima ao senso comum, do experienciado empiricamente); (6) Gilles-Gaston Granger (1920-): filósofo europeu que concebe o sentido de um conceito como dependente do uso que se faz dele, sendo que o processo tem início na sintaxe e é complementada pela semântica, que possibilita a interpretação da experiência; assim, o conceito é considerado uma proposição ou função científica, que combina a teoria e a prática, pois esta última é que conduz a ação descrita no conceito (GRANGER, 1974, 2013); (7) Eleonor Rosch (1938-): uma das teorias mais recentes, que se opõe às teorias clássicas do conceito, é a teoria dos protótipos, desenvolvida na década de 1970, a partir das ideias de Wittgenstein, porém, adotando uma centralidade prototípica; os conceitos são representados por um conjunto de características que são ponderadas até que se obtenha a definição do seu protótipo, sendo uma informação resumida sobre uma categoria de conceitos; (SUTCLIFFE, 1993; MACEDO, 2002; LIMA, 2010); (8) Douglas L. Medin (1940-): apresenta a teoria da concepção teórica, na qual um conceito é um conjunto de propriedades (atributos ou traços), composto a partir dos 89 relacionamentos que mantém com outros conceitos, e o conjunto dessas relações formam redes que determinam o que ele denomina de teorias (contextos de uso); a relação entre um conceito e um exemplar não tem por base somente uma correspondência direta de propriedades entre eles, mas é dependente de o que a teoria (contexto) requer como certo para aquela relação, permitindo um processo analítico através do qual o conceito pode representar a dinamicidade e a multiplicidade de contextos possíveis (MEDIN, 1989; MACEDO, 2002). Pelo exposto, percebeu-se que o problema dos universais reapareceu no século XX, algumas vezes em uma filosofia de abordagem analítica, ainda que rebatizado pela denominação de “conceito” ou “protótipo”. A importância de mostrar pensamentos desde a filosofia clássica vai ao encontro de Deleuze e Guattari (1997) que acreditam que a Ciência não tem por objeto os conceitos, pois um conceito não é um conjunto de ideias associadas, como uma opinião. Nem tampouco uma ordem de razões, uma série de razões ordenadas, que poderiam, a rigor, constituir uma espécie de Urdoxa47 racionalizada. Para atingir o conceito, não basta mesmo que os fenômenos se submetam a princípios análogos àqueles que associam as ideias, ou as coisas, aos princípios que ordenam as razões. [...] As ideias só são associáveis como imagens, e ordenáveis como abstrações; para atingir o conceito, é preciso que ultrapassemos umas [as ideias] e outras [as abstrações], e que atinjamos, o mais rápido possível, objetos mentais determináveis como seres reais (DELEUZE; GUATTARI, 1997, p. 13-14). Nesse sentido, os autores defendem que é à Filosofia que compete criar conceitos de maneira mais rigorosa, mas ela não está preocupada com a comunicação, a partir de um consenso, pois isso é tarefa da Ciência. Nesse sentido, foi preciso também buscar informações sobre como a Ciência trata das funções dos conceitos nos grupos discursivos. Assim, Filosofia e Ciência se complementam nas reflexões sobre o conceito de conceito, proporcionando insumos às questões relativas ao funcionamento, estrutura e uso do conceito na linguagem. A linguagem é responsável pela comunicação entre indivíduos, assim como possibilita simplificar e generalizar o que é conhecido (por categorias conceituais), facilitando o processo de abstração e generalização. Todo este Subcapítulo teve como objetivo principal mostrar a visão de distintos pensadores sobre o conceito de conceito, e, conforme foi dito ao início do relato, procurou- se destacar algumas reflexões, mas esse tema não se esgota por aqui. A especialização das Ciências trouxe novos desafios de comunicação e, como consequência, impulsionou os debates sobre o conceito de conceito, em especial no campo da Terminologia, mas também verificadas no âmbito da Linguística e da BCI, cujas discussões estão apresentadas no próximo Subcapítulo. 47 Primeira doutrina ou opinião originária, pretensamente superior. 90 5.4.2.2 O conceito na Linguística, Terminologia e BCI No campo da Linguística, Dubois et al. (1997, p. 135) apontam que “dá-se o nome de conceito a toda representação simbólica, de natureza verbal, que tem uma significação geral conveniente a toda uma série de objetos concretos que possuem propriedades comuns”. Maimone e Tálamo (2011, on-line) esclarecem que, de forma mais ampla, “pelo trabalho no plano simbólico, a Linguística cria conceitos que ordenam a realidade e categorizam o mundo”. Como fundador da Linguística moderna, as ideias defendidas por Ferdinand de Saussure (1857-1913) sobre o conceito são contrárias ao pressuposto de que as ideias são anteriores às palavras, com um pensamento semelhante ao de Abelardo (ver Subcapítulo 5.4.2.1). Saussure considerou o conceito como sinônimo de significado, que está no plano das ideias, como uma representação de um objeto (ou realidade social) (NASCIMENTO, 2008). Nascimento acrescenta que A língua, até então concebida como uma simples nomenclatura, é entendida, por ele, como um sistema de signos [semiológico], e o signo como uma unidade de duas faces: conceito e imagem acústica. Com a concepção da dupla face sígnica, elimina a falácia do objeto que é extralinguístico. A união de um significado e um significante, denominações dele também para conceito e imagem acústica, é resultado de uma convenção, estabelecida pela significação. O signo é então uma unidade arbitrária (NASCIMENTO, 2008, p. 272). Nota-se que, para Saussure, há uma estreita ligação entre significante (imagem acústica) e significado (conceito), sendo este último o mesmo que ideia (representação mental), e a imagem acústica o mesmo que uma manifestação pela qual o conceito é transmitido (o signo). Isso torna significante (plano da forma) e significado (plano da substância) interdependentes, constituindo o signo de maneira arbitrária, como uma unidade com bipolaridade (NASCIMENTO, 2008). Essa arbitrariedade é explicada pelo fato de que o signo é estabelecido dentro de um grupo linguístico, e que o seu significado não tem qualquer relação natural com a realidade ou com os sons fonéticos desse signo (NASCIMENTO, 2008). Por exemplo, o conceito de Sol não está ligado nem com o som da sua sequência de letras e nem com a imagem acústica (significante), pois esse mesmo conceito pode ser representado, em outros idiomas, com outros significantes, tais como Sun (inglês), Soleil (francês) ou Sonne (alemão). Nessa perspectiva, é um significante imotivado (arbitrário em relação ao significado), pois pode ser representado conforme as necessidades e compromissos firmados nos diferentes contextos de uso (SILVEIRA, 2005). Contudo, Maimone e Tálamo (2011, on-line) observam que “a arbitrariedade do signo não se aplica a todas as linguagens já que algumas são motivadas, como por exemplo, as linguagens visuais”. Nesse sentido, Nascimento (2008) aponta que Saussure não deixou de reconhecer a existência de certos graus de motivação entre significante e significado. Para a autora, a concepção dicotômica de Saussure propôs dois tipos de 91 arbitrariedade: (1) a absoluta, como, por exemplo, os números dez e nove, que têm relação entre o significante e o significado totalmente arbitrária (imotivada), e (2) a relativa, como, por exemplo, a dezena dezenove, que passa a ter uma arbitrariedade abrandada, uma vez que é a combinação dos números dez e nove que, originalmente, possuem arbitrariedade absoluta. Saussure defende que, com o conhecimento da significação de arbitrariedades absolutas, é possível chegar a outras significações com arbitrariedade relativa, sendo essa uma relação sintagmática (CARVALHO, 2003). Assim, tem-se, por exemplo, o par banana / bananeira, em que banana é um signo imotivado (arbitrário absoluto), e bananeira é sua forma derivada, sendo um signo motivado (arbitrário relativo); assim, há uma relação sintagmática entre banana + o sufixo -eira, provocando a noção de “árvore”. Como consequência dessa associação, poderá ser estabelecida uma relação paradigmática entre bananeira e goiabeira, macieira, laranjeira, entre outros. Ademais, Nascimento (2008) ressalta que, para Saussure, a ligação natural entre o significante e o significado somente acontece com um símbolo e seu significado, tal como o símbolo da justiça, por exemplo, a balança. Segundo a autora, Saussure acredita que um símbolo não pode ser um significante, pois ele nunca é totalmente arbitrário. Assim, no caso do símbolo “balança”, é impossível substituí-lo por outro símbolo (por exemplo, carro ou martelo) para transmitir a mesma ideia pretendida. Na concepção de Saussure, há também os elementos sincrônico e diacrônico, sendo o primeiro relativo aos estudos da língua em determinado momento (descrição sistemática) e, o segundo, sobre as transformações da língua ao longo do tempo (descrição histórica). Nesse contexto, Maimone e Tálamo (2011) apontam que, na elaboração de tesauros, são importantes os estudos sincrônicos, pois eles indicam a estrutura das relações que incluem os agrupamentos (conjunção) e as divisões (disjunção) dos signos contidos em dado domínio. Em complemento, acredita-se ser também importante para a elaboração de tesauros os elementos diacrônicos (históricos), uma vez que é preciso a atualização da terminologia que compõe o instrumento e a indicação histórica (por notas de escopo) dos termos que ficaram obsoletos em algum momento de desenvolvimento da área. Carvalho (2003) aponta que uma das mais importantes críticas ao pensamento saussuriano é quanto à apresentação do signo como uma entidade bifacial, de significado (conceito) e significante (imagem acústica). Como um de seus críticos, Blikstein (1983), em seu livro intitulado “Kaspar Hauser ou a Fabricação da Realidade”, defende a ideia de que a análise do signo também deve levar em consideração o referente, e não apenas os campos do significante e do significado, como é a abordagem de Saussure. Para esse autor, o 92 referente é parte do signo que representa e deixa apreender a realidade extralinguística48. Blikstein (1983, p. 23) aponta que o triângulo de Ogden e Richards, com o qual queriam definir o “significado de significado”, os autores “lançaram a figura do referente, isto é, a coisa extralinguística, que distinguiam, nitidamente, de referência ou significado linguístico”. A partir da tríade de Ogden e Richards, Carvalho (2003) apresenta uma sugestão para a inclusão de um terceiro elemento na teoria de Saussure – a coisa significada –, compondo uma relação triádica, a partir do triângulo semântico de Ogden e Richards, como mostram as Figuras 4 e 5 a seguir: FIGURA 4 – Relação triádica de Saussure Fonte: CARVALHO, 2003, p. 50. FIGURA 5 – Triângulo de Ogden e Richards Fonte: CARVALHO, 2003, p. 50. Na Figura 4, a adaptação da teoria de Saussure considera que a “coisa significada” é o referente do triângulo da Figura 5. No triângulo de Ogden e Richards o ponto focal da composição triádica é o significado (conceito), juntamente com o significante (expressão), o referente (objeto) e as relações entre eles (RIVIER, 1992). Na adequação demonstrada por Carvalho (2003), preserva-se a linha pontilhada da base, o que implica afirmar que não há vínculo direto entre o referente e o símbolo (significante). Na opinião de Carvalho (2003), a falta de vinculação direta entre significante e referente sustenta a teoria de Saussure, de que o signo é constituído por uma relação bipolar e não tripolar. Para a autora, e também para Blikstein (1983), o referente é ignorado e descartado no processo de significação. Outros autores desenvolveram relações triádicas para a composição do signo, com a mesma estrutura de Ogden e Richards, porém, substituindo as denominações atribuídas por Ogden e Richards, como, por exemplo: (1) Pierce, que usa representamen ou signo em vez de significante, interpretante em vez de significado e objeto em vez de referente; (2) Morris, que usa veículo sígnico em vez de significante, interpretante em vez de 48 Esta realidade é tudo aquilo que não pertence ao sistema linguístico ou gramatical, sendo relativo à vivência e experiência dos atores envolvidos em um processo de comunicação (HOUAISS; VILLAR, 2001). 93 significado e designatum em vez de referente; (3) Ullmann, que usa significante e significado de mesma forma, mas coisa em vez de referente (BLIKSTEIN, 1983). Contudo, é preciso admitir que, na composição do signo, o referente (linguístico ou extralinguístico) é um elemento semântico e deve ser considerado na análise do signo. Nessa perspectiva, Blikstein (1983, p. 45) defende a ideia de que a compreensão do mundo se realiza na dimensão percepção-cognição, antes mesmo da aprendizagem da linguagem, pois “a significação é tributária do referente e este, por sua vez, é construído pela dimensão perceptivo-cognitiva”. Nesse sentido, a realidade se transforma em referente, ou seja, através da interpretação (percepção; ponto de vista) dessa realidade é produzido um objeto extralinguístico (o referente de Ogden e Richards). Assim, o referente será, então, incluído na relação triádica, pois a língua “não recorta a realidade propriamente, mas a realidade fabricada”, construída na práxis social (BLIKSTEIN, 1983, p. 47). Corroborando essa posição, contra a objetividade da linguagem que une objeto e signo, Deleuze e Guattari (1997) afirmam que as coisas (ou objetos) do mundo não são representadas pela linguagem, mas, antes, a linguagem produz coisas e é por elas produzida. Dessa forma, não há uma realidade a ser descoberta – a priori –, pois as realidades do mundo podem ser socialmente inventadas e reinventadas. Passando para o campo da Terminologia, o conceito (ou noção) tem função essencial no trabalho terminológico, pois o conteúdo semântico de um termo é abstraído por meio da análise nocional ou análise conceitual (BARROS, 2004). Nessa área, a unidade lexical de uma linguagem pode ser estudada do ponto de vista da sua expressão – o termo (descrito anteriormente, no Subcapítulo 5.4.1) –, ou do seu conteúdo – o conceito –, cujas bases estão discutidas a seguir. De modo geral, Ao proceder com o funcionamento social de uma área especializada do conhecimento, a Terminologia trabalha com o estudo científico dos conceitos e respectivos termos, que constituem um conjunto expressivo e comunicativo, possibilitando a transferência do conhecimento especializado. Neste sentido, os conceitos não existem isoladamente, mas sempre uns em relação aos outros (MAIMONE; TÁLAMO, 2011, on-line). Nota-se que, desde sua origem, a área da Terminologia tem importante papel no processo de comunicação especializada. Essa necessidade teve início com o aumento da criação de termos para designar as novas descobertas e inventos surgidos com o desenvolvimento técnico-científico (MAIMONE; TÁLAMO, 2011). Com o estabelecimento da Terminologia como disciplina, a partir das formulações da TGT de Wüster (ver Subcapítulo 5.2), o conceito é definido como “uma unidade de pensamento constituída por um conjunto de características atribuídas a um objeto ou a uma classe de objetos e que pode se exprimir por um termo ou por um símbolo” (BOUTIN-QUESNEL, 1985, p. 18, citado por BARROS, 2004, p. 106). Wüster (1998) 94 determina o conceito como um elemento do pensamento, que é formado pelas características comuns de um objeto (ou referente). Barros (2006) assinala que Para a TGT, o termo, enquanto signo linguístico, não se compõe de conteúdo e de expressão indissociavelmente ligados. Para essa corrente teórica, o conceito precede a expressão e essas duas facetas são independentes uma da outra. Devido à tônica normalizadora dessa linha teórica, o conceito deve ser estabelecido de antemão e, só então, deve-se procurar a expressão linguística que mais adequadamente designe o conteúdo terminológico em questão (BARROS, 2006, p. 22). Nessa concepção positivista, o foco principal é o conceito, que é determinado pelo domínio, para depois se proceder à sua designação (termo). Ademais, o “conceito é considerado pela TGT como um conjunto de traços característicos relevantes de um objeto e é compreendido como algo universal e imutável” (BARROS, 2006, p. 22). Assim, o conceito, representado pelo seu termo designador, torna-se uma monossignificação ou monorreferencialidade, visando a eliminar toda e qualquer possibilidade de polissemia. A preocupação de Wüster, naquele momento, era obter uma univocidade comunicacional que extinguiria a ambiguidade. Ainda que os avanços teóricos na área critiquem alguns elementos da TGT, a univocidade comunicacional, segundo Cabré (1999), é ainda importante em algumas áreas, sobretudo naquelas que lidam com eventos fatais tais como a Medicina e a Aviação, nas quais esse tipo de comunicação normalizada é essencial para evitar riscos de morte. Contudo, as críticas a essa teoria geraram um aprofundamento dos estudos na área, nos quais as terminologias eram consideradas como unidades linguísticas e, portanto, sujeitas à mesma complexidade. Esses estudos, de natureza linguística, constataram que o modelo wüsteriano não é capaz de atender às necessidades de análise da unidade terminológica enquanto signo linguístico composto, indissociavelmente, de conteúdo e de expressão; menos ainda é adequado à análise das terminologias em uma relação dinâmica com outros elementos do texto e da comunicação especializada (BARROS, 2006, p. 22). Essas limitações trouxeram novas formas de elaboração de terminologias, quando “o conceito passou a ser dimensionado em uma perspectiva do significado, unidade de pensamento maior que congrega também elementos pragmáticos” (BARROS, 2006, p. 22). Com isso, a autora ressalta que a teoria de Wüster adotou a concepção de Saussure, com o signo considerado como uma unidade indissociável entre o significante e o significado. Os avanços na área continuaram, e na década de 1990, houve predominância de estudos de caráter descritivo, levando à proposta da TCT, que é utilizada como fundamento teórico nesta tese. Nessa concepção, o termo é uma entidade poliédrica, ou seja, uma unidade linguística (no sentido que lhe deu Ferdinand de Saussure), é uma unidade de comunicação e uma unidade cognitiva. Cabré formula a Teoria das portas, 95 segundo a qual os termos podem ser vistos de diferentes ângulos e analisados segundo os modelos das ciências linguísticas, cognitivas e da comunicação, que se considerarem adequados à pesquisa em pauta (BARROS, 2006, p. 23). Nota-se uma tendência sócio-comunicativa na TCT, na qual é utilizada uma visão multidimensional e, também, poliédrica49, para apreender o conhecimento de especialidade (CABRÉ, 1999). Nesse sentido, a relação do termo com o conceito não é de “um para um”, pois o conceito se materializa em uma situação comunicativa intencional, em um dado contexto de uso, através de uma relação intersubjetiva realizada entre locutor e o autor, em um determinado tempo (idem). Para Cabré (1999), o conceito é uma unidade de conhecimento que leva em consideração todos esses aspectos, uma vez que mesmo os domínios de especialidade estão sujeitos à variação terminológica e à polissemia, convivendo, muitas vezes, com distintas vertentes teóricas e metodológicas. Para a autora, esses elementos devem ser reconhecidos na terminologia de uma área especializada. Ressalta-se, também, que no campo tradicional da Terminologia trabalha-se com três tipos de conceitos: (a) conceito próprio de um domínio; (b) conceito emprestado; e (c) conceito que ultrapassa o domínio. Por sua vez, a TCT estabelece como princípio que os conceitos, da mesma forma que os termos que os expressam, “não pertencem a um domínio, mas são usados em um domínio com um valor singularmente específico” (CABRÉ, 1999, p. 124). No campo da BCI, há importantes autores que discorrem sobre o tema dos conceitos, dentre os quais podem ser citados, mas não limitados, os nomes de Maria Antonieta R. Piedade, Maria Luiza Almeida Campos, Hagar Espanha Gomes, Nair Yumiko Kobashi e Mário Barité. Não desconsiderando tais contribuições, muitas vezes o que há são explanações acerca de duas teorias que se sobressaem no âmbito dos estudos sobre construção de tesauros: (1) a Teoria da Classificação Facetada, de Ranganathan; e (2) a Teoria do Conceito, de Dahlberg. Dessa forma, decidiu-se por limitar a apresentação na área da BCI aos estudos relativos a essas duas teorias. Na primeira teoria, Ranganathan desenvolve princípios para a elaboração de classificações bibliográficas facetadas, visando à indexação e ordenação física de acervos documentários. Os postulados dessa teoria estão publicados na segunda edição do Prolegomena a Classificação da Biblioteca, de 1957, e desenvolvido na terceira edição, de 1967. Ranganathan ponderava sobre os conceitos como uma unidade do pensamento, um corpo de ideias organizado ou sistematizado, cujas extensão e intensão devem ser coerentes com o domínio de interesse e ajustadas à competência intelectual e ao campo especializado de qualquer indivíduo (RANGANATHAN, 1967, p. 82). 49 No sentido de que mesmo o conhecimento de especialidade é multifacetado, pois convive com distintas correntes e teorias, o que demonstra a complexidade dos domínios. 96 Nessa perspectiva, o conceito é considerado como internalizado no indivíduo. Para Ranganathan, o “conceito é a formação, depositada na memória, como um resultado de associações de percepções – puras ou compostas – realizadas somente dentro da memória” (ARBOIT; GUIMARÃES, 2013, p. 5). Percebe-se que há um caráter individual nessa acepção, que não analisa os contextos social, político e histórico. Sendo assim, o conceito é concebido no plano das ideias50, onde ocorrem diversos procedimentos: (1) processo de definição do assunto; (2) seleção das características que constituem o assunto; (3) seleção de um modelo para o mapeamento da informação sobre os conceitos; (4) agrupamento e divisão destes conceitos conforme suas características comuns e diferentes; (5) organização e o arranjo de grupos e subgrupos (LIMA, 2007, p. 32). Com esses procedimentos, realiza-se uma análise conceitual, durante a qual acontece a representação mental do objeto e, depois, a sua representação na forma de um termo (RANGANATHAN, 1957). Nesse caso, a extensão (mais geral) é o conjunto de elementos que constitui uma ideia, ou seja, uma classe ou grupo (cluster), e a compreensão ou intensão (mais restrita) é a característica que permite a um objeto pertencer àquela ideia, classe ou grupo (cluster). Essa abordagem é denominada analítico-sintética e visa à identificação dos conceitos para a estruturação e ordenação do conhecimento em classes formais, de acordo com as categorias existentes no domínio modelado. Dessa forma, cria-se uma estrutura sistêmica de conceitos, por meio de renques e cadeias e, assim, estabelece- se uma rede de relacionamentos entre eles (CAMPOS, 2001). Essa concepção é convergente com a proposta pela TGT, de Wüster, no sentido em que considera que as unidades conceituais são interligadas e interdependentes. Sobre Ranganathan, Kobashi e Francelin (2011, p. 10) afirmam que a “lógica subjacente à sua teoria indica que o conceito se estabelece em uma sequência de etapas, recortes, enfim, ‘fatias’ que determinam o movimento contínuo e infinito de sua Espiral do Universo do Conhecimento”. Nessa espiral são estabelecidas as relações entre conceitos, por meio das associações de percepções individuais sobre o mundo real. Nesse sentido, Campos e Gomes (2003) apontam que Ranganathan elabora uma série de princípios que visam a permitir que os conceitos de um domínio de saber possam ser estruturados de forma sistêmica, isto é, os conceitos se organizam em renques e cadeias, essas estruturadas em classes abrangentes, que são as facetas, e estas últimas dentro de uma dada categoria fundamental. A reunião de todas as categorias forma um sistema de conceitos de uma dada área de assunto e cada conceito no interior da categoria é também a manifestação dessa categoria (CAMPOS; GOMES, 2003, p. 158). 50 Ranganathan estabeleceu três níveis de análise: (1) plano das ideias: nível das ideias e conceitos; (2) plano verbal: nível da expressão verbal dos conceitos (termos); e (3) plano notacional: nível da fixação dos conceitos em formas abstratas (sinais, letras). 97 Assim, os princípios da teoria de Ranganathan possibilitam criar um conjunto de conceitos que satisfaça a uma classe, com base em um único critério de divisão. Ademais, o conjunto de todas as classes, criadas para representar um domínio, pode ser organizado a partir de cinco categorias fundamentais (Personalidade, Matéria, Energia, Espaço e Tempo), expressas pelo acrônimo PMEST. Essa forma de pensar e organizar um domínio, Ranganathan (1967) relacionou à “Árvore Baniana” (Banyan tree, uma figueira indiana), que se alastra por uma grande área, além de enviar galhos para o solo. Utilizando essa metáfora, Ranganathan (1957) evidencia que na espiral há outros tipos de ligações entre conceitos que não somente as relações hierárquicas, tornando possível representar realidades complexas, em um sentido multidirecional e multidimensional. Nessa perspectiva, o conhecimento é representado, simbolicamente, como um organismo vivo, em constante desenvolvimento, quando ocorrem ramificações e transformações através do tempo. Já a segunda teoria, criada por Dahlberg (1978a, 1978b, 2006), foi desenvolvida no âmbito da construção de tesauros e dos estudos sobre a disciplina Organização do Conhecimento. A autora estabeleceu diretrizes teóricas a partir da TGT de Wüster, criando um “modelo analítico idealizado para elucidar a natureza e a estrutura dos conceitos” (DAHLBERG, 1978b, p. 4). Nesse percurso, Dahlberg (1978b) determinou a existência de três tipos de natureza dos conceitos: 1) gerais, que apontam para o conjunto de itens de determinado tipo (ex.: todos os homens da sala de aula); 2) especiais, que indicam alguns itens de determinado tipo (ex.: alguns homens da sala de aula); e 3) individuais, que apontam para um único item (ex.: um determinado homem da sala de aula). Além disso, segundo a autora, a estrutura de um conceito pode ser evidenciada a partir de três tipos de características: 1) essenciais, encontradas em todos os referentes relacionados a um conceito; 2) acidentais, encontrados em alguns dos referentes relacionados a um conceito; e 3) individualizantes, encontradas em um único referente. Essas características podem ser apresentadas na forma hierárquica, das mais gerais às mais específicas, e a característica mais geral poderá ser considerada uma categoria. Segundo Dahlberg, a categoria é o conceito que possui mais amplitude em sua extensão. O modelo de Dahlberg (1978a), usado para a formação de um conceito, é advindo dos princípios analíticos de Aristóteles e dos princípios analítico-sintéticos da teoria de Ranganathan (DAHLBERG, 1978b, p. 4). Nesse sentido, a fase analítica consiste em fatorar o objeto em suas partes, identificando de maneira clara seus elementos individuais, isto é, uma hierarquia das proposições verdadeiras sobre o conceito, que culminam em uma categoria genérica. Já a fase sintética consiste na integração dos elementos sistêmicos, dando origem ao termo, que representa o conceito. Nessa perspectiva, Dahlberg define conceito é uma unidade do conhecimento, compreendendo afirmações verdadeiras sobre um dado item de referência, representado numa forma verbal [sendo que:] afirmação verdadeira é a componente de um conceito 98 que expressa um atributo do seu item de referência; item de referência é o componente de um conceito para o qual sua afirmação verdadeira e sua forma verbal estão diretamente relacionadas, sendo assim seu ‘referente’; forma verbal (termo/nome) de um conceito é o componente que resume convenientemente ou sintetiza e representa um conceito com o propósito de designar um conceito em comunicação (DAHLBERG, 1978b, p. 147, grifos da autora citada). Dessa maneira, o conceito é constituído por um conjunto de enunciados verdadeiros sobre um objeto e representado por um termo, composto pela tríade: (1) referente (objeto a ser conceitualizado); (2) características (todos os enunciados verdadeiros a respeito do referente); (3) forma verbal (termo), conforme Figura 6. FIGURA 6 – Triângulo do conceito Fonte: DAHLBERG, 1978b, p. 149. Observa-se que o conceito está ao centro do triângulo, porque é composto pela tríade (referente+características+forma verbal), formando um todo. Com uma linha de pensamento similar, está o triângulo elaborado por Fugmann (1993), no desenvolvimento de sua Teoria de Indexação, para a qual também usa uma tríade, porém, com alguns vértices diferentes (referente+conceito+expressão). Diferentemente de Dahlberg, Fugmann não considera o conceito como composto pela tríade, mas um dos vértices de seu triângulo, que substitui o vértice de “características” de Dahlberg. Dessa forma, para Fugmann (1993), o vértice “conceito” é constituído pelo resumo dos enunciados essenciais sobre o referente, enquanto, para Dahlberg (1978a), é o vértice “características” que representa a predicação de enunciados sobre o “referente”, sendo cada um deles uma característica do objeto em questão. Tanto para Fugmann (o vértice “expressão”) quanto para Dahlberg (o vértice “forma verbal”), esse conjunto de predicados designa uma representação, na forma de um termo (sejam letras, fonemas51 ou figuras), que denota o sentido do referente em dado contexto. A partir desse processo, chega-se a objetos individuais, pois toda vez que o objeto é pensado como único, distinto dos demais, constituindo uma unidade inconfundível (coisas, fenômenos, processos, 51 É o som da fala, a menor unidade sonora de uma língua, e tem a função de estabelecer diferença de significado entre diferentes palavras. 99 acontecimentos, atributos, etc.) pode-se falar de objetos individuais. Pode- se dizer que o que caracteriza os objetos individuais é a presença das formas do tempo e espaço. Os objetos individuais estão aqui e agora. Ex.: esta casa, esta mesa, este automóvel, esta partida de futebol, etc. (DAHLBERG, 1978a, p. 101). Pela citação, é possível observar uma forte natureza analítica e lógico-positivista na teoria de Dahlberg, que estabelece a univocidade do significado de um termo, assim como o fez Wüster, na TGT. Ressalta-se que Dahlberg modelava conceitos técnico- científicos, considerados os únicos plenamente descritíveis ou definíveis (DAHLBERG, 1978a). É preciso lembrar que à época do desenvolvimento da sua teoria, havia uma proliferação de normas e de terminologias, principalmente motivadas pelas facilidades do tratamento de dados usando a informática. Porém, no contexto informático da época, é bem possível que as tecnologias ainda exigissem dos sistemas de informação essa natureza positivista e prescritiva. Contudo, após meados da década de 2000, no campo da BCI os fundamentos lógico-positivistas dessa teoria começaram a ser analisados de forma mais crítica, assunto que será debatido no próximo Subcapítulo. 5.4.2.2.1 Discussões relativas à Teoria do Conceito de Dahlberg Após o desenvolvimento da teoria de Dahlberg, em 1978a, Hjorland (2007) afirma que pouco se tem publicado acerca desse tema no periódico Knowledge Organization: International Journal, ou em qualquer outro periódico da área BCI. Para o autor, a Teoria do Conceito compreende um grande campo nas ciências cognitivas, filosofia da mente, linguística, sociologia e também áreas aplicadas tais como ciência da computação (com Inteligência Artificial), terminologia e tradução. Dentro da organização do conhecimento, a Teoria do Conceito não pode ignorar tais contribuições interdisciplinares para suas bases (HJORLAND, 2007, p. 1). Reconhecendo o trabalho sério de Dahlberg, que incluiu visões filosóficas mais amplas, tais como as de Aristóteles e Frege (ver Subcapítulo 5.4.2.1), Hjorland aponta que existem diferentes teorias do conceito e que na BCI, não houve, por mais de 20 anos, uma reflexão ou mesmo uma atualização da teoria criada por Dahlberg. O autor sugere que uma Teoria do Conceito deve integrar distintas concepções teóricas e filosóficas, visando a tornar-se consistente. Pensar criticamente sobre essas questões é importante para a área BCI e, já em 1992, Dahlberg apontava que a Teoria do Conceito é parte integrante da disciplina Organização do Conhecimento, podendo também contar, neste caso, com subsídios intelectuais de sete campos filosóficos: Lógica, Teoria da Ciência, Epistemologia, Ontologia, Fenomenologia, Aletiologia (doutrina da verdade) e Metafísica. Argumentando sobre isso, e dando apoio às críticas de Hjorland, Kobashi e Francelin (2011, p. 15) 100 assinalam que “a força das teorias é medida pela sua evolução no tempo histórico e grau de influência nos campos de conhecimento”. E acrescentam, também sem desmerecer a influência da teoria de Dahlberg, sobretudo no campo da Organização do Conhecimento, que outras discussões, como aquelas desenvolvidas no campo da Terminologia e das Linguagens Documentárias introduziram discussões sobre os limites dos cânones normativos (KOBASHI; FRANCELIN, 2011, p. 15). Os pesquisadores apontam que os avanços nesses campos trouxeram tanto questões operacionais quanto epistemológicas que puseram os princípios racionalistas e normativos em contestação. Assim, “se pensarmos em características únicas e enunciados verdadeiros como elementos de uma unidade de conhecimento, ou seja, de um conceito, estamos de acordo com a ideia de paradigma de domínio na concepção canônica de Thomas Kuhn” (KOBASHI; FRANCELIN, 2011, p. 15). Isto é, para Kuhn, um paradigma só perde a força pela revolução e ruptura, com uma anomalia que gera uma crise de confiança no mesmo, quando há a necessidade de troca de paradigma. Nessa forma de pensamento, há a pressuposição de que um paradigma impera absoluto até que seja substituído. Contudo, essa acepção não é aceita sem críticas, como argumenta Rodrigues (2010), pois, com o reconhecimento das áreas humanas e sociais como ciências e as descobertas da relatividade das verdades construídas pela física mecânica, o método científico positivista começa a ser questionado como o único instrumento capaz de validar o conhecimento sobre os homens e o universo. Desse modo, surge a possibilidade de uma nova matriz para construir a ciência, que ultrapasse o pensamento epistemológico positivista, apresentando alternativas para pensar e construir o conhecimento de uma forma diferente (RODRIGUES, 2010, on-line). Essa forma diferente pressupõe distintos paradigmas convivendo em uma mesma especialidade, constituindo-se como “um novo contexto epistemológico” (KOBASHI; FRANCELIN, 2011, p. 15) e uma nova realidade que Santos (2008) denomina de “paradigma emergente”, uma vez que avanços recentes da física e da biologia põem em causa a distinção entre o orgânico e o inorgânico, entre seres vivos e matéria inerte e mesmo entre o humano e o não humano. [...] É hoje reconhecido que a excessiva parcelização e disciplinarização do saber científico faz do cientista um ignorante especializado e que isso acarreta efeitos negativos. [...] No paradigma emergente o conhecimento é total, tem como horizonte a totalidade universal [...] Mas sendo total, é também local. Constitui-se em redor de temas que em dado momento são adotados por grupos sociais concretos [...] [pois] a fragmentação pós-moderna não é disciplinar e sim temática. [...] [E] a tolerância discursiva é o outro lado da pluralidade metodológica. Na fase de transição em que nos encontramos são já visíveis fortes sinais deste processo de fusão de estilos, de interpenetrações entre cânones de escrita (SANTOS, 2008, p. 61-79). Nota-se, assim, certo grau de relatividade das verdades construídas, mencionado por Rodrigues (2010), havendo uma tolerância discursiva e também 101 metodológica, em que distintos paradigmas coexistem e disputam espaços, e serão adotados ou não com base em escolhas que dependem dos temas tratados e dos objetivos pretendidos. Nesse sentido, Hjorland (2009) sugere que essa concepção também seja aplicada em relação às teorias do conceito, sendo a determinação do conceito de conceito um reflexo dos ideais metodológicos aplicados, ou seja, da epistemologia adotada, seja do empirismo, racionalismo, historicismo ou pragmatismo. O autor também acrescenta que a “literatura sobre conceitos é enorme e confusa, estando espalhada ao longo de muitas disciplinas e conectada a profundos problemas teóricos e filosóficos” (HJORLAND, 2008a, on-line). Na busca de bibliografia sobre o tema, esse fato ficou evidenciado e, dentro dessa perspectiva, elaborou-se uma síntese sobre o conceito de conceito, com o objetivo de facilitar o entendimento de tudo que foi tratado neste Subcapítulo. Ressalta-se que se trata de uma análise inicial, como um primeiro esforço de reflexão sobre o assunto. A sequência de apresentação acompanha a mesma ordem utilizada na exposição das ideias dos autores e, em seguida, são exibidas as visões de algumas acepções epistemológicas, a saber: Conceitualismo, Empirismo, Historicismo, Nominalismo, Pragmatismo, Racionalismo e Realismo. QUADRO 1 – Síntese sobre o conceito de conceito, a partir de estudos filosóficos, epistemológicos, linguísticos, terminológicos e da BCI ESTUDOS / EPISTEMOLOGIAS TRATA O CONCEITO DESCRIÇÃO DO CONCEITO ESTUDOS DA FILOSOFIA CLÁSSICA Sócrates Essência Formação de universais reais, a partir de ideias abstratas e concretas, para obter o caráter genérico comum à multiplicidade de exemplares. Platão Essência Formação de universais (formas) reais, que estão fora da mente e fora dos objetos, obtidos pela razão. Aristóteles Substância Formação de universais que não existem por si, mas encontram-se nas coisas e são percebidas pelo intelecto (forma e matéria), compostos por conteúdos imutáveis. Porfírio Elemento individual Formação do objeto conhecido feita pela mente e individualmente; mas não há definição sobre se um objeto é criado na mente ou se é real. ESTUDOS DA IDADE MÉDIA Abelardo Função Formação do objeto a partir de sua denominação, com duas funções: uma significativa (mental) e outra referencial. 102 ESTUDOS / EPISTEMOLOGIAS TRATA O CONCEITO DESCRIÇÃO DO CONCEITO ESTUDOS DA IDADE MODERNA Descartes Essência (cogito) Formação a partir de uma interpretação epistemológica. Kant Função Formação pela ordenação de ideias, obtendo uma representação universal ou refletida, a partir de uma construção lógica, sendo abstrato em relação ao seu uso, e cresce na escala de concretude de acordo com a quantidade de características enunciadas a seu respeito. Hegel Processo Formação iniciada na mente, passando pelo objetivo, com abstrações realizadas pelo sujeito, atingindo uma ideia manifesta em um domínio específico. ESTUDOS DO SÉCULO XIX Frege Função Formação de conteúdo mental, de categorias de entidades mutuamente excludentes e exaustivas, com caráter operacional, a partir de abstrações intelectuais. ESTUDOS DO SÉCULO XX Bachelard Processo de construção Formação pela razão, construído no processo de conhecer. Wittgenstein Função/Regra Formação com base nos jogos de linguagem, em que o sentido só tem sentido se incorporado pelo sujeito em suas interações com o contexto de uso, a partir de regras que norteiam a composição de proposições sobre a sua função ou papel na atividade, nesse dado contexto. Bakhtin Função Formação do enunciado a partir de um processo interacional social, que sofre influência do contexto, da ideologia dominante e da luta de classes. Vygotsky Função Formação a partir da socialização dos indivíduos, com função comunicativa mediadora. Kuhn Regra Formação por meio de um processo abdutivo, com base no que é conhecido sobre a realidade, chegando-se a uma verdade provável, como um construto social que gera um comportamento conceitual. Granger Função científica Formação iniciada na sintaxe e complementada pela semântica, combinando teoria e prática. Rosch Processo analítico Formação por meio de um conjunto de características e atributos que serão os traços nucleares de um exemplar escolhido como representativo de uma classe, a partir de abstrações, independentemente dos contextos de uso. 103 ESTUDOS / EPISTEMOLOGIAS TRATA O CONCEITO DESCRIÇÃO DO CONCEITO Medin Elemento constituinte Formulação a partir de um conjunto de propriedades (traços ou atributos) que mantém relação com outros conceitos em determinado contexto (denominado por ele de teorias), sendo, o exemplar, parte constituinte desse contexto. LINGUÍSTICA E TERMINOLOGIA Saussure Função Formação do significado (plano da forma), por meio de uma representação mental ou ideia, em um processo que une o significado ao significante, de maneira interdependente, compondo o signo de forma arbitrária, como resultado de uma convenção, em razão da função que desempenha. Wüster Unidade do pensamento Formação a partir de um conjunto de atributos do objeto, que precede a expressão do signo linguístico; indissoci. Cabré Unidade terminológica Formação a partir da materialização de um conjunto de características, com origem em uma situação comunicativa intensional, em dado contexto e tempo. BIBLIOTECONOMIA E CIÊNCIA DA INFORMAÇÃO Dahlberg Unidade de conhecimento Formação unívoca de um conjunto de enunciados (características ou atributos) verdadeiros, a partir de representações individuais, sem considerar influências sociais nesse processo. Ranganathan Unidade de pensamento Formação individual, a partir de associações de percepções na mente, usando raciocínio lógico. ACEPÇÕES EPISTEMOLÓGICAS Conceitualismo Representação mental Formação de universais na mente, sendo derivado e assemelhado às coisas reais. Empirismo Elemento da experiência Formação a partir do agrupamento de objetos semelhantes, com a observação objetiva da realidade e evitando definir classes por propriedades teóricas. Historicismo Ente genético Formação a partir de elementos genealógicos e explicitando as suas relações com teorias e discursos. Nominalismo Etiquetas ou rótulos Formação de universais a partir da designação de etiquetas ou rótulos para representar objetos ou eventos particulares, nominando-os arbitrariamente. Pragmatismo Função Formação a partir de elementos e de classes considerados mais adequados a um determinado propósito, aplicação e contexto de uso. Racionalismo Essência/ Substância Formação de universais e primitivos, a partir dos traços ou dados essenciais do objeto, a partir de conhecimento anterior, estabelecendo relações de semelhança com outros objetos. 104 ESTUDOS / EPISTEMOLOGIAS TRATA O CONCEITO DESCRIÇÃO DO CONCEITO Realismo Ente concreto Formação de universais estáveis, usando a razão para chegar à verdade real, que existe a priori, fora da mente e do objeto. Fonte: elaborado pela autora desta tese. Pelo exposto no Quadro 1, observa-se que o conceito possui distintas acepções, algumas convergentes e outras conflitantes. Decerto, nas teorias filosóficas clássicas há uma congruência em relação à existência de conceitos universais, com o pensamento de que o significado (conceito) dos objetos é dado de forma arbitrária, algumas vezes por convenções sociais e, outras vezes, como consequência da determinação da essência desses objetos. Já nos séculos XIX e XX, período em que a Linguística se estabeleceu como Ciência, devido aos estudos de Saussure, percebe-se que as teorias enfocam a matematização lógica. A partir disso, as teorias ficaram entre o racionalismo e o empirismo, e também é possível notar que houve uma ruptura entre língua (social) e fala (individual), tornando-se, a primeira, objeto de estudo da Linguística, sobretudo com o paradigma estruturalista, pelo menos até a primeira metade do século XX. Em seguida, nas acepções após a segunda metade do século XX, faz-se presente o desenvolvimento de teorias que incorporam o sujeito e suas relações com o ambiente discursivo na formação dos conceitos, como em Wittgenstein e Bakhtin, rompendo com o pensamento da existência dos universais e tratando os enunciados como interdependentes da função que desempenham nos contextos de uso. Após essas análises, volta-se para o objetivo específico desta tese, que é o de entender o conceito enquanto elemento importante na construção de tesauros, reflexão que motivou o desenvolvimento de uma proposta de conceito de conceito, que está apresentada no próximo Subcapítulo. 5.4.2.2.2 Uma proposta de definição e representação para “conceito” No desenvolvimento desta tese, empregam-se como princípios para o conceito de conceito, a teoria de Cabré, a TCT, assim como as concepções pragmáticas de conceito, nas quais o enunciado de um conceito é tratado em virtude da função que tal enunciado desempenha em dado contexto de uso, sobretudo a partir de Wittgenstein e Bakhtin. Nesse sentido, Hjorland (2008a) afirma que a decisão sobre quais princípios usar deve ser pautada no conhecimento sobre Que tipo de trabalho o conceito tem que fazer por nós, e de que maneira as diferentes formas de compreender este conceito podem facilitar ou contrariar o que nós queremos realizar. Quando estamos trabalhando com ferramentas terminológicas e semânticas, tais como dicionários, sistemas de 105 classificação e tesauros, o conceito de conceito parece inevitável e os progressos na compreensão de conceitos podem influenciar a própria maneira de trabalho na Terminologia, na Biblioteconomia e Ciência da Informação e em muitas áreas afins (HJORLAND, 2008a, on-line). Observa-se, assim, que, como ponto de partida, é preciso definir o objetivo a que se pretende chegar na criação de um instrumento terminológico, tal como um tesauro. Além disso, é preciso conhecer as características do domínio modelado e as necessidades dos potenciais usuários. Nessa perspectiva, no âmbito da construção de tesauros, e com base na TCT, na Semântica, Pragmática e nas teorias do conceito que consideram o conceito em razão de sua função no contexto de uso, a autora desta tese propõe um conceito para o termo “conceito”: Conceito é composto pela tríade referente+significado+significante. Sua formação se inicia como uma concepção intelectual e mental sobre um referente, que é um objeto (entidade concreta ou abstrata) em dado domínio de uso. As propriedades, características e atributos desse referente, assim como os seus relacionamentos com outros referentes, estão externalizados e traduzidos em seu significado. Esse significado é revelado por meio de uma definição, elaborada com a função de delimitar e cristalizar o ato intencional do significado do referente. Essa definição registra tudo aquilo que é conhecido sobre o referente e que é mandatório para atender a um propósito determinado, dentro de um contexto específico de uso. O conceito, assim constituído, será representado por um significante, que é uma expressão verbal ou simbólica, que será utilizado como elemento comunicativo de mediação, sem que, necessariamente, haja um vínculo indissociável entre significante e referente. Para a representação do desenvolvimento dessa proposta de conceito de conceito, retoma-se a ideia dos dois triângulos já apresentados, de Ogden e Richards (Figura 5) e Dahlberg (Figura 6). Nessas duas propostas, o conceito é determinado a partir de uma relação triádica. A sugestão que se faz aqui tem por base esse princípio, conforme Figura 7. 106 FIGURA 7 – Proposta de conceito de conceito Fonte: elaborado pela autora desta tese. Observando a Figura 7, tem-se a tríade que é proposta como representação do conceito de conceito. Tal como no triângulo de Dahlberg (Figura 6), o conceito ocupa o centro da tríade, pois se entende que ele é composto pelos três elementos: referente + significado + significante. Também de maneira semelhante à proposta de Dahlberg, o referente é um objeto em dado domínio, uma vez que, no modelo proposto pela autora desta tese, ele tem estreita relação com o contexto de uso, também denominado de “jogos de linguagem” (Wittgenstein) e de “teorias” (Medin), pois é onde, segundo o pensamento de Bakhtin, o processo interacional acontece, sofrendo influências da ideologia dominante e das lutas de classe (pela estrutura sociopolítica e de trabalho). Diferentemente do que propõe Dahlberg, recomenda-se que no lugar da predicação das características (enunciados verdadeiros) sobre o referente esteja a definição, que materializa o sentido adotado para o referente em um dado domínio e explicita as relações que ele mantém com outros referentes, naquele contexto de uso e de acordo com uma finalidade e propósitos específicos de construção do instrumento terminológico. Nesse caso, entende-se que não é necessário predicar todos os enunciados verdadeiros sobre o referente, ou os essenciais, como defende Fugmann (1993), mas aqueles que são mandatórios para atender ao objetivo proposto pela modelagem. Da mesma forma como acontece nos triângulos de Ogden e Richards (Figura 5), de Dahlberg (Figura 6) e de Fugmann (1993), no significante está a expressão verbal (termo) ou qualquer outro signo selecionado como elemento comunicativo do conceito. Contudo, rompe-se com a relação direta entre referente e significante do triângulo de Dahlberg (Figura 6) e de Fugmann (1993), e adota-se a linha pontilhada da base do triângulo de Ogden e Richards (Figura 5). Isso implica que o referente e o significante não são indissociáveis, pois o vértice da expressão verbal ou simbólica pode estar representando outros conceitos, no mesmo domínio ou em domínios diferentes. 107 Assim, a linha pontilhada entre referente e significante deixa explícitas as questões relativas à existência de ambiguidade e polissemia, seja na língua geral ou na linguagem de especialidade, conforme descrito no Subcapítulo 5.5. A ambiguidade acarreta a imprecisão do sentido utilizado, e a polissemia, que é um tipo de ambiguidade, em especial quando se trata de homonímias, cria problemas quando um mesmo signo pode expressar significados diferentes dentro de um mesmo campo semântico. Acredita-se que esses dois fenômenos não podem ser ignorados durante a construção de instrumentos terminológicos, devendo estar representados na modelagem do domínio. As dificuldades que podem ser encontradas durante o mapeamento da terminologia de um dado domínio ou de domínios diversos podem ser exemplificadas pela situação hipotética: a expressão verbal “mistura” foi mapeada nos domínios da Agricultura e da Química: Expressão verbal: Mistura Contexto: Agricultura Definição 1a: composto de resíduos de dejeto animal usado como adubo e formado a partir da técnica de compostagem. Sinônimo: composição; composto. Definição 2a: cruzamento de raças diferentes de animais, gerando a miscigenação. Sinônimo: cruzamento; hibridação. Contexto: Química Definição 1b: composto de diferentes elementos químicos para formar uma nova combinação. Sinônimo: solução complexa; composição; fusão. Pela apresentação do mapeamento, pode-se perceber que a mesma expressão “mistura” representa conceitos nos dois domínios mapeados (Agricultura e Química), o que representa um problema de polissemia entre distintos domínios. Além disso, dentro do mesmo domínio, da Agricultura, a expressão “mistura” está representando dois conceitos diferentes, conforme pode ser observado nas definições 1a e 1b, o que é um problema de polissemia intradomínio. Segundo os princípios da proposta da autora desta tese, graficamente, o exemplo é apresentado conforme Figura 8. 108 FIGURA 8 – Representação de polissemia Fonte: elaborado pela autora desta tese. Analisando a Figura 8, nota-se que a polissemia do domínio está representada, uma vez que o significante “mistura” está ligado a dois conceitos (significados) na área da Agricultura (Def1a e Def2a) e a um conceito (significado) no campo da Química (Def1b). O controle da polissemia, nesta proposta, é realizado a partir das definições e da posição que o significante ocupa nas estruturas hierárquicas (de cada domínio). Se houver o uso concomitante, em um mesmo sistema, das terminologias dos dois domínios, acredita-se que o controle da polissemia irá facilitar a interoperabilidade entre os distintos instrumentos. Outro fenômeno que pode ser observado no exemplo hipotético da expressão verbal “mistura” refere-se à sinonímia, pois todos os três conceitos estão ligados a pelo menos duas expressões verbais (Def1a: composição; composto / Def2a: cruzamento; hibridação / Def1b: solução complexa; composição; fusão). Dessa forma, usando apenas a sinonímia do conceito de “mistura” para a área da Química, na proposta da autora desta tese recomenda-se que a representação da sinonímia seja feita conforme Figura 9. 109 FIGURA 9 – Representação de sinonímia Fonte: elaborado pela autora desta tese. Na Figura 9 é possível notar que a expressão verbal “mistura” (A), que representa o conceito no domínio da Química (conforme Def1b), está em relação de sinonímia com os termos (B, C, D). Observa-se que a sinonímia está demonstrada através do instrumento Anel de Sinônimos, que é um tipo de sistema de organização do conhecimento (SOC) utilizado para representar termos em equivalência semântica em um dado domínio. Dessa forma, a Figura 9 sintetiza a representação da proposta de conceito de conceito, apresentando-o como composto pela tríade “referente+significado+significante”, assim como designando os sinônimos do significante através do Anel de Sinônimos, sempre que necessário. Na representação do conceito de um referente, a definição de seus atributos é fundamental, pois ela delimitará o seu significado e mapeará as suas relações semânticas em dado contexto de uso. Dada a sua importância, o próximo Subcapítulo apresenta características sobre a definição e os fundamentos para a sua elaboração, apontando aspectos relacionados à sua função nas áreas da BCI e Terminologia. 5.4.3 A definição Etimologicamente, o termo “definição” tem origem no latim definitio (determinação de limites), que corresponde ao termo grego horismos, proveniente de horizo (delimitar; explicar). De modo geral, definir é a atividade de explicar, a um público qualquer, 110 o significado (definiendum) de uma palavra, termo ou expressão (os definiens), sendo a definição um produto dessa atividade. Nota-se que, assim como o conceito, também o termo “definição” é polissêmico, conforme pode ser observado no Quadro 2. QUADRO 2 – Polissemia do termo “definição” OBJETOS DE DEFINIÇÃO CONCEITOS definitio Ato de definir ou processo de definição de um conceito. definiendum Conceito em processo de definição. definiens Conjunto de características que definem o conceito. definitum – conceptus Produto do ato de definir ou conceito definido. Fonte: PAGOTTI, 2006, p. 62. Pelo Quadro 2, observa-se uma distinção entre “o ato mental de definir (definitio) e a expressão verbal do produto desse ato [definitum]” (PAGOTTI, 2006, p. 62), que são processos interdependentes, porém, conceitualmente separados. Portanto, no campo da Terminologia percebe-se a ocorrência dessa polissemia. Analisando o que foi estudado e descrito no Subcapítulo 5.4.2.1, entende-se que as diversas teorias da definição estão atreladas às concepções de conceito, razão pela qual não se justifica repeti-las neste Subcapítulo. Como síntese, ficou evidenciado que, na filosofia clássica, a definição é um enunciado que exprime a essência de um objeto (atributos; propriedades), sendo composta do gênero (próximo) e das diferenças (específicas). Esses elementos foram, mais tarde, retomados por Kant. Assim, do ponto de vista lógico, definir é determinar a “compreensão ou intensão” que caracteriza um conceito. Já os nominalistas acreditam que a definição de um termo tem ligação com as convenções nos usos das palavras, e não com a essência dos objetos. Depois, com o pensamento voltado para a formalização semântica das definições, voltou-se ao essencialismo, crendo que é preciso explicitar a essência (propriedades) dos objetos para considerá-los pertencentes aos mundos possíveis. E, finalmente, percebe-se uma estreita relação entre a noção de conceito e de significado, vinculando-o com o próprio objeto. Com isso, a definição representa a função do conceito em um contexto de uso, demonstrando uma guinada filosófica para o pragmatismo. Dessa maneira, o que motiva a opção por um tipo de definição – se são objetos, nomes ou conceitos – é dependente da concepção teórica adotada, uma vez que, de certa maneira, a definição será sempre arbitrária. No campo de estudos da BCI, Dahlberg (1978b) foi uma das pioneiras em creditar importância ao estabelecimento da definição de um conceito para delimitar o significado desse conceito em dado domínio. Para a autora, as definições são indispensáveis na construção de um tesauro, pois facilitam a estruturação do conhecimento de um domínio. Dahlberg acrescenta que somente com definições apropriadas há condição 111 para reconhecer conceitos idênticos, representados por termos diferentes, sendo necessário que os distintos atores envolvidos encontrem um consenso sobre qual termo utilizar (DAHLBERG, 1992). Encontrar consenso em qualquer especialidade é tarefa difícil, e a necessidade dele na escolha do termo para representar o conceito produz indícios da concepção de Dahlberg quanto à univocidade entre conceito e termo, abordagem que não contempla a polissemia existente em qualquer linguagem. Em uma abordagem analítica, que tem origem em Aristóteles, Dahlberg (1978a, 1978b) assinala as características de uma definição: (a) precisa fornecer a essência daquilo que está sendo definido; (b) não deve ser circular; (c) não deve ser negativa quando ela pode ser positiva; (d) não deve ser expressa em linguagem figurativa ou obscura. Desse conjunto, observa-se que somente a primeira característica sofreu alterações desde os preceitos de Aristóteles. Sobre essa questão, Barros (2004) apresenta alguns parâmetros que são importantes na elaboração de uma definição terminológica: (a) ser clara, não circular e, preferencialmente, direta e positiva, evitando explicações desnecessárias; (b) não usar linguagem figurativa; (c) ajustar-se à coisa definida, nem específica demais, nem generalista demais, enumerando todos os elementos de que o todo é constituído; (d) conter a divisão da espécie, indicando o que é e do que é composto, seja físico (quantitativo, essencial, potencial ou acidental), lógico (metafísico, distinguido pela razão) ou moral (conceito coletivo: nação); (e) apresentar a diferença específica (o que o diferencia dentro do gênero ou da parte), incluindo causa, efeito, origem, etc., quando for o caso; (f) ser irredutível, mas fazer a concessão de mencionar elementos que facilitam o seu entendimento; (g) respeitar o mesmo princípio definitório para termos opostos, sempre que possível. Esses parâmetros apontados orientam a sistematização das definições, auxiliando a sua composição, de forma a obter uma definição crível e inteligível. Acrescentando informações, Dahlberg (1992) salienta que, na definição, um conceito deve ser descrito de acordo com a sua intensão e extensão, de tal forma que possam ser inteligíveis também pelo computador. A intensão estabelece a essência do objeto na definição (definição coativa), a sua particularidade, como, por exemplo, o gênero próximo e a diferença específica, enquanto a extensão (definição denotativa) determina uma classe que comporta um conjunto de objetos que são membros desse agrupamento específico. Nessa perspectiva, Campos (2001) assinala que a definição é um recurso que auxilia a minimizar as dúvidas sobre a função do termo, estabelecendo os limites da intensão, a fixação do significado e o posicionamento do conceito no sistema de conceitos. Por sua vez, Lara (2004) aponta que a linguística documentária recorre à Terminologia buscando bases para a estruturação dos campos lógico-semânticos dos tesauros. Assim, a 112 Linguística Documentária constitui um campo de estudos que se propõe a observar os problemas que caracterizam a linguagem documentária como uma forma específica de linguagem inscrita no universo da linguagem geral, [...] [e esse] termo [...] [foi] originalmente proposto por García Gutiérrez [...] a partir do pressuposto de que os problemas relacionados à informação são problemas de linguagem (LARA; TÁLAMO, 2007, on-line). Para elaborar a sua proposta, García Gutiérrez (1998) recorre a fundamentos da Linguística Aplicada (com origem em Gardin), da Semântica, da Gramática aplicada à gestão da informação, da Análise do Discurso, da Análise do Conteúdo e das Ciências Cognitivas. Dentre os fundamentos da Terminologia, Lara (2004) afirma que um “dos instrumentos fundamentais para a estruturação dos campos lógico-semânticos dos tesauros é a definição, que permite, dentre as inúmeras possibilidades de organização, a determinação do campo de interpretação do termo e sua inserção em um campo temático” (LARA, 2004, p. 91). Assim, é nos fundamentos da Terminologia que a BCI busca respaldo para a elaboração de definições. No campo da Terminologia, Desmet (2002, p. 171) afirma que “em primeira instância, em todos os trabalhos terminológicos e terminográficos, a análise do sentido em terminologia começa pela definição dos termos”, percurso de análise que pode ser realizado a partir de diferentes orientações. Seja qual for a acepção adotada, Finatto (2002, p. 74) considera que é o “enunciado que define uma noção, processo ou objeto [pois] é um elemento-chave na constituição e na veiculação do conhecimento [sendo a definição responsável por expressar] um segmento de relações de significação de uma determinada área do saber”. Nota-se, assim, que as definições têm um papel comunicacional, importante no desenvolvimento das ciências. Dessa maneira, as definições identificam elementos para a compreensão de fenômenos em diversificados contextos de uso, pois são um tipo de enunciado-texto que proclama uma porção de um conhecimento especializado, por meio de uma “representação conceitual particular, vinculada a um saber técnico, científico ou tecnológico” (FINATTO, 2002, p. 74). Na origem da Terminologia como disciplina, Isquerdo e Alves (2007) afirmam que Wüster queria alcançar a univocidade da comunicação, visando a extinguir a polissemia nas áreas de especialidades, princípio que norteou a Teoria do Conceito de Dahlberg, na BCI. Nessa perspectiva, a definição do termo é elaborada para transmitir a informação científica de maneira correta e eficiente, utilizando uma abordagem normativa da terminologia, usando definições intensional, extensional e partitiva (composição do objeto), unindo termo e conceito de forma unívoca. Com essa acepção, entende-se que a definição “não é realizada como um texto, e sim como um espelho do definiendum” (KAMIKAWACHI, 2010, p. 20). No final do século XX, esse preceito já não se aplicava a todas as situações e, segundo Desmet (2002, p. 182), novos estudos desenvolveram uma abordagem na qual “a definição terminológica é [considerada] um artefato de especialistas do léxico – geral para 113 uns, especializadas para outros”. Dessa forma, a autora afirma que toda definição é um texto e nenhum signo linguístico pode ser definido fora de seus contextos de uso ou de suas aplicações específicas. As investigações teóricas e aplicadas da terminologia avançaram apoiadas e influenciadas pelos estudos linguísticos, cognitivos, assim como pelos progressos dos campos da BCI e da Ciência da Computação (ISQUERDO; ALVES, 2007). Contudo, não se negam os conhecimentos já produzidos, mas aportam-se novos conhecimentos e paradigmas que possibilitam maior consistência à definição e adequação ao ambiente de comunicação e uso. Na literatura da Terminologia, podem ser encontrados diversos tipos de definição terminológica cujos princípios não rompem com a abordagem linguística da terminologia. Isto é, uma definição terminológica que não se limita à perspectiva da normalização, que estava na origem da Terminologia, mas adota uma análise mais linguística, concebendo a estruturação do saber de especialidade como algo que faz parte das línguas e culturas em geral (DESMET, 2002). Esses princípios são os mais adequados aos fundamentos da Teoria Comunicativa da Terminologia (TCT), adotada nesta pesquisa. Dentre os tipos existentes, foram compiladas as propostas elaboradas por diferentes autores (SAGER, 1990, 1993; CABRÉ, 1999, 2005; DESMET, 2002), a saber: (a) definição funcional: indica instruções de utilização de uma máquina qualquer, para domínios técnicos, por exemplo, ou, nas ciências sociais, humanas, políticas e econômicas, indicando propriedades sem caráter distintivo; (b) definição relacional: ou morfo-semântica, que podem indicar, por exemplo, que o valor semântico do sufixo -ose ou -ite, em medicina, implica em um determinado tipo de doença; (c) definição lexical: ou descritiva; descreve o significado de um termo em função de seu uso em dado domínio, estabelecendo as suas relações com outros conceitos, com o objetivo de informar o significado aceito do termo nesse domínio; (d) definição teórica: estabelece o uso do termo no contexto de um quadro intelectual mais amplo, com suas premissas e princípios norteadores; (e) definição explicativa: aproxima o significado do termo a uma expressão comum ou cotidiana, podendo criar uma analogia52 ou metáfora53, ficando o sentido das funções do termo mais claro e coerente; (f) definição estipulativa: atribui um significado novo a um termo, criando um uso que ainda não havia sido estipulado, propondo a aceitação e a adoção desse novo termo, tal como a determinação de uma sigla ou abreviatura nova; 52 Comparação explícita, precisa ser apresentada (Ex.: Feroz como uma onça). 53 Comparação implícita, já subentendida no contexto (Ex.: Maria é uma onça). 114 (g) definição precisa: combina a lexical e a estipulativa, sendo utilizada para reduzir a ambiguidade de um termo, dentro de dado domínio; inicia-se com a definição lexical do termo e, depois, estipula os limites naquele propósito específico, com uma informação possivelmente útil; (h) definição por síntese: identifica as relações que mantém no contexto e sua descrição de forma sintética; (i) definição por implicação: utiliza uma palavra que pode explicar e explicitar o contexto de uso; (j) definição por sinonímia: lista os termos que têm significados idênticos ou semelhantes, apontando algum tipo de relação de equivalência conceitual, a ser considerada dentro de um contexto de uso e propósitos específicos. Essa compilação pode ser considerada uma amostra bem representativa dos tipos definitórios com abordagem linguística, porém, deve ficar claro que o modelo adotado de definição deve ter por base os eventos e fenômenos existentes em cada domínio, utilizando ferramentas conceituais, pois Como a definição é um texto importante, é natural que a busquemos formular sob a forma de um enunciado claro e objetivo. Entretanto, um excesso de normatividade lógica, tanto tomado como medida de análise, quanto cobrado da sua apresentação, pode gerar alguns problemas quando lida-se com definições concretas, reais. Portanto, adotar ou requerer um padrão de formulação uniforme, absoluto ou invariável, que possa valer para qualquer situação, ou privilegiar apenas uma forma lógica seria uma medida pouco inteligente na medida em que nos distancia da realidade da linguagem em geral e também de uma determinada linguagem técnica ou científica em uso. Afinal, a variação é um traço constitutivo da linguagem in vivo, seja ela especializada ou não (FINATTO, 2002, p. 78). A flexibilixação do tipo de enunciado é, portanto, uma questão central para a definição terminológica e envolve o mapeamento do domínio para a formulação de modelos mais adequados. Ressalta-se, também, que a definição terminológica adotada deve atender a distintas situações de uso, o que exige, da tarefa de identificar as propriedades que devem ser apontadas nas definições, bastante conhecimento linguístico e do domínio. Para orientar essa escolha, Desmet (2002) recomenda que a definição deve ser elaborada a partir de proposições sobre as noções (conceitos), com uma definição substancial e não descritiva, composta apenas pelos traços que são pertinentes ao conceito. No entanto, Almeida, Souza e Pino (2007) relatam a dificuldade em estabelecer quais são os traços pertinentes (essenciais) e quais são os acessórios nas terminologias desenvolvidas em seus projetos no GETerm54. Segundo o resultado das pesquisas desses autores, a tendência é incluir mais traços constitutivos do conceito, criando definições menos concisas, mesmo correndo o risco de a definição “ficar com características de uma 54 GETerm é o Grupo de Estudos e Pesquisas em Terminologia (revestimentos cerâmicos, Nanotecnologia, Biocombustíveis), liderado pela pesquisadora Gladis Almeida desde 1993. 115 descrição enciclopédica, já que nosso objetivo é facilitar o entendimento do conceito por parte do consulente, mesmo que para isso tenhamos que descrever além de definir” (ALMEIDA; SOUZA; PINO, 2007, p. 4). Nota-se, assim, uma tendência em manter uma definição suficiente para distingui-los dos demais no contexto de uso, sem ficar limitado à concisão e à consideração de ser a característica essencial ou acessória. Os autores garantem que, ao adotar esse procedimento, os especialistas deixaram de rejeitar as definições por incompletude conceitual, validando-as com maior facilidade, o que deu maior produtividade ao trabalho. Finalizando este Subcapítulo, cabe destacar a consideração de Finatto (2002), quando afirma que, à medida que a Terminologia, na perspectiva dos enfoques linguísticos, se aproxima do texto e do objeto eminentemente textual que se tornou a definição de termos técnico-científicos, vemos um movimento de independência e de relativização da tradição lógico-gramatical. Nesse sentido, a trajetória atual dos enfoques da definição em Terminologia pode tender também para a identificação e para a consideração de elementos culturais e comunicativos, textuais e discursivos, presentes nos enunciados, o que, sem dúvida, é um passo muito importante rumo a uma visão mais integrada da comunicação, tanto entre especialistas e seus pares quanto entre especialistas e leigos (FINATTO, 2002, p. 79). Como se percebe, a questão essencial parece ser formular uma definição que possa delimitar as fronteiras e os usos dos termos em um domínio, atendendo também às demandas culturais, sociais e políticas dos usuários e da instituição. Nesse sentido, no caso desta pesquisa, a melhor alternativa foi combinar tipos de definições que pudessem atender às diversas naturezas dos conceitos no domínio temático sobre Intensificação Agropecuária. Assim, na definição, está a representação descritiva do conceito, com suas características, propriedades e atributos, visando ao controle da polissemia e à eliminação das ambiguidades. As discussões acerca desses dois fenômenos – ambiguidade e polissemia – estão apresentadas no próximo Subcapítulo. 5.5 A QUESTÃO DA AMBIGUIDADE E POLISSEMIA De forma geral, a ambiguidade é a indeterminação do sentido, um fenômeno que ocorre quando um enunciado pode sugerir uma multiplicidade de sentidos. Esse recurso pode ser produzido de forma voluntária pelo emissor da mensagem ou como consequência de um enunciado mal formulado ou ser um vício de linguagem. De forma intencional, é mais recorrente em textos publicitários ou humorísticos, visando a obter a atenção do leitor. Quando não é intencional, pode causar sérios problemas de comunicação. Já a polissemia é uma ambiguidade lexical, na qual uma palavra, expressão, texto ou imagem podem, simultaneamente, apresentar diferentes significados dentro de um mesmo campo semântico. Esses são problemas presentes tanto na linguagem natural quando na 116 linguagem de especialidade, o que torna necessário um maior conhecimento sobre o tema no âmbito de construção de tesauros. 5.5.1 Ambiguidade nos enunciados Como visto no Subcapítulo 5.4.3, a definição terminológica descreve as características, atributos e propriedades de um conceito, evidenciando os seus traços semânticos distintivos. A tipologia das definições varia em função da natureza do conceito, da área temática e das necessidades do usuário. Em qualquer dos casos, elaborar uma definição envolve a redação de um texto, em linguagem natural, que, como tal, também está sujeita a problemas de ambiguidade e polissemia. Mesmo quando se respeitam as orientações de modelos definitórios, e mesmo sabendo que as variações estilísticas devem ser limitadas, o sujeito que define está envolto, até certo ponto, pela subjetividade inerente ao ser humano. Nesse sentido, o trabalho terminológico exige que as definições sejam claras, fazendo com que o significado do conceito seja explicitado corretamente, evitando-se as ambiguidades. Há, na literatura, distintas definições para o termo “ambiguidade”, e Silva (2006) oferece uma compilação das mesmas, cuja síntese está apresentada no Quadro 3, em ordem cronológica. QUADRO 3 – Definições do termo “ambiguidade” AUTOR DEFINIÇÃO Culioli (1973) Parte integrante da atividade da linguagem, assim como os deslizamentos, lapso ou mal-entendido, sendo os parasitas da comunicação ou os ruídos sobre um fundo informativo somente se o mesmo não for claro. Fuchs (1988) Atividade efetiva da linguagem que põe em jogo enunciador, receptor e situação de enunciação. Schlieben- Lange (1993) Mal necessário que precisa ser considerado como uma característica constitutiva da língua, sendo preciso aprender a lidar com ela, em todas as suas formas. Rindflesch e Aronson (1994) Fenômeno que ocorre em um contexto textual definível no qual é apresentado o sentido particular de um termo. Ferreira (2000) Atua entre hemisférios opostos, entre o sentido e o não-sentido, entre a clareza e a obscuridade, entre o necessário e a falta, entre a unidade e a multiplicidade, procurando revelar um terceiro sentido. Branquinho e Murcho (2001) Caracteriza-se pela associação de uma expressão a mais de um significado. Chantree (2004) No campo do processamento da linguagem natural é a capacidade de compreensão por mais de um caminho, podendo ser classificado em vários tipos; é a característica mais saliente da língua natural. 117 AUTOR DEFINIÇÃO Ceia (2005) Traduz a ocorrência de mais do que um sentido em palavras, frases, proposições ou textos, relacionando-se com as noções de ambivalência, anfibolia (falácia lógica), anfibologia, asteísmo (ironia), duplo sentido e equívoco. Fonte: elaborado pela autora desta tese, com base em SILVA (2006). Nota-se que todas as definições de ambiguidade se distinguem pela forma (tamanho, estilo), mas não pelo seu conteúdo, pois as expressam como sendo a ocorrência de pluralidade de sentido em um enunciado. Segundo Silva (2006), alguns autores consideram que a ambiguidade acontece no receptor da mensagem, uma vez que o emissor nunca está indeciso sobre o que quer transmitir, ainda que seja mais ou menos preciso nessa tarefa. Contudo, essa consideração não parece totalmente correta, conforme atesta Freud (1967), que acredita não ser um enunciado inteligível por si só, sendo necessário que esteja contextualizado e que o emissor seja capaz de dar um sentido claro ao que é proferido. Dessa forma, entende-se que toda comunicação envolve o emissor, a mensagem e o receptor, sendo o entendimento dependente de cada um desses elementos. Cabe ressaltar que as Ciências Humanas, de forma mais contundente do que as Ciências da Natureza, caracterizam-se por um arcabouço que se estrutura a partir da linguagem, estabelecendo identidade por meio de operações semânticas e conceituais. Cada análise ou crítica feita a uma ideia, materializada em um objeto concreto ou abstrato, é traduzida na forma de discursos, e faz uso da linguagem escrita ou falada. Dessa forma, todo discurso é elaborado com ligação estreita com os conceitos que lhe dão sentido. Nessa perspectiva, representar o conceito exige apresentar o conhecimento que nele está embutido, por meio de sua definição. Nessa atividade de definir, a ambiguidade é uma ocorrência que deve ser evitada. Dentre os diferentes tipos de ambiguidade, Silva (2006) destaca os principais, que podem se referir a: (a) de âmbito: contexto de uso; (b) sintática: posição de um sintagma na frase; (c) sistemática: critérios estruturais ou funcionais; (d) lexical: interpretações diferentes de uma unidade lexical; (e) interlingual: de tradução; (f) linguística: enunciados inconsistentes; (g) morfológica: efeito da policategorização, que pode ser categorial (falta correspondência entre conjuntos de significado) ou gramatical (pertence a várias categorias); (h) poética: geração de múltiplos sentidos; (i) pragmática: conflito entre a intenção do enunciador e a significação expressa; (j) predicativa: problema na interpretação das relações temáticas; (k) semântica: palavra relacionada a muitos conceitos diferentes; (l) referencial: enunciados que estão ou provavelmente estão incompletos; (m) transfrástica: por disjunção, quando o significado é obtido pela escolha de um dos sentidos possíveis; (n) virtual: por disjunção relativa, em palavras que têm heranças múltiplas e estão sendo consideradas isoladamente, não havendo a obrigatoriedade de escolha de uma única 118 interpretação possível. Analisando essa tipologia, percebe-se que, na construção de tesauros, todos esses elementos devem ser levados em consideração e, sempre que possível, evitados. Isso deve ser observado, principalmente, na elaboração de definições e notas de escopo. Em relação a esta última, Svenonius (2000) aponta que o uso de notas de escopo é uma boa estratégia de desambiguação, uma vez que seu principal objetivo é explicar o uso de determinados termos, além de distinguir aqueles que têm significados bem próximos ou para assinalar sentidos utilizados na linguagem comum que são diferentes do empregado em um domínio de especialidade. Como fenômeno linguístico, a ambiguidade pode apresentar-se de formas diferentes, permitindo que um enunciado ou expressão tenha diferentes interpretações válidas. Nesse sentido, a ambiguidade pode mudar o sentido de um texto, alterando o seu significado, gerando problemas na coerência textual. Esse tipo de problema não deve ocorrer nas definições dos conceitos, cujo objetivo é o de informar e esclarecer, havendo a necessidade de uma construção de sentido sem ambiguidades. O problema da ambiguidade somente pode ser resolvido, ou minimizado, a partir do conhecimento dos fenômenos linguísticos que podem acarretá-la, dentre os quais se destacam: (1) policategorização: palavra que pode ser substantivo, adjetivo ou verbo; (2) ambivalência: presença de uma figura retórica, com sentidos contrários ou que podem ser atribuídos a mais de um elemento. (3) metáfora: sentido figurado com relação de semelhança subentendida; comparação não explícita; (4) analogia: comparação, indicando a semelhança entre elementos de forma explícita; (5) duplo sentido: presença de trocadilhos realizados por meio de palavras e expressões, geralmente para provocar humor ou ironia; (6) indeterminação: presença de relatividade na determinação do sentido; (7) vagueza: insuficiência de informação para o entendimento do significado; (8) anáfora: repetição sistemática de uma palavra em um texto; (9) sinonímia: diferentes palavras ou expressões com sentido igual ou semelhante; (10) parônimo: palavras muito parecidas na grafia e pronúncia, mas com significados diferentes; (11) homonímia: palavras com grafia e pronúncia iguais e significados diferentes; (12) polissemia: diferentes significados para uma mesma unidade lexical, expressão ou imagem. 119 Todos os elementos, isolados ou combinados entre si, podem criar uma situação na qual o sentido não seja facilmente identificado e compreendido. Dessa forma, podem comprometer o sentido real ou, até mesmo, impossibilitar o entendimento correto do sentido. Desses doze fenômenos linguísticos apresentados, os fenômenos de números (1) a (8) podem ocorrer durante a escrita, na produção de textos, e devem ser evitados no momento da elaboração de definições e notas de escopo. Esse tipo de ambiguidade não tem influência direta na construção da estrutura hierárquica dos tesauros, porém grande parcela da comunicação dos significados adotados no domínio modelado está expressa nas definições e das notas de escopo. Sendo assim, é preciso estar atento à redação das definições e notas de escopo, visando a estabelecer uma finalidade e intenção, produzindo uma mensagem clara, precisa e coerente. Uma forma de desambiguação que pode ser aplicada na elaboração de definições completas de termos é iniciar o texto com o nome do gênero próximo que representa o grupo (cluster), seguido da diferença específica que o torna uma espécie única (SVENONIUS, 2000). Os diferentes tipos de definições que são geralmente utilizadas para a desambiguação estão descritas no Subcapítulo 5.4.3. Diferentemente dos fenômenos de ambiguidade citados nos itens (1) a (8), que ocorrem somente na produção textual das definições e notas de escopo, os fenômenos de ambiguidade de números (9) (sinonímia) e (10) (parônimo) podem ocorrer durante a compilação da terminologia que irá compor a estrutura do tesauro, pois podem ser considerados tipos de equivalência. A necessidade de controle para os casos dos parônimos são mais raros em tesauros, mas a sua desambiguação pode ser realizada em notas de escopo ou nas definições completas dos conceitos. No que se refere à sinonímia, esse é um fenômeno frequente na construção de tesauros, e já existe um mecanismo de controle bastante conhecido, que é a atribuição de relação de equivalência55 entre os termos descritores sinônimos, por meio das indicações simbólicas USE e UP (usado para) (SVENONIUS, 2000). Nesse contexto, também é possível a harmonização terminológica, através de um acordo firmado entre os integrantes de um domínio de especialidade. A adoção dessa estratégia “combina o desejo de precisão conceitual e correção linguística, a adequação do termo à situação de comunicação e a eficácia da comunicação” (PAVEL; NOLET, 2002, p. 30). Para essas autoras, a harmonização pode ser pontual ou temática, e as decisões adotadas têm níveis diferentes de aplicação (consensual, recomendado ou obrigatório). Dessa forma, é possível obter níveis diferenciados de consenso no uso da terminologia, para que elas sejam aplicadas a distintas situações, evitando-se, assim, a rigidez impositiva da normalização da terminologia clássica (Wüster), assim como a falta de consistência conceitual em um campo de conhecimento (BARROS, 2004). 55 Ver Subcapítulo 5.7.1 para mais informações sobre as relações de equivalência. 120 Já os fenômenos de números (11) e (12), homonímia e polissemia, respectivamente, são um tipo especial de ambiguidade, denominado “ambiguidade lexical”, que não estão diretamente relacionadas à elaboração de definições e notas de escopo, ainda que, de certo modo, tenham influência sobre elas. A homonímia e polissemia estabelecem um tipo de ambiguidade que, até a década de 1990, não era muito discutido na área da Terminologia. Isso ocorreu porque a tendência era adotar os princípios de Wüster56, nos quais o caráter normalizador da abordagem empregada fazia com que a polissemia fosse desconsiderada em linguagens de especialidade, mesma visão que sempre predominou na BCI. Na construção de tesauros, esses dois fenômenos têm papel importante na estruturação semântica do instrumento, pois existem formas distintas de controle, razão pela qual esse tema será tratado com exclusividade, no próximo Subcapítulo. 5.5.2 Ambiguidade lexical: polissemia e homonímia A polissemia é um fenômeno natural das línguas em geral, caracterizada pela associação de diferentes sentidos a uma única palavra, expressão ou imagem, e pode ser considerada contrária à sinonímia. A polissemia pode ser confundida com a vagueza, e, sobre isso, Rossa (2001) apresenta o critério da lexicalização para a distinção entre esses dois elementos: (1) a polissemia se refere a mais de um sentido para uma palavra, estando esses sentidos associados semanticamente; (2) a vagueza acontece quando há possibilidades de diferentes interpretações, que são dependentes do contexto, uma vez que têm um sentido bastante geral. Assim, quanto mais amplo é o sentido de uma palavra (ou termo), mais dependente seu significado é do contexto, e um maior controle é preciso para que o termo seja utilizado em um tesauro (SVENONIUS, 2000). Se um tesauro tem seu escopo limitado a um pequeno domínio específico, os problemas de ambiguidades serão menores, porém, se esses fenômenos não forem tratados, restringe-se a sua compatibilidade com outros instrumentos. O fenômeno da polissemia pode ser encontrado em distintas acepções na literatura. Autores tais como Ullman (1964) e Boniatti e Bidarra (2005) acreditam que uma unidade lexical pode ter muitos significados, mas, se estiver vinculada a um contexto, o sentido não será difuso (SILVA, 2006). Silva (2006) aponta que essa ideia não é compartilhada por outros autores, como, por exemplo, Rehfeldt (1980) que acredita ser a arbitrariedade linguística uma das causas da polissemia. Esse caráter arbitrário (absoluto e relativo) é a acepção adotada por Saussure quando determina que existe uma ligação indissociável entre um significante e seu significado (conceito). Sendo assim, o fato de uma 56 Ver Subcapítulo 5.2. 121 unidade lexical estar associada a um dado contexto não é o suficiente para determinar o seu sentido. Siqueira (2013) reforça esse pensamento ao assegurar que, já na década de 1970, Rey (1979) indicava a impossibilidade de um domínio puro, no qual fosse possível delimitar, a uma única concepção, a definição de uma unidade linguística. Nesse sentido, Siqueira (2013, p. 38) afirma que, “hoje, com a difusão do caráter interdisciplinar nos diferentes domínios, marcados por heterogeneidade e complexidade nas relações entre as áreas, fica inviável falar de tal pureza de domínio”. Ademais, estudos mais recentes (por exemplo, de Cabré) reconhecem que uma mesma especialidade pode conviver com diferentes acepções para um mesmo fenômeno, podendo gerar pluralidade de significados para um mesmo signo. As diversas acepções sobre o conceito de polissemia estão elencadas no Quadro 4, que mostra, inclusive, a diferença entre as visões de Ullmann e Rehfeldt, já pontuada no parágrafo anterior. QUADRO 4 – Definições para o termo “polissemia” AUTOR DEFINIÇÃO Ullmann (1964) Traço fundamental da fala humana, que ocorre de distintas maneiras (mudança de aplicação, especialização social, linguagem figurada, homônimos e influência estrangeira); e que, se fundamentada no contexto, não haverá distorção entre os distintos significados. Biderman (1978) Fenômeno da língua comum, ocorrido nas redes de significação por causa da economia linguística (reaproveitamento de palavras), que gera a ampliação do uso de uma palavra e a metaforização (expressar por metáforas) contínua da linguagem. Rehfeldt (1980) Palavra que aceita distintos significados, levando a uma deficiência do sistema linguístico; uma de suas causas é a arbitrariedade linguística. Bréal (1992) Significação nova para uma palavra, multiplicando seus exemplares, que são semelhantes na forma, porém, diferentes no valor; fenômeno presente em todas as línguas. Correia (2000) Fenômeno que afeta praticamente todas as palavras da língua e facilita a comunicação entre falantes, minimizando o esforço de memorização do saber lexical, pois resulta de mecanismos naturais e inconscientes de atribuição de significado. Rossa (2001) Fenômeno diacrônico (a partir de mudanças ao longo do tempo), que torna difícil a determinação de quando uma palavra foi criada ou quais as acepções existentes para ela. Boniatti e Bidarra (2005) Fenômeno que está presente nas palavras que podem assumir significados diferentes, mas sempre mantendo uma relação de sentido entre elas. Fonte: elaborado pela autora desta tese, com base em SILVA (2006), CORREIA (2000) e ROSSA (2001). 122 Nota-se, pelo exposto, que, apesar de haver certa divergência de visões, em todos os casos, existe convergência em entender a polissemia como processos de derivação de significado (CORREIA, 2000). Rossa (2001) acrescenta que ela é um fenômeno diacrônico (pode mudar com o tempo), não sendo possível “determinar quando um item lexical foi criado ou quantas foram as acepções usadas pelos falantes em um determinado período” (ROSSA, 2001, p. 25). Entretanto, na construção de tesauros, esse controle pode ser realizado através do tipo de nota de escopo denominado nota histórica. Nesse sentido, é conveniente saber que, segundo Ullmann (1964), a polissemia pode ocorrer a partir de cinco formas nativas: (1) mudança de aplicação: mesma palavra que difere em relação ao contexto em que ocorre, havendo distintas relações de sentido entre elas, e podendo ser seus aspectos variáveis ou transformados em matizes permanentes de significado, tornando-se independentes, como no caso de um exemplar de uma classe (teoria dos protótipos: indeterminação do sentido); (2) especialização em um meio social: mesma palavra que pode ter diferentes sentidos especializados, mas apenas um deles será aplicado em dado contexto (congruente com a TGT de Wüster), sendo que o máximo de especialização acontece quando um substantivo comum se torna o nome próprio que denomina um objeto em dado domínio; (3) linguagem figurada: uma palavra usada em diversos sentidos figurados, porém sem perder o seu significado original; (4) homônimos reinterpretados: caso raro, no qual duas palavras, com mesmo som e uma pequena diferença no significado, podem ser consideradas como uma única palavra com dois sentidos, pela etimologia da palavra ou por elementos psicológicos; (5) influência estrangeira: empréstimo semântico entre idiomas diferentes, algumas vezes mudando e substituindo o significado original. Dentre as cinco formas descritas, Ullmann (1964) aponta as três primeiras como as mais importantes para a terminologia e o uso na linguagem cotidiana. Para o autor, a quarta forma, dos homônimos reinterpretados, é um caso infrequente, mas não deve ser confundido com o fenômeno da homonímia, que é distinto da polissemia e deve ser estudado separadamente. É preciso ressaltar que somente é considerado um fenômeno de homonímia quando existe uma mesma unidade linguística com dois ou mais significados distintos, sem que haja, entre esses significados, qualquer tipo de associação ou proximidade semântica. Já a quinta forma de polissemia, “apesar de muito comum em certas situações, não é um processo normal na linguagem cotidiana” (ULLMANN, 1964, p. 346). Há casos nos quais o sentido do termo apropriado de outro idioma é empregado de forma diversa, sendo o sentido original abolido. Porém, quando há importação de parte do significado original, e acontece a coocorrência dos dois significados, acontece o fenômeno 123 da polissemia. Por exemplo, a palavra futebol57, em português, que representa um jogo que é disputado entre jogadores, em dois times adversários, usando os pés e uma bola, foi um empréstimo semântico da palavra em inglês football (anglicismo). Contudo, o significado dessa palavra, nos Estados Unidos, representa um jogo que tem características um pouco diferentes do jogo brasileiro. Dessa forma, no domínio do esporte brasileiro, a coexistência dos dois significados dá origem ao fenômeno da polissemia e, para controlar esse fenômeno, é comum utilizar-se a expressão futebol e futebol americano para a distinção dos dois diferentes sentidos. Nota-se que, no campo da Linguística, a questão das diferenças entre polissemia e homonímia é tema de distintos estudos, como pode ser atestado na pesquisa de Andrade (2000), pois não é fácil distingui-las. Entretanto, essa distinção entre os dois fenômenos não tem papel importante na construção de tesauros, razão pela qual esse assunto não será discutido mais detalhadamente. O que importa ao escopo desta pesquisa é que a homonímia não é tão comum quanto a polissemia, mas, segundo Ullmann (1964), também influencia nos processos de entendimento das linguagens e na elaboração de terminologias. A homonímia pode ser dividida em três distintos tipos: homonímias perfeitas, homógrafas e homófonas: (a) homonímias perfeitas, são palavras com mesma grafia e som, mas com significados diferentes; exemplo: banco (assento) / banco (instituição); (b) homonímias homógrafas, são palavras com idêntica grafia (desconsiderando os acentos) e diferentes pronúncias e significado; exemplo: gosto (verbo gostar) / gosto (sabor); (c) homonímias homófonas, são palavras com pronúncias iguais, mas grafia e significado diferentes; exemplo: cela (cadeia) / sela (de cavalo). Ainda que se saiba que a existência de homonímia em domínios de especialidade seja quase inexistente, esse tipo de fenômeno não deve ser desconsiderado durante o mapeamento de sua terminologia. Svenonius (2000, p. 131) aponta que “uma forma comum para distinguir homônimos, mas não a única, é criar um novo termo, adicionando um qualificador ao termo que tem múltiplos referenciais (conceitos)”. Como exemplo, a autora indica o termo “organização”, que pode ser um processo ou uma entidade; então, criam-se dois novos termos, com qualificadores, “Organização (entidade)” e “Organização (processo)”, distinguindo os homônimos. De forma geral, o mapeamento das ambiguidades, incluídos aí os fenômenos da homonímia e, principalmente, da polissemia, provê base para a obtenção das relações semânticas entre os vários sentidos existentes em um domínio específico, auxiliando a 57 Em inglês (americano) o jogo com essas mesmas características é denominado soccer. 124 construção de tesauros. Também facilita a criação da sua estrutura hierárquica, pois, conforme Svenonius (2000), uma das formas de desambiguação é a criação dessas estruturas, que podem ser, por exemplo, de gênero e espécie, que é uma relação lógica de inclusão, e de perspectivas (pontos de vista), que são relações empíricas (sintagmáticas) e não paradigmáticas (a priori). A proposta desta pesquisa tem por base o pressuposto de que, na construção de sistemas de organização do conhecimento (SOC), deve-se reconhecer que a linguagem de especialidade é semelhante à língua geral, exigindo mecanismos para a representação e o controle das ambiguidades existentes em dado domínio. De forma semelhante, entende que um conceito pode ser representado por mais de um termo, assim como um termo pode estar ligado a mais de um conceito, o que torna o controle da ambiguidade essencial. Finalizado este Subcapítulo, apresenta-se o Subcapítulo sobre os sistemas de organização do conhecimento (SOC). 5.6 SISTEMAS DE ORGANIZAÇÃO DO CONHECIMENTO (SOC) A expressão “sistema de organização do conhecimento” (SOC) é a denominação em português para o termo “knowledge organization systems” (KOS), adotado a partir de 1998, durante a Conferência da ACM Digital Libraries. Depois disso, alguns autores já definiram os SOCs de diferentes maneiras: são vistos como esquemas que visam organizar, gerenciar e recuperar informações (VICKERY, 2007, on-line, grifo da autora desta tese); uma denominação nova para as linguagens documentárias que agregam elementos incorporados nas inovações tecnológicas da era digital (CARLAN, 2010, p. 29-30, grifo da autora desta tese). Nota-se que essas definições de SOCs se complementam, porém, uma definição mais completa está apresentada no relatório da Conferência de 1998, publicado por Hodge: O termo sistemas de organização do conhecimento pretende abranger todos os tipos de estruturas para organizar a informação e promover a gestão do conhecimento. Sistemas de organização do conhecimento incluem estruturas [...] que organizam os materiais a um nível mais geral, [...] que fornecem acesso mais detalhado, [...] que controlam variantes [...] tais como nomes geográficos e nomes pessoais. Sistemas de organização do conhecimento também incluem vocabulários altamente estruturados [...]. Como os sistemas de organização do conhecimento são mecanismos de organização de informações, eles estão no coração de cada biblioteca, museu e arquivo. [...] O SOC pode ser uma aplicação com registros de metadados, para cada recurso, pode estar incorporado em metatags ou separado dos recursos da biblioteca digital, como parte do mecanismo de acesso. Independentemente da sua localização, em relação ao recurso [...] ou ao seu tipo, o SOC tem uma única finalidade: organizar conteúdos para apoiar a recuperação de itens relevantes, disponibilizados na base de dados de uma biblioteca digital (HODGE, 2000, p. 9, grifos da autora desta tese). 125 Observa-se que o novo termo, sistemas de organização do conhecimento, designa os tradicionais instrumentos de organização e representação do conhecimento, porém, aqueles que lidam com recursos informacionais em ambiente digital, com alcance local, nacional ou internacional. Nessas unidades de informação digital, o sucesso da implementação dos serviços é dependente, direta ou indiretamente, da utilização de um ou mais SOCs (HODGE, 2000). É preciso esclarecer que a escolha dessa expressão, usando o termo “conhecimento”, e, não, “informação”, vai ao encontro de uma acepção já discutida na literatura por alguns autores (SVENONIUS, 2000; NAVES; KURAMOTO, 2006; BRÄSCHER; CAFÉ, 2008), sobre a diferença entre “organização da informação” (OI) e “organização do conhecimento” (OC). Tendo como insumo a literatura da área da BCI, Bräscher e Café (2008) analisaram distintas visões acerca de “informação” e “conhecimento”, no intuito de estabelecer conceitualizações para OI e OC. Ao final dessas análises, as autoras apresentaram uma proposta de definição para esses dois termos: Organização da informação é, portanto, um processo que envolve a descrição física e de conteúdo dos objetos informacionais. O produto desse processo descritivo é a representação da informação, entendida como um conjunto de elementos descritivos que representam os atributos de um objeto informacional específico (BRÄSCHER; CAFÉ, 2008, p. 5). Organização do conhecimento, por sua vez, visa à construção de modelos de mundo que se constituem em abstrações da realidade (BRÄSCHER, CAFÉ, 2008, p.7). [...] Delineamos a OC como o processo de modelagem do conhecimento que visa a construção de representações do conhecimento. Esse processo tem por base a análise do conceito e de suas características para o estabelecimento da posição que cada conceito ocupa num determinado domínio, bem como das suas relações com os demais conceitos que compõem esse sistema nocional (BRÄSCHER; CAFÉ, 2008, p. 8). Através dessas propostas, reconhecem-se dois distintos tipos de representação: a representação da informação e a representação do conhecimento. Em relação à primeira, deve-se ressaltar que a representação descritiva envolve a representação de objetos, que são denominados documentos. Nesse processo, o documento pode ser representado não apenas no todo, mas, também, em partes, em conjunto, segundo documentos diversos não relacionados, assim como em representações no âmbito de seu conteúdo temático, englobando, assim, organizações linguísticas e terminológicas. A segunda representação, por sua vez, expressa a estrutura conceitual utilizada para descrever e representar os fenômenos do mundo. Nesse sentido, essa acepção é compartilhada nesta pesquisa, pois se considera que um SOC é uma estrutura conceitual que representa o conhecimento de um dado domínio, pois é um processo de “OC [que] produz representações de conhecimento utilizadas na OI para padronizar as representações de informação” (BRÄSCHER; CAFÉ 2008, p. 12). 126 Dessa forma, um SOC tem por finalidade agrupar assuntos correlatos, conduzindo o usuário à informação desejada. Discorrendo sobre isso, Soergel (1999) afirma que esse instrumento deve servir como um dicionário mono, bi ou multilíngue, para uso humano ou como base de conhecimento para ser interpretado pela máquina (processamento da linguagem natural, tradução, entre outros), e enumera os seus objetivos: (1) fornecer um mapa semântico para domínios individuais, determinando as inter-relações entre esses domínios, assim como os relacionamentos entre os conceitos e seus termos, e as definições desses termos, proporcionando orientação e servindo como uma ferramenta de referência; (2) melhorar a comunicação e o ensino, dando apoio aos professores e aos aprendizes, através do fornecimento e do exercício de criação de estruturas conceituais para amparar a aprendizagem e o desenvolvimento de materiais didáticos; (3) proporcionar uma base conceitual de auxílio a pesquisadores e profissionais, visando a respaldar a exploração e a criação de um contexto conceitual, para apoio à implantação de um projeto de pesquisa ou de outra atividade profissional qualquer; (4) prover classificações que permitam condutas assertivas como, por exemplo, a classificação de doenças, visando diagnósticos, ou a classificação de competências de funcionários para atribuição de tarefas; (5) apoiar a recuperação da informação, proporcionando opções de busca ao usuário final, através de mecanismos baseados em conhecimento, tais como menus hierárquicos, expansão de consultas, resultados de buscas apresentados de forma semanticamente estruturada ou o oferecimento de vocabulário controlado para orientar a indexação e a busca; (6) fornecer uma base conceitual para a criação de sistemas baseados em conhecimento, para a criação de definições de elementos de dados e de hierarquias de objetos no desenvolvimento de software. Nota-se, a partir desses objetivos, propostos por Soergel (1999), que os SOCs são instrumentos criados para atender a todas essas funções, exigindo instrumentos semanticamente expressivos. Não se pode perder de vista que os SOCs são linguagens construídas a partir de um conjunto de critérios e regras pré-estabelecidas, e, dessa forma, irão sempre possuir níveis diferenciados de estruturação e de controle terminológico. Nesse sentido, Hodge (2000) oferece uma sistematização, na qual agrupa os diversos tipos de SOCs, a saber: (1) grupo de instrumentos compostos por listas de termos: arquivo de autoridade58, glossários, gazetteers e dicionários; (2) grupo de instrumentos compostos por classificações e categorizações: lista de cabeçalhos de assunto, sistemas de classificação bibliográfica, taxonomias e sistemas de classificação bibliográfica facetados; (3) grupo de instrumentos compostos por listas de termos e relacionamentos: tesauros, redes semânticas e ontologias. 58 Os arquivos de autoridade são também denominados listas de autoridade, catálogo de autoridades, catálogo de identidade, catálogo de formas autorizadas ou lista de cabeçalhos autorizados. 127 Nessa proposta de Hodge, observa-se a sistematização em um percurso linear, não levando em consideração, como já ressaltado anteriormente, os diferentes níveis de estruturação que um mesmo tipo de SOC pode apresentar. Por exemplo, o arquivo de autoridade, que está agrupado junto ao grupo de listas de termos, também inclui relacionamentos entre as suas unidades, com os quais desempenha funções de desambiguação de nomes geográficos, de homônimos e de sinônimos. Dessa forma, talvez, a criação de uma nova classe para a subdivisão, fosse uma alternativa mais adequada. Nessa perspectiva, Zeng (2008) apresenta outra sugestão de sistematização, conforme Figura 10, na qual mostra a diversidade e a complexidade dos tipos de SOCs existentes. FIGURA 10 – Variedade de tipos de SOCs Fonte: traduzido de ZENG, 2008, p. 161. A Figura 10 evidencia uma visão crescente de complexidade, mostrando que os instrumentos se diferem, desde a exigência de seu nível de controle terminológico (de linguagem natural a linguagem controlada), até elementos referentes à sua estrutura semântica (de pouca estrutura a fortemente estruturada). Entretanto, Souza, Tudhope e Almeida (2012) afirmam que a forma de representação apresentada por Zeng (2008), ainda que permita distinguir a complexidade 128 dos instrumentos, também sugere uma sistematização unidimensional. Para os autores, esse fato se explica pelo fato de um exemplar, de um desses instrumentos, poder diferir em complexidade semântica, dependendo da finalidade à qual se propõe. Ademais, argumentam que também não há consenso sobre o significado e as características de SOCs tais como taxonomia, tesauro e ontologia. Percebe-se, com isso, que a construção desses três tipos de instrumentos pode ser realizada a partir de diferentes abordagens, dando origem a estruturas semânticas com maior ou menor grau de complexidade. Dessa forma, algumas vezes, esses instrumentos incorporam atributos que provocam a sobreposição de características entre eles, dificultando encontrar um consenso para a conceitualização deles. Por isso, os pesquisadores propuseram uma taxonomia de tipologias de SOCs, buscando mostrar, em uma acepção mais abrangente, as diversas dimensões de suas características, conforme Figura 11. FIGURA 11 – Taxonomia das dimensões dos SOCs Fonte: traduzido de SOUZA; TUDHOPE; ALMEIDA, 201259, p. 189. 59 Consultar a publicação para obter explicação detalhada sobre o desenvolvimento da proposta dos autores. 129 Analisando-se a Figura 11, nota-se que os autores iniciaram a taxonomia subdividindo as dimensões dos SOCs entre intrínsecas (modelo ideal) e extrínsecas (contexto de uso). Isso reflete que, como ideal, espera-se preencher o campo das características intrínsecas, inerentes a cada tipo de instrumento. Porém, o contexto (características extrínsecas) no qual tal instrumento será usado pode descaracterizá-lo em relação a algumas de suas dimensões intrínsecas. Ademais, dentro da dimensão intrínseca, há as dimensões essenciais, relacionadas com a estrutura e as normas e padrões adotados na construção do SOC, independente da aplicação na qual será usada, e as dimensões acidentais, que individualizam uma instância específica do SOC, principalmente ligadas ao domínio modelado (SOUZA; TUDHOPE; ALMEIDA, 2012). Essa forma de analisar e determinar a complexidade e estrutura dos SOCs, a partir de suas distintas dimensões, é tomada como adequada pela autora desta tese, uma vez que se acredita que nem sempre é possível definir diferenças lineares entre os diversos SOCs. Dentre os diferentes tipos de SOCs existentes, nesta pesquisa destaca-se o tesauro, por ser nesse instrumento que os relacionamentos semânticos serão tratados e refinados, e ao qual será aplicado o modelo de reengenharia proposto por Soergel et al. (2004) e Lauser et al. (2006). 5.6.1 Tesauros Observa-se, desde meados do século XIX, após a Revolução Industrial, época na qual as informações especializadas se avolumaram, a necessidade de um maior controle dessa informação. Para auxiliar nesse controle, o processo de organizar, armazenar e recuperar informações demandou instrumentos capazes de facilitar essa gestão. Nesse contexto, foram desenvolvidas as primeiras iniciativas que deram origem aos tesauros. Etimologicamente, em latim, a palavra tesauro tem a forma thesaurus, procedente da palavra grega thesauros que, originalmente, significa “estoque de tesouros” (treasure store, em inglês). Na Inglaterra, o uso desse termo primeiramente apareceu em 1565, no título de uma publicação, o Thesaurus Linguae Romanae et Britannicae, e, depois, em 1736, no Shortes Oxford Dictionary, ambos no sentido de um repositório de conhecimento, como um dicionário ou enciclopédia (GILCHRIST, 1971). Contudo, o termo ficou mais conhecido em 1852, com a primeira edição do Thesaurus of English Words and Phrases, de Peter Mark Roget. Diferente da forma usual alfabética, esse dicionário foi arranjado sistematicamente, a partir do conceito que as palavras expressam, permitindo ao usuário encontrar a palavra ou palavras que, semanticamente, são mais adequadas à ideia buscada. Uma maior “uniformidade e consistência no emprego do termo tesauro”, como um instrumento de representação terminológica, aconteceu com a definição fornecida nas 130 diretrizes para construção de tesauros, editadas pela United Nations Educational, Scientific and Cultural Organization (UNESCO), em 1971 (CARVALHO, 2013, p. 55). Conceitualmente, os tesauros são linguagens de especialidade, pós- coordenados60, elaborados a partir de um conjunto de regras pré-estabelecidas e constituídos por um conjunto de termos descritores, preferidos e não-preferidos, que representam o conhecimento de determinado domínio. Campos e Gomes (2006, on-line) esclarecem que o termo “linguagem está sendo tomado em sentido figurado, pois não lida com discursos, apenas deles extrai um vocabulário especializado”. Na literatura encontram-se metodologias para a construção de tesauros (CAMPOS, 2001; CINTRA et al., 2002; DODEBEI, 2002; VAN DER LAAN, 2002; CAMPOS; GOMES, 2004), a partir das quais se apresenta um esquema composto por três etapas: (1) inicial: a definição da equipe de trabalho; planejamento geral do tesauro, incluindo a delimitação do domínio a ser modelado; determinação de objetivos; recorte temático trabalhado; seleção do público-alvo; levantamento das principais fontes de terminologia (especialistas do domínio, vocabulários controlados, linguagens de indexação, dicionários, glossários e corpus textual); (2) desenvolvimento: elaboração da estrutura conceitual, com a escolha de critérios de modelagem; compilação de termos, que representam conceitos no domínio modelado, que são os candidatos a descritores; elaboração de um glossário de definições; seleção dos descritores (preferidos e não-preferidos), com validação de especialistas; criação de classes básicas ou facetas; organização dos descritores em um mapa conceitual; estabelecimento das relações semânticas entre conceitos e termos; (3) edição: montagem da estrutura conceitual e suas relações; escolha do software para o gerenciamento das etapas de construção do tesauro; determinação dos símbolos que expressam as relações; elaboração de notas de escopo para orientar quanto ao sentido e uso de descritores; escolha da forma de apresentação. A origem dos tesauros como uma linguagem controlada advém de diferentes linhas de pensamento, cujos princípios gerais estão apresentados na síntese a seguir. 5.6.1.1 Construção de tesauros: síntese sobre a origem de seus princípios Na década de 1950, Hans Peter Luhn utilizou o termo Thesaurus para nomear um sistema computacional composto por um conjunto de palavras autorizadas e referências cruzadas, que estabelecia relações entre descritores, de forma que o sistema 60 A pós-coordenação indica que os descritores representam um conceito, de forma isolada, e isso permite que sejam combinados no momento de seu uso, na especificação de um assunto ou na determinação de uma expressão no momento da busca, em oposição às linguagens pré- coordenadas, cujos assuntos se coordenam previamente à sua utilização (listas de cabeçalho de assunto, por exemplo) (MOREIRA, 2003, p. 24). 131 demonstrasse, interligasse e recuperasse ideias convergentes (VICKERY, 1960). Vickery (1960) aponta que o primeiro tesauro efetivamente utilizado como vocabulário controlado foi criado em 1959, pela Sociedade Dupond de Nemours, no Centro de Engenharia de Informação. Segundo o autor, os dois primeiros tesauros publicados e vastamente utilizados foram: (1) Thesaurus of ASTIA Descriptors, do Departamento de Defesa Americano, em 1960; (2) Chemical Engineering Thesaurus, do Instituto Americano de Engenharia Química, em 1961. Lancaster (1986) ressalta que, em 1967, houve a unificação desses dois tesauros com a construção do Thesaurus of Engineering and Scientific Terms (TEST). A origem dos princípios sobre construção de tesauros, segundo Lancaster (1986), pode ser sintetizada como procedendo de duas linhas teóricas principais: (1) abordagem alfabética, oriunda da América do Norte, em especial, dos Estados Unidos, (2) com base nos princípios sistemáticos, das classificações bibliográficas, com origem europeia, sobretudo, no Reino Unido. A primeira linha, mais pragmática, dá origem aos tesauros com arranjo61 alfabético, em que não há a criação de agrupamentos por categorias de conceitos por suas semelhanças e diferenças: eles são estruturados apenas como uma lista alfabética de descritores. Essa vertente é remotamente proveniente dos estudos de Charles Ammi Cutter, em 1876, com a publicação do dicionário Rules for a Dictionary Catalogue, cujos estudos estabeleceram princípios e regras formais para a formação de cabeçalhos de assunto, na elaboração de um catálogo alfabético de assuntos, princípio que influenciou o tesauro alfabético (CESARINO; PINTO, 1978). Outra proposta que também influenciou a abordagem alfabética foi a da indexação coordenada, conhecida como Unitermo. Esse sistema foi criado por Mortimer Taube, em 1951, com o objetivo de cobrir a limitação da pré- coordenação, encontrada nas listas de cabeçalhos de assunto. O sistema Unitermo é um vocabulário não controlado, que teve por base a ideia de que os assuntos devem ser representados apenas por descritores simples, de uma única palavra. Assim, ele é composto por um conjunto de fichas e, em cada ficha, há uma única palavra-chave com números de documentos associados a ela. Como as palavras-chave são selecionadas da linguagem natural, de forma empírica, percebeu-se a necessidade de maior controle do vocabulário utilizado, principalmente, das sinonímias e homônimos (RIVIER, 1992). Dessa forma, passou-se a fazer certo controle desses elementos, assim como fazer a estruturação das palavras-chave em hierarquias, indicando as relações associativas entre os termos. A segunda linha de construção dos tesauros, de origem europeia, fundamenta- se na organização e no agrupamento, em categorias, do conjunto de conceitos de um domínio, e foi influenciada pelos princípios da Teoria da Classificação Facetada, 61 Os arranjos são caracterizados pela natureza e pela ordem dos elementos. 132 desenvolvida por Ranganathan na década de 1930. Em sua teoria, o autor estabeleceu que todo o universo de assuntos pode ser classificado em cinco categorias fundamentais: Personalidade, Matéria, Energia, Espaço e Tempo, representadas pela sigla, PMEST. Os estudos de Ranganathan foram também desenvolvidos pelo grupo Classification Research Group (CRG), visando a aprofundar os princípios do método. As investigações do CRG contribuíram com uma base teórica para a construção de tesauros, provocando mudanças na indexação alfabética de assunto (LANCASTER, 1986). Esse efeito foi verificado, sobretudo, com a criação do Thesaurofacet, termo cunhado por Aitchison, Gomersall e Ireland, em 1969. Na elaboração desse instrumento, houve a combinação de estruturas hierárquicas, provenientes dos sistemas de classificação bibliográfica facetados, e do arranjo alfabético, derivados dos tesauros (forma conhecida até então). Sendo assim, no Thesaurofacet, cada termo foi apresentado tanto na forma de um sistema de classificação, com a sistematização das hierarquias e facetas, quanto na forma alfabética de um tesauro. Dessa forma, o domínio foi subdividido em campos de assunto ou disciplinas, e a Teoria da Classificação Facetada foi utilizada para categorizar e determinar as hierarquias e as relações entre os termos, agrupando-os de acordo com suas relações hierárquicas, de equivalências e associativas. Depois da experiência com o Thesaurofacet, Aitchison e Gilchrist (1972) afirmam que o arranjo sistemático foi amplamente aceito, dando origem a um tesauro com novas características. Segundo Lancaster (1986), esses princípios contribuíram para a elaboração da norma britânica sobre construção de tesauros, a British Standards (BS 5723, 1979). Outra contribuição que também influenciou a construção de tesauros é a abordagem teórica francesa, iniciada na década de 1960, com as contribuições de Jean- Claude Gardin. Segundo Lucas (1999), Gardin, em seus estudos, considera que as linguagens documentárias (entre elas, o tesauro) são desenvolvidas como metalinguagens. Com isso, Gardin passa a ser o pioneiro em reconhecer que a representação documentária poderia se desenvolver no âmbito da linguagem, dando maior ênfase à dimensão metodológica do que ao tratamento temático (LARA, 1999). Dessa forma, Gardin oferece contribuições à área da BCI, ao apontar os fundamentos da Terminologia como suporte na construção de tesauros e ao propor o conceito de “léxico documentário” como um conjunto de termos, estruturados ou não, que são utilizados na indexação de documentos (LUCAS, 1999). Outra teoria que igualmente forneceu subsídios para os fundamentos na construção de tesauros foi a Teoria do Conceito, desenvolvida por Ingetraut Dahlberg, na década de 1970. Influenciada pelos princípios lógicos de Aristóteles, pela Teoria da Classificação Facetada, de Ranganathan, e pela Teoria Geral da Terminologia (TGT), de Wüster, sua proposta ofereceu um modelo analítico que pode ser considerado como um 133 conjunto de conhecimentos básicos que devem ser empregados na determinação de conceitos de um domínio e no estabelecimento de relacionamentos entre eles. Com isso, forneceu as bases para a representação do conhecimento em um dado domínio. Dessa forma, o conceito, representado por um termo, posiciona esse mesmo termo em função de seu significado no sistema conceitual do tesauro. O termo, assim, perde o sentido linguístico e passa a ter um tratamento terminológico (ou conteúdo conceitual), pois denota um referente em um domínio específico (CAMPOS, 2001). Nessa perspectiva, o conteúdo conceitual tem prioridade em relação ao sentido linguístico, e esse instrumento passa a ser denominado tesauro conceitual62 (CAMPOS; GOMES, 2006, on-line). Esse enfoque conceitual já faz parte das diretrizes presentes na recente norma de construção de tesauros, a ISO 25964 (2011; 2013). Além de suas bases teóricas, os tesauros possuem algumas particularidades que os distinguem de outros tipos de SOCs. Elas estão descritas no próximo Subcapítulo. 5.6.1.2 Funções e características do tesauro No que diz respeito à terminologia utilizada em um domínio, Currás (1995) afirma que o tesauro possui uma função normalizadora. Essa função é apontada por Cintra et al. (1994) como um elemento normalizador na construção de tesauros que, muitas vezes, não ocorre de maneira satisfatória. Para as autoras, somente o uso da terminologia do próprio domínio, na modelagem de um tesauro, permite o rigor necessário para a representação de um consistente sistema de conceitos. Nesse contexto, é fundamental a aplicação dos fundamentos teóricos advindos da Terminologia, que podem auxiliar, sobretudo, na solução para controle das ambiguidades e polissemias, frequentes no léxico geral da língua. Com isso, busca-se facilitar a transmissão do conhecimento de especialidade, ou seja, possibilitar a função comunicativa dos tesauros. Currás (1995) indica que, como linguagem terminológica e especializada, os tesauros, em ambiente organizacional, têm como funções a representação dos assuntos dos documentos e o auxílio na elaboração de consultas informacionais realizadas pelo usuário. Nesse sentido, a autora afirma que o tesauro é um componente importante na recuperação da informação, em que cumpre as funções de: (a) definir os termos utilizados no sistema; (b) determinar os termos que podem ser empregados nas consultas do usuário; (c) admitir o ingresso de novos termos em sua estrutura, permitindo uma aproximação entre a linguagem 62 Há, na área BCI, uma discussão acerca do uso das denominações tesauro terminológico (LARA, 2002) e tesauro conceitual (CAMPOS; GOMES, 2006). Contudo, nesta pesquisa, prioritariamente, utiliza-se a denominação tesauro conceitual, porém, as duas designações são consideradas sinônimas, pois um tesauro é composto por uma terminologia (conjunto de termos) que tem o conceito como elemento focal. 134 do usuário e a linguagem utilizada no sistema. Dessa forma, é possível manter a atualização e adequação da estrutura conceitual do tesauro. Uma das principais características de um tesauro é a sua especificidade, e, nesse sentido, Marroni (2006) aponta que eles podem ser: (1) macrotesauros: abarcam temática ampla ou geral, são compostos por conceitos em nível mais genérico, com baixo nível de especificidade, podendo remeter a conceitos mais específicos contidos em microtesauros; (2) microtesauros: abrangem um campo mais delimitado de especialidade ou um único assunto, são compostos por conceitos mais específicos, com alto nível de especificidade. Essa especificidade do tesauro também está relacionada com a sua abrangência temática, pois eles podem ser multidisciplinares ou de uma única disciplina. Em relação à sua tipologia, um tesauro pode ser monolíngue ou multilíngue. Será monolíngue quando for produzido em um único idioma e, multilíngue, quando abranger dois ou mais idiomas, sendo criado originalmente em uma língua, possuindo versões em outros idiomas. A construção de tesauros multilíngues é adequada em situações nas quais há “usuários locais e remotos inseridos em contextos sócio-históricos, culturais e linguísticos distintos” (BOCCATO; BISCALCHIN, 2014, p. 238). Do ponto de vista de sua estrutura, um tesauro é um vocabulário organizado e dinâmico de conceitos, e termos que os representam, possuindo relações semânticas que os interligam. Essa estrutura é composta por quatro elementos: (1) uma terminologia, composta pelos descritores preferidos e não-preferidos; (2) uma estrutura gramatical, que determina a forma de apresentação e composição dos descritores; (3) uma rede paradigmática (a priori), para indicar relações essenciais e estáveis entre conceitos; (4) uma rede sintagmática (a posteriori), para determinar as relações contingentes entre descritores, válidas apenas em determinado contexto de uso. Svenonius (2000) afirma que a junção desses elementos faz com que não exista qualquer descritor em um tesauro sem ter ligação com outro, diretamente relacionado com seu significado (conceito). Contudo, pode haver circunstâncias nas quais o tesauro é o único instrumento para acesso à informação, sendo necessário incluir termos ou conceitos órfãos em sua estrutura, visando a possibilitar a recuperação de informação considerada importante (MOREIRA; MOURA, 2006). Dessa forma, a prática de construção de tesauros nem sempre preserva o princípio descrito por Svenonius (2000), pois as diretrizes adotadas serão dependentes da especificidade do propósito de sua elaboração, de seu uso e domínio. Ainda do ponto de vista de sua estrutura, um tesauro tradicional apresenta uma terminologia própria, através dos seguintes campos: (a) Descritor preferido: termo escolhido para representar um conceito no tesauro, de forma preferencial, e que será utilizado na indexação e na recuperação de determinado assunto; antes do descritor preferido, constará a sigla USE; 135 (b) Descritor não-preferido: termo que, embora represente o mesmo conceito que um descritor preferido, não é autorizado no momento da representação conceitual, para minimizar dispersão de sinônimos; antes do descritor não-preferido, constará a sigla UP (usado para); (c) Nota de escopo (NE): apresenta uma definição do descritor ou uma orientação sobre como utilizá-lo em uma indexação; (d) Termo genérico (TG): indica que há relação hierárquica entre conceitos, representando um conceito mais abrangente; (e) Termo específico (TE): indica um ou mais conceitos subordinados ao conceito mais genérico na hierarquia; (f) Termo relacionado (TR): indica que há relações não hierárquicas entre conceitos ou não equivalência entre descritores, determinando a existência de outro tipo de associação; usado para orientar o usuário (indexador ou usuário final) quanto às possibilidades de encadeamento de eventos ou fenômenos, limitando ou expandindo uma busca. A partir desses campos, é possível estruturar um sistema de conceitos capaz de representar o conhecimento de um dado domínio. Essa estruturação é realizada a partir de um conjunto de regras e princípios de contextualização, tendo como garantias as sintetizadas por Boccato e Biscalchin: a) consulta a fontes de informação de diversas naturezas, sejam elas científicas e de divulgação (livros, periódicos, dicionários, etc.), em formatos impresso e eletrônico, disponíveis em bibliotecas reais, digitais e virtuais; sites institucionais e demais categorias de importância na área do vocabulário; fontes de informação desenvolvidas em ambiente colaborativo, na Internet, como blogs, twitters, etc. (princípio da garantia literária); b) levantamento dos termos livres e controlados mais empregados pelos usuários nas buscas e que são armazenados nos históricos das bases de dados e dos catálogos on-line (garantia de uso); c) identificação dos termos que caracterizam e refletem o ambiente/contexto de uma organização (garantia organizacional); d) identificação dos termos que retratam o consenso científico em cada área científica especializada (garantia acadêmica); e) identificação dos termos que representam a cultura em que o usuário está inserido ou um conjunto deles (garantia cultural) (BOCCATO; BISCALCHIN, 2014, p. 242, negritos da autora desta tese). Ao construir um tesauro ou na reestruturação de um tesauro já existentes, é importante levar em consideração todas as garantias que possam resultar em um instrumento mais representativo da área modelada e do objetivo proposto. Em âmbito corporativo, Alvarenga e Dias (2012) apontam que a garantia literária pode ser denominada garantia documental, uma vez que no mapeamento da realidade empresarial devem ser incluídos tanto a literatura técnico-científica quanto documentos tais como os administrativos, políticos e legislativos. As autoras acrescentam, ainda, a garantia 136 profissional, que se traduz no conhecimento tácito dos especialistas envolvidos nos distintos subsistemas da empresa Essas garantias irão determinar um conjunto de conceitos (terminologia) que, aliadas ao uso de normas e diretrizes, permitirão a construção de um tesauro mais bem estruturado e com um domínio mais representativo para o usuário. 5.6.1.3 Relato sobre diretrizes para a construção de tesauros A organização de manuais e normas para a construção de tesauros foi realizada de forma contínua, em resposta a uma demanda por orientações para a prática dessa atividade. O primeiro esforço observado, segundo Lancaster (1986), ocorreu quando houve a publicação do tesauro TEST, em 1967, pois, concomitantemente à construção do tesauro, foi elaborado um manual para orientar essa atividade. Esse manual era composto por diretrizes que serviram de base para a preparação das normas que foram produzidas pela Unesco, em 1973, e pela American National Standardization Institute (ANSI), em 1980. Depois disso, as primeiras diretrizes para a construção de tesauros monolíngues foram compiladas pela United Nations International Scientific Information System (UNISIST), da UNESCO, em 1971, com o título Guidelines for Establishment and Development of Monolingual Thesauri for Information Retrieval. Em seguida, foram publicados os dois mais conhecidos manuais de construção de tesauros: o de Aitchison e Gilchrist (1972), intitulado Thesaurus construction: a practical manual, e o de Lancaster (1972), denominado Vocabulary control for information retrieval. Destaca-se que, em 1993, as diretrizes compiladas pela UNESCO foram traduzidas para o português pelo Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT), e o documento foi intitulado “Diretrizes para o Estabelecimento e Desenvolvimento de Tesauros Monolíngues”. Em 1974, ocorreu a publicação da norma internacional elaborada pela International Organization for Standardization (ISO) 2788, intitulada Guidelines for the establishment and development of monolingual thesauri. Seu principal objetivo foi oferecer diretrizes para a representação dos conceitos sem, contudo, indicar um modelo de dados específico. Sua segunda e última edição, de 1986, serviu de base para a revisão da norma americana ANSI/NISO Z39.19, publicada em 1993. Também no ano de 1974, a subcomissão do Committee Z39 (hoje National Information Standards Organization – NISO), da American National Standards Institute, publicou a primeira norma americana, a ANSI/NISO Z39.19. Em 1980, essa norma foi revisada por Madeline Henderson (AITCHISON; CLARKE, 2004). Sua segunda edição foi publicada somente em 1993, com o título Guidelines for the Construction, Format, and Management of Monolingual Thesauri. Em sua terceira edição, a norma ANSI/NISO Z39.19, 137 em 2003, forneceu diretrizes para apoiar as necessidades de uso de tesauros como instrumento para o acesso e a recuperação de informações em ambientes eletrônicos. Na sua quarta edição, editada em 2005, foram incorporados os primeiros aportes para a interoperabilidade entre vocabulários e sistemas, tipos de formatos de apresentação, orientações para o gerenciamento da atividade e o refinamento e manutenção das relações entre os termos. Neste ponto é importante destacar que, em 1984, a primeira diretriz brasileira foi elaborada pelo IBICT, fundamentada nos princípios da British Standards Institution – BSI 5723 (1979), que era uma tradução da ISO 2788. Por sua vez, para a construção de tesauros multilíngues, foi compilada, em 1985, a norma ISO 5964, com o título Guidelines for the establishment and development of multilingual thesauri, que foi adotada em diversos países. Na Grã-Bretanha, uma comissão do British Standards Institution (BSI) elaborou uma norma de construção de tesauros para substituir as British Standards (BS) 5723 e 6723, uma vez que essas diretrizes eram idênticas às americanas ISO 2788 e ISO 5964, respectivamente. Assim, entre os anos de 2005 e 2008, a comissão do BSI publicou a BS DD 8723, intitulada Structured vocabularies for information retrieval; Guide; Exchange formats and protocols for interoperability, que cobriu a construção de tesauros mono e multilíngues, dividida em cinco partes: (1) em 2005: definições, símbolos e abreviaturas; (2) em 2005: tesauros, incluindo e ampliando tudo que havia na BS 5723 e na ISO 2788; (3) em 2007: outros vocabulários; (4) em 2007: interoperabilidade entre vocabulários, abrangendo o conteúdo multilíngue das normas BS 6723 e ISO 5964, além de orientações sobre o mapeamento entre diferentes tipos de vocabulários; (5) em 2008: formatos de intercâmbio e protocolos de interoperabilidade, fornecendo um modelo de dados e formato para facilitar o intercâmbio de dados. Em 2007, quando a ISO iniciou os trabalhos para revisar e unificar as normas ISO 2788 e ISO 5964, a comissão responsável resolveu usar como base a norma BS 8723. Esse empreendimento deu origem à mais recente norma internacional para construção de tesauros mono e multilíngue, a ISO 25964, que atualizou, revisou e substituiu as normas ISO 2788, ISO 5964 e partes da BS 8723, tornando as duas primeiras obsoletas. A norma ISO 25964 foi elaborada, em conjunto, por membros de quinze países, e é composta por duas partes: (1) Parte 1, Thesauri for information retrieval, em 2011: Esta primeira parte da norma abrange todos os aspectos do desenvolvimento de um tesauro, mono e multilíngue, estabelece as diferenças entre conceitos e termos, reforçando e esclarecendo que, nos tesauros, as relações hierárquicas e associativas 138 ocorrem entre conceitos, e não entre termos, e inclui também um modelo de dados e um esquema EXtensible Markup Language (XML) para troca de dados. (2) Parte 2, Interoperability with other vocabularies, em 2013: Nesta segunda parte, complementam-se as diretrizes sobre interoperabilidade, iniciadas na primeira parte com o modelo de dados, e estão incluídas recomendações referentes aos fatores que a afetam, em especial as orientações acerca do armazenamento dos recursos, da fusão de vocabulários controlados, do mapeamento dos conceitos entre distintos tesauros e entre outros tipos de vocabulários. A Figura 12 apresenta uma síntese do histórico de elaboração de diretrizes para a construção de tesauros, mono e multilíngues, a partir do que já foi apresentado neste Subcapítulo. FIGURA 12 – Linha cronológica das diretrizes para construção de tesauros Fonte: elaborado pela autora desta tese, com base na literatura estudada. 139 Observa-se que, junto às diretrizes, foi incluído o Simple Knowledge Organization Systems (SKOS), um modelo de dados utilizado para expressar a estrutura conceitual básica de diversos tipos de SOCs, entre estes, do tesauro. O SKOS foi lançado entre 2004-2005 e, em sua versão de 2009, possui uma extensão XL (eXtension for Labels) que possibilita o uso de propriedades da aplicação Resource Description Framework (RDF), criando expressões de relações que podem ser interpretadas (legíveis) por máquinas, auxiliando na interoperabilidade entre diferentes vocabulários. A inclusão do SKOS se justifica, porque o modelo permite a representação de relações semânticas entre os conceitos de forma muito semelhante à atribuição de relações hierárquicas e associativas, recomendadas na mais recente norma para construção de tesauros, a ISO 25964 (2011; 2013). De forma geral, todas as diretrizes e normas para a construção de tesauros estabelecem importantes recomendações para a formalização e atribuição de relações semânticas entre conceitos que irão compor o sistema de conceitos do tesauro. Nesse contexto, tanto as normas internacionais quanto a literatura (DAHLBERG, 1979; MOTTA, 1987; DODEBEI, 2002) apontam que existem dois métodos básicos para o mapeamento da terminologia do domínio e para a organização da estrutura semântica dos conceitos: o método dedutivo (top-down) e o método indutivo (bottom-up). No método dedutivo, considerado uma forma clássica de divisão lógica, o universo terminológico do domínio é considerado como um todo. Nessa abordagem, as classes gerais ou facetas, utilizadas para a divisão e a organização dos conceitos, são previamente definidas, a partir de uma premissa maior (mais geral) ou uma concepção teórica, concebida pelo consenso dos especialistas do domínio, ou seja, com endosso do usuário. Posteriormente, os termos coletados, que efetivamente irão compor a terminologia do domínio, são incorporados às suas respectivas classes gerais ou facetas. Por sua vez, o método indutivo tem por base a garantia literária, cuja abordagem permite o mapeamento e a compilação da terminologia em documentos do domínio (artigos científicos e técnicos, teses e relatórios técnicos), para a extração de termos. Depois de validados, esses termos são incorporados e organizados em classes gerais ou facetas, conforme suas semelhanças e diferenças. As diretrizes da norma ISO 25964 (2011) destacam que, ao iniciar a construção da estrutura hierárquica do tesauro, a questão maior é decidir sobre o uso do método dedutivo ou do método indutivo. Segundo explicitado na norma, o método dedutivo pode garantir uma maior cobertura e equilíbrio para atender ao escopo desejado, sendo útil quando se pode contar com o apoio de especialistas da área. Por outro lado, o método indutivo tende a demonstrar particularidades do domínio, apontando também para relações associativas entre hierarquias, que podem influenciar a determinação do nível das classes mais gerais na estrutura do tesauro. Sendo assim, a referida norma, assim como as autoras 140 Dahlberg (1979) e Dodebei (2002), sugerem que os dois métodos sejam aplicados em conjunto, iniciando-se com um esboço da estrutura de nível mais genérico, ou seja, com o método dedutivo, com a determinação das classes mais gerais. Somente depois, recomendam-se prosseguir com as deliberações sobre as facetas dos níveis mais específicos da hierarquia, aplicando o método indutivo. Nesse processo, as classes mais genéricas podem ser reformuladas, visando a atender às demandas que emergem com a identificação de termos mais específicos. As diretrizes e as autoras recomendam também que pode ser mais eficiente trabalhar, separadamente, com grupos (clusters) de hierarquias de termos, adicionando aos termos de cada grupo as suas relações de equivalência e as hierárquicas para, depois, introduzi-los no conjunto da estrutura completa. No que diz respeito às relações associativas, a determinação delas deve esperar um estágio mais avançado de organização da estrutura da terminologia do domínio, uma vez que elas não podem ser aplicadas ou evidenciadas no início da construção do sistema de conceitos. Sendo o estabelecimento de relações semânticas em tesauros de interesse especial nesta pesquisa, pois são a base estrutural e o ponto fundamental na modelagem desse instrumento, o próximo Subcapítulo apresenta o tema Relacionamentos nos Tesauros. 5.7 RELACIONAMENTOS NOS TESAUROS O termo “relações” ou “relacionamentos” possui um sentido amplo, que abarca uma pluralidade de conexões entre objetos63, e cada relação contém noções semânticas, lexicais e cognitivas específicas. Nesse sentido, Green (2001) atesta que qualquer relacionamento é uma associação entre duas ou mais entidades ou entre duas ou mais classes de entidades. Para especificar um relacionamento, temos de ser capazes, em primeiro lugar, de designar todas as partes vinculadas pelo relacionamento e, em segundo lugar, de especificar a natureza dessa relação (GREEN, 2001, p. 3). Percebe-se que a autora sugere a necessidade da determinação do conjunto de elementos envolvidos no relacionamento e das suas propriedades: (1) reflexivo (se relaciona consigo mesmo); (2) transitivo (transmite relação); ou (3) simétrico (possui relação de igualdade). Apenas após a identificação da propriedade, Green (2001) recomenda especificar a natureza da relação, identificando-se o seu significado. Os relacionamentos são elementos importantes na construção de tesauros que, como já apontado anteriormente, são elaborados para possibilitar a comunicação entre a informação e o usuário, pelo compartilhamento de um mesmo vocabulário. Os tesauros têm como objetivo “organizar os conceitos já consagrados na literatura, apresentando as 63 Um objeto é qualquer elemento que aponta alguma entidade (abstrata ou concreta) do domínio de interesse do problema em análise. 141 relações existentes entre eles, quer sejam de subordinação ou paradigmáticas quer sejam de coordenação ou sintagmáticas” (DODEBEI, 2002, p. 42). As redes paradigmáticas são compostas por relações lógico-semânticas, tais como as relações gênero/espécie, todo/parte e de oposição, que são atribuídas a priori e servem à organização dos conceitos. Já as redes sintagmáticas são formadas pelas ligações entre conceitos, validadas no contexto. Sendo assim, são atribuídas a posteriori, durante a modelagem do domínio, quando se representam as relações funcionais que descrevem conteúdos de informação. Green (2008) acrescenta que, no campo de estudos da BCI, as relações paradigmáticas são consideradas um conjunto finito de classes (hierárquico e de equivalência), enquanto as relações sintagmáticas são em número bem maior, formando uma classe aberta à grande variedade de tipos possíveis de relacionamentos associativos. Aranalde (2009) destaca que Kant indicou a existência de relações recíprocas entre os conceitos e os objetos, mas que elas ocorrem a partir do entendimento das coisas, e não das coisas em si. Sobre esse tema, Moreira e Lara (2011) destacam que: Kant propôs [...] a combinação dos relacionamentos num julgamento, considerando que a realidade se dá na possibilidade de emissão de juízos, afirmações ou negações. Em outros termos, não basta apenas que algo esteja num contexto de tempo e de espaço [...], antes é preciso que se possam emitir juízos a seu respeito (MOREIRA, LARA, 2011, p. 489). Percebe-se que, na visão de Kant, o contexto de tempo e de espaço é um problema do particular que, por meio de juízos da razão, chega-se ao todo universal, pois a natureza é entendida como um organismo vivo. Assim, a natureza é múltipla e diversa e composta por particulares. Nesse sentido, no seu livro Crítica da Faculdade de Juízo (KANT, 1997), Kant desenvolve o conceito de juízo reflexionante, que parte do conceito de finalidade para se pensar as coisas da natureza, envolvendo, assim, a teoria e a prática. Dessa forma, a natureza, e as relações dos fenômenos existentes nela, são refletidas em situações empíricas, a partir de princípios racionais e universais. Dependendo da situação empírica considerada, a natureza do objeto observado pode mudar, pois, enquanto um objeto pode significar “um fato” em determinado ambiente, em outro, ele poderá ser interpretado como um “juízo de valor”. Logo, em cada contexto serão observadas diversos tipos de propriedades, fenômenos e relações. A compreensão desse fato já é observada na literatura sobre construção de tesauros, pois a modelagem de um domínio e a determinação do conjunto de relacionamentos que o representam é realizada a partir do contexto de uso. Para exemplificar, considerando que o domínio “carro” fosse modelado para consulta por diferentes públicos, esse domínio poderia ser modelado a partir de distintas propriedades: (1) para os mecânicos: marca, modelo, potência ou cilindrada; (2) para o Departamento de Trânsito: placa, proprietário, marca, modelo, cor e número de chassi. Dessa forma, a 142 abstração dos atributos de um objeto vai, necessariamente, diferir de um contexto de uso para outro, assim como os relacionamentos entre os distintos conceitos e termos. Encontram-se contribuições sobre a determinação de relacionamentos desde a época de Aristóteles, que acreditava ser a lógica (que ele denominava de analítica) uma ferramenta para a Ciência e para a aquisição de conhecimento sobre qualquer objeto ou fenômeno. Assim, Aristóteles demonstrou a relação formal do raciocínio a partir das premissas relacionais: se todo B é A e se todo C é B, todo C é A. Nesse caso, a lógica não determina a validade do conteúdo do argumento, mas, sim, a validade de uma conclusão advinda de argumentos propostos. Barnes (2001) aponta que Aristóteles usou a lógica para demonstrar a composição de um objeto a partir de outros objetos, tendo chegado a dez categorias: substância, quantidade, qualidade, relação, lugar, tempo, posição, ter, agir e paixão (ou sofrer). Assim, a categoria substância dá origem às demais categorias, que são dependentes dela, pois a substância refere-se à essência, enquanto as outras são recortes privilegiados e lógicos sobre ela. Para essa análise lógica, Aristóteles sugere o uso dos métodos dedutivo (do geral para o particular) e do indutivo (do particular ao geral), que devem ser demonstrados por meio de axiomas, com o objetivo de se identificarem as relações entre objetos e propriedades, assim como as relações de causa ou efeito (BARNES, 2001). Dessa forma, Aristóteles procura compreender a realidade de uma maneira relacional orgânica, buscando a sua unidade na variedade, na coesão e na hierarquia. Nesse contexto, Aristóteles determinou quatro predicados para a determinação de relações hierárquicas: gênero, propriedade, definição e acidente. Já para as associações entre os diversos objetos, o filósofo cria a teoria das causas, que é composta por: (1) causa material: determina aquilo de que uma coisa é feita; (2) causa formal: indica o que faz com que uma coisa seja o que ela é; a sua essência, ideia ou definição; (3) causa eficiente: a causa motora ou aquilo que transforma a matéria; (4) causa final: aponta o produto ou a consequência ou a tendência da ação ou atividade. Para Aristóteles, todas essas causas se originam na causa maior, que é a existência da substância. Discorrendo também sobre como determinar uma relação de equivalência, Aristóteles afirma que duas proposições, A e B, são logicamente equivalentes somente se seus valores de verdade forem obtidos de forma idêntica, ou seja, se o valor de verdade for o mesmo para cada uma das possíveis combinações das variáveis que formam as proposições (BARNES, 2001). Ainda é possível entender que, usando a dialética, Aristóteles tratou as oposições como relações de equivalência. Para o filósofo, investigar os opostos é estabelecer o valor de verdade ou falsidade de um conhecimento, posição que é compartilhada por Tristão, Fachin e Alarcon (2004). Nesse sentido, argumentos opostos 143 reivindicam análises similares, pois são examinados os mesmos argumentos, porém em direções opostas, o que exige a eleição correta de uma das duas coisas. Para vincular conceitos aos pares, Farradane (1980) abordou a questão da determinação de relações sob o aspecto sintático de organização e com base na psicologia do pensamento. Nessa perspectiva, o autor afirma que os sistemas de recuperação da informação (SRI) necessitam de dois requisitos de indexação: um método de controle de vocabulário e outro método para a estruturação dos conceitos desse vocabulário, pois o sentido dos conceitos pode ser expresso pelas relações estabelecidas entre pares de conceitos. Segundo o pesquisador, as relações podem proporcionar qualquer combinação de conexões para expressar todas as possíveis vinculações existentes entre dois conceitos, em um dado domínio. Para Farradane, há dois eixos de análise: (1) horizontal: há três estágios de vinculação (consciência, associação temporária e associação fixada); (2) vertical: há três estágios de vinculação (conceitualização concomitante, conceitualização não-distinta e conceitualização distinta). Dessa forma, os dois eixos combinados formam nove tipos de relações: (1) concomitância (justaposição mental); (2) equivalência (diferentes graus de sinonímia); (3) distinção (substituição); (4) comparação ou auto-atividade (associação temporária); (5) dimensão ou estado (posição no espaço ou no tempo); (6) ação (descrição do objeto ou da operação ou afetação de algo); (7) associação (relações não especificadas, propriedades abstratas e ações no passado); (8) pertencimento (todo-parte, gênero-espécie e propriedade física); (9) causação ou dependência funcional (causa-efeito ou produtos). Esse conjunto de relações foi criticado, sobretudo quanto à generalidade das relações (FOSKETT, 1973) e às discrepâncias referentes às suas granularidades e ambiguidades (MYAENG; MCHALE, 1992). A autora desta tese concorda com essas críticas no sentido de que é necessária a explicitação de regras mais claras para a distinção e desambiguação entre os diferentes tipos de relacionamentos, visando a delimitar e orientar o uso desses relacionamentos. Nesse sentido, Svenonius (2000) aponta que, nos tesauros, é importante estabelecer o significado dos relacionamentos, a partir de princípios lógicos e semânticos. Para essa autora, somente assim o conjunto de relações vai representar a semântica relacional do instrumento, evitando-se inconsistências estruturais. Esse pensamento também é partilhado por Kobashi (2007), que assegura que, na construção de tesauros, as relações entre as unidades polilexicais64 devem ser explicitadas, não para que se aja de forma arbitrária e prescritiva, mas para que sejam funcionais em um dado domínio. 64 Unidade polilexical é uma expressão linguística formada por um núcleo terminológico e seus respectivos coocorrentes, que são as variações denominativas que podem ser atribuídas a essa expressão, cujo significado é equivalente. 144 Discorrendo sobre a estrutura dos tesauros, Dahlberg (1978b) afirma que as características de um objeto (referente) podem ser estruturadas de forma a criar uma “cadeia de conceitos”, uma vez que cada característica é parte do conceito, mas também é considerado um conceito. Para a autora, toda vez que, na definição de um conceito, houver referência a outro conceito, haverá relacionamento entre eles. Assim como recomendado por Aristóteles, também Dahlberg aconselha uma análise de caráter híbrido, usando os métodos dedutivo e indutivo (descritos no Subcapítulo 5.6.1.3), visando a obter a predicação conceitual. A partir dessa premissa, Dodebei (2002) sistematizou as relações afirmando que “em função de seu conteúdo ou significado, as relações entre conceitos se dão mediante comparações: lógicas, formais, abstratas ou semânticas” (DODEBEI, 2002, p. 91). Dahlberg (1979) também sugere a aplicação de uma abordagem relacional para a modelagem dos relacionamentos de um domínio, em detrimento dos métodos dedutivo ou indutivo. Para a autora, a abordagem relacional “parte de um aspecto formal, de um aspecto categorial. Um sistema baseado na abordagem relacional é fácil de ser construído, reconhecido e utilizado [...] [garantindo] uma maior objetividade” (DAHLBERG, 1979, on- line). Nessa mesma abordagem, Dilza Fonseca da Motta (1987) propõe um método relacional para ser utilizado na identificação de relações entre conceitos na construção de tesauros. A autora definiu seu método como um Método analítico que consiste na análise das definições dos conceitos que integrarão o sistema, de forma a identificar suas características e a estruturação desses conceitos, tendo em vista as relações existentes entre eles (MOTTA, 1987, p. 39). Nota-se que o método relacional proposto por Motta (1987) possibilita a identificação das relações, a partir das definições dos conceitos, podendo ainda ser usado para a estruturação do sistema de conceitos. Em síntese, o método relacional envolve três elementos: (1) o conceito; (2) a análise conceitual; e (3) a definição do conceito. Para permitir uma análise conceitual consistente, a definição dos conceitos deve incluir sua intensão, indicando a soma de suas características, delimitando as fronteiras do conceito no domínio estudado (MOTTA, 1987). A autora acredita que, sabendo-se a constituição do conceito, através da definição, torna-se possível determinar as relações entre os termos de um sistema classificatório. Percebe-se que, de forma semelhante a Dahlberg, Motta também aponta que haverá relação entre conceitos toda vez que, para o entendimento da definição de um, for necessário incluir outro conceito. Ademais, observa-se, nas ideias até aqui expostas, congruência entre as visões de Aristóteles, Dahlberg, Motta e Dodebei, no sentido de que as relações entre conceitos são determinadas a partir de um método que pode ser denominado analítico-relacional. Nessa perspectiva, para modelar um domínio, é preciso iniciar pela 145 análise do fenômeno que se quer conhecer e representar, que será concretizado nas definições dos conceitos que descrevem esse fenômeno. Nessas definições devem estar representadas, utilizando-se um raciocínio lógico e formal, partindo-se de um aspecto categorial do fenômeno, as relações que cada conceito mantém com os outros conceitos, criando-se, assim, um sistema de conceitos. Encontra-se, na literatura, a sugestão de diferentes subdivisões e classificações para a determinação das relações entre conceitos na construção de tesauros, conforme pode ser observado no Apêndice A, “Propostas de Sistematização de Relações em Tesauros, por data”. Não obstante essas diferentes sistematizações, é possível perceber que todas expressam, basicamente, três tipos de relacionamentos: de equivalência, hierárquica e associativa. Portanto, nos próximos Subcapítulos passa-se a descrever esses três tipos de relacionamentos, evidenciando, sobretudo, a sua base teórica. 5.7.1 Relações de equivalência Em discursos de especialidade, assim como na língua geral, é frequente haver ocorrência de equivalências, originadas pelas modificações de propriedades de um conceito ou pela criação de um novo conceito, processo algumas vezes resultante da internacionalização da área em questão. Essa ocorrência reflete o aspecto dinâmico da terminologia de diferentes domínios, e é necessário que as equivalências estejam representadas no tesauro que modela tal campo de conhecimento. Essa representação é importante para a identificação e o controle da polissemia, minimizando as inconsistências e ambiguidades na estrutura do tesauro. Contudo, essa não é uma tarefa fácil, como esclarece Svenonius (2000), pois o problema da equivalência é saber quanta liberdade se pode ter quando se decide determinar uma equivalência entre dois termos. Para a autora, enquanto em algumas situações a equivalência parece óbvia, em outras, os dois termos são tão próximos em seus significados (conceitos) que parecem se referir ao mesmo referente sem que seja, no entanto, o caso. Para a pesquisadora, isso acontece porque, na linguagem natural, as equivalências totais são raras. Esse fenômeno também pode ser observado nos domínios de especialidade. Em um tesauro tradicional, as relações de equivalência acontecem entre um descritor preferido e um não-preferido, sendo que este último pode substituir o primeiro, pois, nesse caso, o descritor não-preferido é considerado como um sinônimo, total ou parcial, do mesmo conceito. Corroborando essa ideia, Dodebei (2002, p. 91) aponta que há relação de equivalência quando “um conceito pode ser representado por vários símbolos distintos ou quando se quer reduzir, por questões pragmáticas, os níveis de implicação 146 conceitual”. Ademais, considera-se que a equivalência envolve um aspecto comparativo, uma vez que toda igualdade ou semelhança pressupõe uma comparação. Essa comparação pode ocorrer entre dois objetos, dois indivíduos ou situações (reais ou não), quando os elementos são comparados em função de suas qualidades, atributos ou funções. Nos distintos casos de equivalência, Svenonius (2000) explica que eles podem ter as propriedades: simétricos, reflexivos e transitivos. Green (2001) explica essas propriedades da seguinte maneira: (i) simétrico, quando, estando X relacionado com Y, também Y está relacionado com X; (ii) reflexivo, quando todo elemento de E se relaciona consigo mesmo; (iii) transitivo, quando se pode afirmar que, se X está relacionado com Y e Y está relacionado com Z, então, X está relacionado com Z. Nesse sentido, manter a ligação entre termos equivalentes é importante para o mapeamento de um domínio, assim como no âmbito da recuperação de informações (SVENONIUS, 2000). Neste caso, conservar esse elo permitirá que a busca por qualquer um deles recupere informações referentes a todos os outros que estão conectados entre si. Sob a perspectiva do uso de símbolos convencionais para representar as relações de equivalência, usualmente são utilizados USE, indicando o descritor preferencial, e USADO POR ou UP, apontando os descritores não-preferenciais. Ademais, a Norma 25964 (2011) já evidencia a tendência de explicitação de relações ao sugerir que outras representações de equivalência sejam determinadas: (a) VARIANTE ORTOGRÁFICA ou VO; (b) ERRO DE SOLETRAÇÃO ou ES; (c) ABREVIAÇÃO ou AB; e (d) FORMA COMPLETA DO TERMO ou FCT. De forma sintética, as relações de equivalência representam a existência de mais de um descritor para um mesmo conceito, e englobam todos os tipos de (1) sinonímia (total e parcial), (2) oposição, (3) correspondência em outro idioma e (4) variações linguísticas. A seguir, apresenta-se cada uma delas em detalhes: (1) Sinonímia: esse fenômeno ocorre entre dois descritores (preferido e não- preferido) quando um mesmo conceito pode ser representado por diferentes descritores. Destaca-se que o fenômeno da sinonímia que ocorre em um tesauro é diferente daquele da linguagem natural. Na linguagem natural, a sinonímia está restrita à situação na qual duas ou mais palavras apresentam significados iguais ou semelhantes, no contexto de uso de uma mesma língua geral, com mesmo conceito, ou que aludem ao mesmo referente. Na modelagem de um tesauro, a sinonímia acontece de forma semelhante, porém é possível criar, em domínios de especialidade, um tipo de sinonímia contingencial (que alguns autores denominam artificial), específico para aquele contexto de uso e propósito pretendido, que indica uma relação funcional entre descritores. Nesses casos incluem-se os termos quase- sinônimos que, preferencialmente, devem ser utilizados em áreas temáticas não tão 147 específicas do domínio do tesauro. Assim, a determinação do tipo de equivalência por sinonímia que acontece entre descritores preferenciais e não-preferenciais é dependente do grau de ligação entre os seus significados, a saber: (a) sinonímia total: duas unidades lexicais são sinônimas absolutas, com mesma denotação e conotação, quando uma pode substituir a outra em dado contexto, pois é muito raro encontrar sinônimos perfeitos, que possam ser utilizados em qualquer contexto; a ocorrência desse fenômeno é mais frequente na terminologia técnica. Exemplos: Origem linguística diferente: motorista – chofer; freedom – liberty; Nome popular e científico: aspirina – ácido acetilsalicílico; sal – cloreto de sódio; Grafias diferentes: conceptual – conceitual; contacto – contato; Uso de abreviaturas: UFMG – Universidade Federal de Minas Gerais; Razão social e nome fantasia: Telefônica Celular – TELERJ Celular S/A. Tradução: software – programa. (b) sinonímia parcial: quando duas unidades lexicais são sinônimas de forma limitada ou incompleta, sendo que uma pode substituir a outra apenas em ocasiões especiais, em uma situação específica. Exemplos: Quase sinônimos: significados que são, em geral, diferentes, mas tratados como equivalentes em uma situação específica: mulher – patroa; Termos variantes: água do mar – água salgada; Termos contínuos: meteoros – meteoritos – meteoroides (contínuo); Termos antônimos: nascimento – morte. (c) Postagem genérica (ou coordenação): também considerada uma relação de sinonímia, quando o descritor que representa uma classe e os descritores que a compõem são considerados como um conjunto de sinônimos. Assim, o descritor referencial da classe (sentido mais amplo) tem o papel de descritor preferido e os outros de não-preferidos. Por exemplo, pode-se usar o descritor “Ceras” em lugar de descritores mais específicos como “Ceras Vegetais”; ou usar o descritor “Mobiliário” ao invés de descritores mais específicos como “Cadeiras, Mesas ou Camas”. Esse tipo de estratégia pode ser utilizada para diminuir o número de termos a serem utilizados na modelagem do tesauro, contudo, preferencialmente, deve ser empregado em áreas temáticas não tão específicas do domínio do tesauro. (2) Oposição: a relação de equivalência por oposição acontece entre o significado de duas unidades lexicais, que apresentam traços semânticos que permitem relacioná-las. Dodebei (2002) aponta que, nos tesauros, não é comum haver destaque para 148 os relacionamentos de antonímia e que “tais relações [podem] aparecer tanto em categorias distintas quanto fazendo parte de uma mesma estrutura hierárquica, tal como as hierarquias chamadas dicotômicas” (DODEBEI, 2002, p. 94). Nota-se que não há consenso sobre o uso ou não da relação de oposição como um tipo de equivalência, pois mesmo Svenonius (2000) a classifica como uma relação associativa. Porém, acreditando que toda oposição é uma forma de comparação entre conceitos, e em concordância com Tristão, Fachin e Alarcon (2004), nesta pesquisa a relação de oposição é considerada um tipo de equivalência. Para identificar as relações de oposição, Aristóteles apontou alguns critérios: (1) a reciprocidade (relatividade entre os opostos); (2) a gradação (elemento intermédio entre os opostos); (3) a presença ou ausência de uma qualidade (abrange um elemento e não o torna oposto); (4) a afirmação versus a negação (o que o elemento tem de falso ou verdadeiro); (5) a implicação (evidencia que um elemento oposto não implica na existência de outro) (VARO, 2007, p. 57-58). Esses critérios podem orientar a identificação de relacionamentos de oposição, porém, deve-se ressaltar que a determinação desses relacionamentos depende do contexto de uso e irá variar conforme o ponto de vista e a orientação da modelagem. (3) Correspondência em outro idioma: a correspondência entre o significado de um termo entre idiomas diferentes ocorre em um tesauro multilíngue. Essas relações também podem ter graus diferentes de correlação entre o idioma fonte (da origem do tesauro) e o idioma alvo (da tradução). Nessa circunstância, podem acontecer distintas situações que devem ser levadas em consideração, tais como a sinonímia que aparece no idioma fonte, mas não acontece no idioma alvo, e vice-versa. Essa incidência se dá devido às diferenças de origens conceituais, identidades de cada cultura e de configuração linguística, originando estruturas semânticas que ora são idênticas, sendo simétricas, ora são não-idênticas, sendo assimétricas. O atual tesauro multilíngue AGROVOC é um exemplo dessa abordagem, pois nem sempre os descritores em um dos idiomas encontram correspondência nos idiomas disponíveis. Entende-se que, ao construir um tesauro multilíngue, é necessária uma modelagem conceitual que represente a complexidade semântica de cada idioma e cultura, respeitando-se e acatando-se as diferenças encontradas nas diferentes línguas. (4) Variações linguísticas: as relações de equivalência por variações linguísticas caracterizam-se pela presença de diferentes variantes, que “são diversas 149 maneiras de se dizer a mesma coisa em um mesmo contexto e com o mesmo valor de verdade” (TARALLO, 1986, p. 8). As variações linguísticas são objeto de estudo da Sociolinguística e, nos tesauros, podem acontecer entre dois ou mais descritores (SVENONIUS, 2000). Ao tratar tais variações, é preciso entender que qualquer linguagem é um meio de comunicação e, como tal, um fenômeno envolto em repercussões sociais. A sociedade é dinâmica, transforma-se ao longo do tempo e estabelece novas formas de se relacionar, às vezes, criando identidades próprias. Nesse sentido, não há uma única forma de se expressar um conceito, pois a linguagem está sempre sujeita a variações, seja por diferenças temporais (épocas diferentes), geográficas (diferentes lugares ou etnias), devido ao grupo social (contexto de uso) ou às diferentes situações de comunicação (formal ou informal, por exemplo). Castilho (2010) aponta que existem quatro tipos básicos de variações linguísticas: (a) geográficas (ou diatópicas): são as variações regionais, mudanças que ocorrem devido a características próprias de uma localidade (pequena cidade ou continentes inteiros). Exemplo: Holanda ~ Países Baixos; mandioca ~ macaxeira ~ aipim; (b) situacionais (ou diafásicas): decorrem do grau de formalidade da situação que envolve o ato comunicativo ou das circunstâncias da escrita ou da fala, tal como a forma de falar com professores ou com os amigos, por exemplo; (c) socioculturais (ou diastráticas): acontecem influenciadas pelos grupos sociais ou pelas distintas comunidades, e podem incluir modificações devido a fatores como classe social, educação, profissão, faixa etária, procedência étnica e marcas de gênero; por exemplo, linguajar jurídico; (d) históricas (ou diacrônicas): ocorrem ao longo do tempo ou quando um mesmo grupo social muda a forma de escrever ou falar, pois a linguagem é dinâmica, e faz surgir novas palavras, expressões e até significados novos para velhas expressões. Além desses tipos de variações, podem-se incluir: (1) gênero e número: aluno ~ aluna; casa ~ casas; (2) formação irregular de plural: mel ~ meles ou méis; (3) ordem direta versus ordem invertida: Doença de Alzheimer ~ Alzheimer, Doença (situação mais frequente em cabeçalhos de assunto). Finalizado este Subcapítulo sobre as relações de equivalência, passa-se a apresentar as relações hierárquicas. 5.7.2 Relações hierárquicas Segundo Svenonius (2000), as relações hierárquicas sempre foram de maior interesse para os filósofos, pois, para eles, o mundo da vida (organismos vivos, sociedade, política) possui forças que estabelecem valores que sempre obedecem a uma hierarquia. 150 Assim, as relações hierárquicas são caracterizadas pelos princípios de subordinação, que é o procedimento de subdivisão de um assunto (objeto) em subclasses (termos mais específicos), e de superordenação, que é a identificação das classes de nível mais alto (termos mais gerais). Corroborando com essa definição, a Norma NISO Z39.19 (2005) recomenda que as relações hierárquicas sejam determinadas com base em graus ou níveis de superioridade e de subordinação, ou seja, que um termo superordenado seja uma classe ou um todo, e que os termos subordinados sejam os membros ou peças da classe. As relações de hierarquia também incluem a noção de coordenação, que é a identificação do conjunto de classes e subclasses de mesmo nível. Como regra geral, todo descritor subordinado deve se referir à mesma natureza do conceito (ação ou adjetivo ou propriedade) do descritor superordenado. Por exemplo, Metais (material) e Metais não- ferrosos (material) podem ser relacionados hierarquicamente, porém, Metais (material) e Fundição (ação) não podem ser relacionados hierarquicamente, porque têm diferentes naturezas de conceitos. Quanto à formação dessa estrutura hierárquica, Campos (2001, p. 123) afirma que “se observa a relação existente entre dois termos com a finalidade de posicioná-los em uma estrutura sistemática, ou seja, quando existe uma precedência entre dois conceitos, o maior deve ficar acima do menor”. A forma hierárquica de organização facilita a compreensão de um domínio e auxilia na identificação de diversos relacionamentos. Svenonius (2000) acrescenta que as hierarquias são mecanismos eficazes para a navegação em ambiente web, maximizando a recuperação e a precisão no sistema, pois permitem aos usuários mover-se entre termos de níveis diferentes (entre os mais amplos e mais específicos). Com relação aos símbolos convencionalmente utilizados para representar as relações hierárquicas, nos tesauros tradicionais, elas são usualmente representadas por TERMO GENÉRICO ou TG, que indica o termo superordenado, e TERMO ESPECÍFICO ou TE, que aponta para o termo subordinado. Em alguns tesauros, já pode ser encontrada a determinação de outros símbolos, tais como: (a) para as relações hierárquicas genéricas: TERMO GENÉRICO DA RELAÇÃO GENÉRICA ou TGG (superordenado) e TERMO ESPECÍFICO DA RELAÇÃO GENÉRICA ou TEG (subordinado); (b) para as relações hierárquicas partitivas: TERMO GENÉRICO PARTITIVO ou TGP (superordenado) e TERMO ESPECÍFICO PARTITIVO ou TEP (subordinado); (c) para as relações hierárquicas de instância, pode-se usar: TERMO GENÉRICO DE INSTÂNCIA ou TGI (superordenado) e TERMO ESPECÍFICO DE INSTÂNCIA ou TEI (subordinado). Observa-se que, de maneira mais geral, as relações de hierarquia cobrem três situações diferentes e mutuamente exclusivas: (1) relação genérica; (2) relação partitiva; (3) relação de instância, que serão detalhadas a seguir: 151 (1) relação genérica: relação que indica o gênero e suas diversas espécies, subdividida em relações reflexivas, transitivas, assimétricas e taxonômicas, que estabelecem agrupamentos arbitrários, que ligam uma classe e seus membros ou espécies. O conceito de gênero inclui todas as características básicas que representam um grupo de seres ou objetos não-individualizados, que possuem características semelhantes que os tornam um conjunto. Já a espécie é um objeto específico, que pertence a dado gênero, mas se distingue dos outros por características próprias. No âmbito da construção de tesauros, Svenonius (2000) afirma que os relacionamentos do tipo gênero-espécie são relações lógicas de inclusão, sendo determinadas, de forma estrita, em dado domínio, possuindo, em todos os mundos possíveis, uma verdade atestada por sua definição, em uma relação paradigmática. Dahlberg (1979) acrescenta que as relações genéricas aparecem em especial em conceitos que denotam objetos ou abstrações, mas que também podem surgir ao se analisarem conceitos que denotam processos e propriedades. Dodebei (2002) acrescenta que se dois conceitos diferentes possuem características idênticas e um deles possui uma característica a mais do que o outro, então entre eles se estabelece a relação hierárquica ou relação de gênero-espécie [...] [que] pode também ser chamada de relação de abstração, uma vez que a cada degrau hierárquico abstrai-se uma característica a mais, como no exemplo: uma macieira é uma árvore frutífera que, por sua vez, é uma árvore (DODEBEI, 2002, p. 92). Percebe-se, assim, que as relações genéricas (de gênero) indicam ligação entre um objeto (referente) e suas espécies. Svenonius (2000) indica que esses relacionamentos podem ser apreendidos a partir de duas distintas situações: (1) todo-e-algum: FIGURA 13 – Relação genérica: todo-e-algum Fonte: elaborado pela autora desta tese. O exemplo da Figura 14 indica que todo tipo de ÁRVORE FRUTÍFERA é uma ÁRVORE, mas nem toda ÁRVORE é ÁRVORE FRUTÍFERA. (2) algum-e-algum: 152 FIGURA 14 – Relação genérica: algum-e-algum Fonte: elaborado pela autora desta tese. A Figura 14 demonstra que algumas espécies de FRUTA são consideradas VENENO65, assim como apenas algumas espécies de VENENO podem ser do tipo FRUTA. Nesse sentido, Dodebei (2002, p. 93) explica que esse tipo de relação pode ocorrer devido a características essenciais ou acidentais do tipo “animais de estimação (gênero) e gatos (espécie), já que todos os gatos são animais, mas nem todos os gatos são animais de estimação”. Assim, nesse caso, a característica essencial “animal” agrupa todos os gatos em nessa classe e a característica acidental “de estimação” subdivide o grupo dos gatos, pois nem todos os gatos são de estimação. No processo de determinação de relações do tipo gênero e espécie acontecem os fenômenos denominados hiperonímia (hiperônimo) e hiponímia (hipônimo). O termo “hiperônimo” é sinônimo de “superordenado”, nome dado ao termo cujo sentido inclui um ou mais termos hipônimos. A hiperonímia é uma relação de inclusão semântica entre duas palavras de uma língua ou domínio, que se estabelece baseada na menor especificidade do conceito de um deles (FERREIRA, 2009), partindo do genérico (hiperônimo) para o específico (hipônimo). O primeiro sempre se impõe ao segundo, criando uma relação semântica entre eles. Por exemplo, o hiperônimo “animal” tem relação com os hipônimos “cachorro, elefante, tubarão”; e o hiperônimo documento tem relação com os hipônimos “ata, carta, decreto, ofício, relatório”. Um hiperônimo pode substituir qualquer hipônimo em todos os contextos de uso, mas o contrário não é possível. Por sua vez, a hiponímia é uma relação de inclusão semântica entre duas palavras de uma língua, que se estabelece baseada na maior especificidade do conceito de um deles (FERREIRA, 2009), partindo do específico (hipônimo) para o genérico (hiperônimo). O primeiro conserva as características impostas pelo segundo, além de possuir suas próprias características diferenciadoras, criando uma relação semântica entre eles. Por exemplo, o termo “tubarão” tem relação de hiponímia com “animal”, pois o conceito de “tubarão” pressupõe o conceito de “animal”. Não 65 Algumas frutas são consideradas venenosas, tais como: (a) briônia: pode ser mortal ou pode atacar a flora intestinal com violência; (b) dulcamara: ataca o coração e contamina o sangue; (c) avezinho: bagas vermelhas que podem intoxicar ou até mesmo matar; (d) beladona: bagas pretas e brilhantes; apenas dois frutos podem matar uma criança; (e) ackee: usada na culinária caribenha que é potencialmente tóxica, podendo provocar hipoglicemia. 153 é possível a um hipônimo substituir um hiperônimo, e Silva e Sant’Anna (2009, p. 40) acrescentam que “embora um termo hiperônimo não implique, em geral, o seu hipônimo, ocorre, frequentemente, que o contexto situacional ou a modificação sintagmática do termo hiperônimo o determinará no sentido de um de seus hipônimos”. Ademais, em uma cadeia hierárquica, um hiperônimo pode, por sua vez, ser hipônimo em relação a outro conceito. (2) relação partitiva: relação entre o todo e suas partes, na qual estão incluídas algumas situações em que uma parte compõe um todo, em um dado contexto, sendo o todo o termo subordinante, e a parte, o termo subordinado. Assim, esse tipo de relação abrange os casos em que um conceito abarca outro conceito, de forma lógica e inerente, e os descritores que representam esses conceitos devem ser organizados em hierarquias, em que o todo é tratado como um termo mais abrangente. Na construção de tesauros, Dahlberg (1979) indica que as relações hierárquicas partitivas em geral incidem em objetos, pois podem ser segmentados, porém a autora alerta que eles também podem ser aplicados em casos especiais, tal como na divisão de uma área do conhecimento. Dessa forma, entende-se que as relações partitivas ocorrem sempre que um conceito estiver contido em outro, de forma independente do contexto, podendo os distintos conceitos ser ordenados de forma lógica, por subordinação. Dodebei (2002) acrescenta que as relações partitivas podem ser obtidas a partir das especificações das partes de um objeto natural (planta, animal), dos elementos de um produto (edifício, avião) ou de um setor organizacional (um Estado e suas cidades, uma empresa e suas seções). Nesse sentido, Campos, Gomes e Motta (2004) sugerem que as partes de um objeto podem ser subdivididas a partir de três critérios não mutuamente exclusivos: (1) de funcionalidade, no qual as partes estão restritas à sua localização espacial ou temporal (ex.: cabo de uma panela); (2) de homeomericidade, no qual as partes podem ser (2.a) homeômera, de uma mesma natureza (ex.: maçã e suas partes) ou (2.b) não-homeômera, de naturezas diferentes (ex.: uma floresta e as árvores que existem nela); (3) de separabilidade, no qual as partes podem ser separadas do todo (ex.: cabo de uma panela) ou não (ex.: no caso do aço e um carro). As autoras afirmam que esses relacionamentos podem ocorrer nas categorias “coisa”, “atividade” e “lugar”, a partir da determinação de distintas ligações, a depender do domínio modelado. De forma geral, as relações hierárquicas partitivas são transitivas e assimétricas (SVENONIUS, 2000) e, no processo de sua formação, acontecem os fenômenos de holonímia (holônimo) e meronímia (merônimo), com estrutura em níveis de com estrutura em níveis de superordenação, subordinação e coordenação. A holonímia é uma relação hierárquica semântica entre duas unidades lexicais de uma língua ou domínio, na qual uma denota o todo (holônimo), sem necessariamente impor suas características semânticas à 154 outra, considerada sua parte (merônimo). Sendo assim, a holonímia designa um todo em relação às partes, como, por exemplo: o conceito “corpo”, em relação às suas partes: cabeça, pernas, braços e pés. Já a meronímia é uma relação hierárquica semântica entre duas unidades lexicais de uma língua ou domínio, uma denotando uma parte (merônimo) e criando uma relação de dependência ao implicar a referência a um todo (holônimo) que inclui essa parte. Dessa forma, a meronímia designa a parte em relação ao todo, como, por exemplo: a parte “teclas” que infere o todo “teclado”; a parte “dente” que implica o todo “boca”. Uma das soluções para a sistematização da estrutura hierárquica empregada na modelagem de tesauros é o uso do rótulo nodal ou indicador de faceta (ou node labels, na NISO Z39.19, 2005). Esse elemento é utilizado na representação de uma classe de descritores sem, contudo, ser considerado também um descritor. Assim, o rótulo nodal é utilizado para essas subdivisões de classes, formadas a partir da natureza do conceito do rótulo nodal, por conjuntos de ocupações, funções ou outra natureza qualquer. Há dois tipos básicos: (1) base lógica: quando tanto o rótulo nodal quanto os descritores agrupados junto a ele se referem a conceitos do mesmo tipo, como, por exemplo: TRANSPORTE Por tipologia de carga TRANSPORTE DE CARGA TRANSPORTE DE PASSAGEIRO Por modalidade TRANSPORTE DE TRAÇÃO ANIMAL TRANSPORTE TERRESTRE (2) base funcional: quando o rótulo nodal é utilizado para agrupar tipos diferentes de conceitos que estão relacionados ao conceito mais amplo indicado pelo termo do rótulo nodal, como, por exemplo: BANCOS Operações RECOLHIMENTOS COMPULSÓRIOS COBRANÇA DE TARIFAS BANCÁRIAS COMPENSAÇÕES DE CHEQUES REGULARIZAÇÃO DE CADASTRO Os rótulos nodais são mais frequentes quando se constrói um tesauro com base na Teoria da Classificação Facetada, desenvolvida por Ranganathan, que tem um número de muitos milhares de termos (NISO Z39.19, 2005). Eles funcionam como indicadores que representam o conteúdo das facetas, ou seja, dos agrupamentos. E determinam o fundamento lógico aplicado na divisão de uma classe de descritores, mantendo um tipo especial de relação semântica entre eles. 155 (3) relação de instância: também denominada relação de exemplificação (LORENZON, 2011), e indica uma posição hierárquica de subordinação, na qual há ligação entre uma classe mais geral de objetos, eventos, propriedades ou fenômenos, sem que essa classe represente um todo, mas, sim, um conjunto. Dessa forma, não há a implicação de as instâncias serem partes dessa classe, porém, elementos desse conjunto. Essas relações têm um papel importante no sentido de que permitem agregar informações em nível conceitual, o que pode gerar conhecimento a partir de representações empíricas de um dado domínio. Ressalta-se que, de modo geral, o descritor mais genérico é um substantivo comum, e as instâncias são nomes próprios, como, por exemplo, o substantivo “Regiões Montanhosas”, que representa a classe geral, e suas instâncias, representadas por “Alpes” e “Himalaias” (ISO 25964, 2011), que são nomes próprios. Assim, a relação de instância representa uma exemplificação de uma classe de coisas, que faz uma referência não- denotacional aos exemplos que compõem essa classe. Outro fenômeno que pode ocorrer na determinação de relações hierárquicas é a poli-hierarquia, que está destacada no próximo Subcapítulo. 5.7.2.1 As poli-hierarquias Algumas vezes, torna-se inevitável levar em consideração as diferentes relações sob as quais um objeto pode estar representado, quando é necessário representar a sua multidimensionalidade. Nesse contexto, por razões lógicas, certos conceitos ou descritores podem estar em hierarquias de mais de uma classe (ou agrupamento ou categoria), de mesma natureza ou não, e, até mesmo, estar ligados a distintos domínios. Nesses casos, pode-se admitir mais de um critério de subdivisão, o que pode acontecer de duas formas básicas: (1) entre hierarquias de mesma natureza FIGURA 15 - Poli-hierarquia em relações todo-parte Fonte: NISO Z39.19, 2005, p. 50. 156 Analisando a Figura 15 percebe-se que a BIOQUÍMICA é formada pelas disciplinas BIOLOGIA e QUÍMICA, indicando a ocorrência de poli-hierarquia entre hierarquias de mesma natureza, que, neste caso, se dá entre relacionamentos partitivos. Dessa forma, deve-se pensar em conceitos que podem se articular em diferentes espaços. (2) entre relacionamentos de naturezas diferentes FIGURA 16 – Poli-hierarquia em relações de natureza diferentes Fonte: SOUZA, 2010, on-line. No exemplo da Figura 16, percebem-se ligações logicamente distintas, uma vez que, entre os termos OSSO e VÉRTEBRAS CERVICAIS, há uma relação de natureza gênero-espécie, e que, entre VÉRTEBRAS CERVICAIS e COLUNA VERTEBRAL, existe uma relação de natureza partitiva. Assim, a poli-hierarquia ocorre também entre hierarquias de naturezas diferentes. Finalizado este Subcapítulo sobre as relações hierárquicas, passa-se a apresentar as relações associativas. 5.7.3 Relações associativas As relações associativas, também denominadas de relacionamentos não- hierárquicos, ocorrem entre conceitos que pertencem à mesma categoria e entre conceitos de categorias diferentes. Essas relações são ligações existentes entre dois conceitos, e não entre termos ou descritores, desde que não relacionados hierarquicamente. Em geral, isso implica um relacionamento simétrico entre eles, ou seja, se A é associado a B, B está associado a A (SVENONIUS, 2000). Reforçando essa ideia, a Norma NISO Z39.19 (2005) indica que essas relações são simétricas e coexistem em certos fenômenos, pois é esperado que certas causas, que produzem certos efeitos, também estejam ligadas aos efeitos que produzem. Por outro lado, a Norma ressalta que as relações associativas podem ser também assimétricas, pois nem sempre há a necessidade de se indicar reciprocidade nesse tipo de relação. Essa acepção é compartilhada nesta pesquisa, e também por Soergel (1974), pois um relacionamento associativo pode ser unidirecional, embora, enquanto regra, seja bidirecional. 157 Os símbolos convencionais geralmente utilizados para representar as relações associativas, nos tesauros tradicionais, são TERMO ASSOCIADO ou TA. Svenonius (2000) aponta que um dos critérios para se determinar a ligação entre dois conceitos é verificar se um conceito está implícito na definição ou explicação do outro conceito. A autora cita como exemplo a associação entre os conceitos de “ave” e de “Ornitologia” (ramo da zoologia que se dedica ao estudo das aves), uma vez que o conceito de “ave” é usado na definição do conceito de “Ornitologia”. Campos (2001, p. 113) reforça essa ideia quando afirma que a “relação associativa ocorre entre um conceito e uma de suas características, presente na definição”. Dessa forma, se, na definição de um conceito, está incluído um segundo conceito que não esteja ligado ao primeiro por relações de equivalência ou hierarquia, pode ser necessário ligá-los por uma relação associativa. Dahlberg (1978a), por sua vez, acrescenta que as relações associativas em tesauros são do tipo funcional, pois esse instrumento não trata de relacionamentos que não estejam determinados pelas características contidas nos conceitos. Sendo assim, a autora considera que as relações associativas ocorrem em nível conceitual, entre conceitos que denotam processo, atividade ou operação e outro conceito, que representa uma propriedade ou entidade. Nessa mesma perspectiva, Campos, Gomes e Motta (2004) indicam que as relações associativas fazem com que dois conceitos mantenham um elo espacial ou temporal entre si, seja de causa e efeito, produtor e produto ou etapas de um processo. Dahlberg (1978a) acredita que “pode-se conhecer o caráter semântico de tais relações tendo por base as chamadas valências semânticas dos verbos66, dando atenção aos verbos e respectivos complementos” (idem, p. 105). Nesse caso, cada verbo ou expressão verbal utilizada para interligar dois conceitos irá exigir distintos suplementos e também estará dependente do contexto de uso do conceito e do propósito desejado na modelagem. A pesquisadora também esclarece que a relação funcional implica uma relação não como causa-efeito, mas do tipo “se-então”, sendo de natureza sintagmática. Contudo, Green (2008) ressalta que, na Teoria dos Níveis Integrativos67, as relações associativas não se limitam às sintagmáticas, uma vez que os fundamentos dessa teoria pressupõem algumas características paradigmáticas nos relacionamentos associativos, com a atribuição de ligações entre conceitos estabelecidos a priori. Sobre isso, Hutchins (1975) acrescenta 66 Dahlberg (1978a, p. 105) explica esse fenômeno como “a soma dos lugares a serem preenchidos de acordo com a ligação deste conceito com outros”. Maior detalhamento sobre esse tema pode ser encontrado no Subcapítulo 5.8. 67 A Teoria dos Níveis Integrativos estabelece que há complexidade no mundo, pois um conceito não é um fenômeno independente, mas construído no contexto de um domínio específico; assim, os conceitos são organizados de forma crescente, pois cada nível de conceitos somente existe a partir do nível anterior, ainda que não implicando que as propriedades de um nível sejam herdadas pelo outro (GNOLI, 2005). 158 que a natureza das relações associativas não é unicamente sintagmática, pois elas podem acontecer também como uma relação paradigmática, já que pode-se olhar o eixo paradigmático como analítico e o eixo sintagmático como sintético. As relações paradigmáticas são “fixadas” pela estrutura do sistema linguístico, enquanto as sintagmáticas são ‘selecionadas’ durante a enunciação de mensagens particulares – a primeira, a priori, enquanto a última, a posteriori (HUTCHINS, 1975, p. 6). Nesse sentido, as relações associativas paradigmáticas são aquelas válidas em quase todos os contextos, pois o conceito do descritor consegue abranger características essenciais que são conhecidas em muitos domínios. Por outro lado, as relações associativas sintagmáticas são as ligações que acontecem em um contexto específico de uso, conforme mostra o exemplo a seguir: FIGURA 17 – Representação de relações associativas paradigmáticas e sintagmáticas Fonte: Norma ISO 25964, 2011, p. 17. Observando a Figura 17, percebe-se que o conceito “Holandês” (linha das relações paradigmáticas) possui um sentido mais amplo ou uma classe mais geral que pode está associado e pode abarcar o conceito “Amsterdã” (linha das relações sintagmáticas) que é mais específico. Em muitos domínios, além do conceito “Amsterdã”, o conceito “Holandês” poderia abranger também “Roterdã”, “Antuérpia”, “Paramaribo” ou “Joanesburgo”, que são cidades holandesas. Assim, ao se utilizar o conceito topônimo “Holandês”, é possível acolher maior número de informação semelhante, pois seu sentido agrega informações da parte centro-oeste dos Países Baixos, composta pelas Holanda do Norte e a Holanda do Sul. Ademais, todas as províncias dos Países Baixos são popularmente denominadas, no Brasil, como Holanda. Existe, portanto, diversidade de associações possíveis entre dois conceitos, a partir de distintos critérios de modelagem. Nessa perspectiva, um caso singular de relação associativa pode acontecer entre conceitos de mesmo nível hierárquico como, por exemplo, entre os conceitos de “navio” e “barco”, subordinados ao conceito superordenado “veículos” (NISO Z39.19, 2005). Em alguns contextos, é possível que os conceitos de “navio” e “barco” estejam com seus significados sobrepostos e, ainda assim, não sejam considerados como equivalentes. Nesse tipo de caso, é recomendável a indicação de uma associação entre os 159 dois conceitos. Outra situação especial refere-se, por exemplo, aos conceitos de “cavalo”, “burro” e “mula”68, que estão subordinados hierarquicamente à classe de “equinos” (NISO Z39.19, 2005). Neste caso específico, na qual há uma relação familiar ou derivacional (que deriva do outro), a recomendação é criar uma relação associativa entre os conceitos. Svenonius (2000) acredita que, de maneira geral, as diretrizes para a construção de tesauros determinam os relacionamentos associativos de forma vaga (sem rigor) e também de forma muito ampla, para incluir todas as relações semânticas que não se encaixam nas relações de equivalência e nas hierárquicas. A dificuldade em se determinar as relações associativas que serão representadas em um tesauro é agravada pelo “fato de que todas as palavras, termos ou conceitos podem se relacionar entre si em algum momento. Isto porque as associações dependem, em larga medida, do universo de referência considerado” (CINTRA et al., 2002, p. 63). Isso ficou evidenciado na pesquisa de Marroni (2006), que teve como objetivo identificar e delimitar as relações associativas nos tesauros, quando a autora concluiu que: é imprescindível que os critérios norteadores desse processo [estabelecimento de relações associativas] sejam claros e precisos o suficiente para evitar que esse tipo de relacionamento seja definido superficialmente, por exclusão ou negação (se não é relação de equivalência, nem relação hierárquica, é associativa) (MARRONI, 2006, p. 110). Nota-se que já há uma tendência, no campo de estudos sobre tesauros, em buscar fundamentos teóricos específicos para a determinação dos relacionamentos associativos. A ausência desses fundamentos enfraquece a consistência da estrutura conceitual do tesauro, assim como a representatividade do domínio modelado. Essa preocupação sempre foi comum a outros autores, tais como Gomes (1984), Lancaster (1986), Austin (1993), Svenonius (2000), Cintra et al. (2002) e está também presente nas normas NISO Z39.19 (2005) e ISO 25964 (2011). Contudo, já há estudos (CAMPOS, 2001; CAMPOS; GOMES, 2006; SALES; CAMPOS; GOMES, 2008; MACULAN, 2014) que apontam as teorias da área da BCI (Teoria do Conceito, Teoria da Classificação Facetada e Teoria da Análise de Domínio), assim como as bases da Terminologia, como fundamentos que podem auxiliar na construção de tesauros e, mais especificamente, na definição de uma relação associativa. Assim, a partir dessas teorias, é possível objetivar as decisões, através do mapeamento dos objetos, fenômenos, eventos e propriedades que ocorrem em um dado domínio, facilitando a determinação de um conjunto de relações associativas consistentes para representar um contexto específico. A explicitação dos relacionamentos é representada por expressões verbais. Assim como as relações, os verbos também apresentam um valor semântico importante na 68 Mula (feminino) e burro (masculino) são formados pelo cruzamento de uma égua e um jumento. 160 estruturação do domínio em um tesauro. Portanto, o próximo Subcapítulo passa a discorrer sobre a valência semântica dos verbos. 5.8 A VALÊNCIA SEMÂNTICA DOS VERBOS Os verbos carregam um valor semântico, e compreender esse valor é importante, conforme é salientado por Soergel et al. (2004), uma vez que os relacionamentos, em um tesauro, são representados por expressões verbais. Nesta pesquisa, os fundamentos para a determinação da valência semântica dos verbos estão pautados na Teoria da Valência (TV), criada por Francisco S. Borba, e publicada sob o título “Uma Gramática de Valências para o Português”, em 1996. Borba (1996, p.xxi) conceitualiza a TV como um “conjunto de relações estabelecidas entre o verbo e seus argumentos ou constituintes indispensáveis”. O autor afirma que os verbos assinalam tipos de situação, pois, em geral, cada verbo designa uma situação. Para determinar a situação à qual um verbo pertence faz-se necessário saber qual a natureza das entidades designadas por ele. A TV foi desenvolvida a partir da combinação de duas outras teorias: a Gramática de Valências e a Gramática de Casos. A Gramática de Valências foi abordada por diferentes autores (TESNIÈRE, 1966; CHAFE, 1970; VILELA, 1992), tendo início com os estudos de Tesnière (1966), sobre a importância do verbo como determinante da dependência de seus complementos (MACHADO, 2008). Somente com Chafe (1970) houve a proposta do verbo como ponto central da análise de uma frase, em uma acepção de que o verbo é que define “a presença e a natureza dos nomes que o acompanham, natureza essa de ordem semântica” (OLIVEIRA, 1995, p. 11). A Gramática de Casos também foi investigada por diversos autores, com distintas visões e em relação ao seu funcionamento em diversos idiomas (FILLMORE, 1968, 1969, 1977; ANDERSON, 1971; JACKENDOFF, 1972; COOK, 1979, 1989). Teve origem com os estudos de Fillmore, em 1968, desenvolvida em oposição à Gramática Transformacional de Chomsky, apontando a existência de relações sintáticas além daquelas exclusivas entre sujeito e objeto (OLIVEIRA, 1995, p. 11). De modo geral, essa teoria estuda os verbos, em muitas línguas, a partir da sistematização deles em esquemas casuais que determinam uma valência semântica para eles. Ainda que, a princípio, as duas teorias pareçam bastante semelhantes, Borba esclarece a principal diferença entre elas: Uma gramática de valência procura detectar relações de dependência entre categorias (básicas) que (co)ocorrem num contexto. [...] [assim como] toma como nuclear um elemento oracional (o verbo) e demonstra como os demais se dispõem em torno dele através de relações de dependência. A gramática de casos se preocupa com as funções semânticas subjacentes na organização da frase, devendo determinar as relações sintático- semânticas ou temáticas (funções ou papéis temáticos) que fazem parte da estrutura conceitual dos itens léxicos (BORBA, 1996, p. 16-17). 161 Percebe-se que as teorias são similares, mas se diferem quanto ao foco semântico (Gramática de Valência) ou sintático, com elementos semânticos (Gramática de Casos). Dessa forma, Borba (1996) desenvolveu a sua teoria combinando os “casos e valências, semântica e sintaxe, esquema profundo e superficial, papéis temáticos e funções dos constituintes da oração” (MACHADO, 2008, p. 25), trabalhando com o português brasileiro. Sendo assim, o ponto de partida da teoria proposta por Borba69 é o verbo, que é considerado uma unidade lexical que possui características morfológicas, tal como um modificador primário. Sintaticamente, o verbo não possui papel exclusivo, mas, morfologicamente, o verbo pode ser variável em tempo e modo, expressando um acontecimento no tempo (ação, estado ou fenômeno). Dessa forma, é possível isolá-lo em uma sequência (por exemplo: Substantivo + verbo + Substantivo Verbal), permitindo identificar suas estruturas básicas, a partir de quatro flexões: modo, tempo, número e pessoa e voz, a saber: (a) modo: flexão assumida pelo verbo para expressar um fato. Há três modos verbais: indicativo (concretude), subjuntivo (incerteza) e imperativo (ordem); (b) tempo: distingue quatro situações temporais: situações, processos ou estados passados (fato terminado, tendo acontecido ou não), presentes (fato atual), futuros (fato ocorrerá brevemente em relação ao momento atual) ou atemporais; (c) número e pessoa: o número altera a forma verbal para indicar a quantidade de sujeitos envolvidos no fato (singular e plural), e a pessoa altera a forma verbal para apontar o foco do fato que representa (orador, interlocutor ou assunto); (d) vozes verbais: flexão assumida pelo verbo para expressar a posição do sujeito (ou objeto) frente ao processo que se enuncia, podendo o sujeito ser agente da ação (voz ativa; verbos de ação), paciente da ação (voz passiva; verbos transitivos diretos) ou reflexivo (pratica e recebe a ação). Assim, um verbo pode indicar uma valência (valor semântico) de ação, movimento, estado ou fenômeno, sofrendo variações de acordo com as quatro flexões descritas. A partir disso, Borba “procura detectar relações de dependência entre categorias (básicas) que (co)ocorrem num contexto (ex.: A depende de B, se a presença de A pressupõe B)” (BORBA, 1996, p. 16). Essa valência é denominada por Borba de valência semântica, obtida a partir de uma subdivisão dos traços conceituais dos verbos que, associados a um objeto (ou referente), apresenta-se sob a forma de um caso. Um caso, do ponto de vista semântico, determina o valor semântico de um verbo. Para o momento, é suficiente analisarem-se os 69 Todo este texto tem por base a publicação de Borba, em 1996, mencionado na introdução do Subcapítulo. Para evitar redundância, algumas vezes o nome dele foi citado sem a data. 162 seguintes casos: agentivo, experimentador, beneficiário, objetivo, locativo, instrumental, causativo, meta, origem, resultativo, temporal e comitativo. (1) Agentivo (Ag): representa um agente que é responsável por uma ação que desencadeia uma atividade (física ou não), originando e controlando o fato, como, por exemplo: “Certos políticos não raciocinam”; (2) Experimentador (Ex): expressa uma experiência ou disposição mental, como, por exemplo: “Qualquer arte me interessa”; (3) Beneficiário (B): representa um afetado pela ação ou processo, marcando o destinatário/beneficiário, como, por exemplo: “Gina ganhou um presente”; (4) Objetivo (Ob): representa um fato semanticamente mais neutro, mostrando-o não como afetado, mas como ponto de referência de uma ação ou de um estado, como, por exemplo: A estrada é longa; (5) Locativo (L): expressa um lugar que marca o local onde se realiza a ação ou lugar de referência de um estado de coisas, como, por exemplo: “Leo está na igreja”; (6) Instrumental (I): expressa uma causa indireta, desencadeador de uma ação, tendo como traços a atividade e o fato de ser controlado, como, por exemplo: “Cortou o arame com o alicate”; (7) Causativo (Ca): representa uma causa que é responsável por provocar efeito ou desencadear uma ação ou processo, geralmente ligado a um estímulo; é potente para atuar sobre algo e não possui controle sobre a própria ação, como, por exemplo: “A geada matou as plantas”; (8) Meta (M): expressa o ponto de chegada de um fato, evento ou fenômeno; pode conter traços de afetado (posse; ganho; perda) e de transição (direção; transferência); como, por exemplo: “Os torcedores invadiram o campo”; (9) Origem (Or): expressa o ponto de origem de um processo, fato, evento ou fenômeno; pode conter traços de afetado (posse; ganho; perda) e de transição (direção; transferência); como, por exemplo: “O vulcão jorrou ondas de lava”; (10) Resultativo (R): expressa um evento efetuado, como a representação de uma mudança de estado ou de lugar, geralmente ligado a verbos cujos complementos indicam algo que passa a existir, como, por exemplo: “Carlos escreveu três sonetos”; (11) Temporal (Tp): expressa localização no tempo, como, por exemplo: “Decorreram três meses”; (12) Comitativo (Co): expressa uma associação, na qual um é sempre afetado, podendo ter traços de atividade e causa, como, por exemplo: “Romeu morreu com Julieta”. Assim, é possível analisar e identificar os traços semânticos de um verbo, como, por exemplo: “(a) entrar: Ag e L; (b) herdar: B, Ob e Or; (c) dar: Ag, Ob e B” (BORBA, 1996, p. 52). “Isso significa que, pela identificação das funções temáticas, se consegue 163 estabelecer uma taxonomia sintático-semântica para os verbos” (BORBA, 1996, p. 52). Borba ressalta que nem sempre é fácil determinar a qual tipo de caso o traço constituinte do verbo se refere, uma vez que há traços que se repetem, dependendo da relação em que os elementos se encontram. Nesse sentido, Borba fornece uma classificação que reúne conjuntos de casos a alguns traços: Realizador: Ag, Ca, I e Co; Instigador: Ag e Co; Transição: L, Or, M e Tp; Controle: Ag e I; Afetado: Ob, B, Ex, M, Or, R e Co. Para Borba, a valência de um verbo representa o número de argumentos que ele necessita preencher para completar seu sentido e pode ser classificada em três níveis: (1) Valência quantitativa (lógica ou lógico-semântica): número de argumentos que um predicado pode ter: avalente (zero), monovalente (um), divalente (dois), trivalente (três) e tetravalente (quatro); (2) Valência qualitativa (sintática ou morfossintática): características dos actantes70 (relações gramaticais e/ou funcionais), das propriedades morfológicas, das funções sintáticas, das propriedades sintáticas e das classes que preenchem os argumentos; (3) Valência semântica: traços semânticos das categorias (+humano, +animado, +contável), das funções ou dos papéis temáticos (agente, causativo, beneficiário) e das restrições relacionais de coocorrência ou exclusão. A partir dessa classificação de valências, Borba também determinou uma classificação sintático-semântica para os verbos: verbos de ação, de processo, de ação- processo e de estado, conforme apresentados a seguir: (a) verbos de ação: expressam atividade realizada por um sujeito Agente (Ag), indicando um FAZER por parte de um sujeito (ou objeto), que tem controle sobre o ato, podendo ser humano ou não, afetando física ou psicologicamente um Paciente (P) ou Experimentador (Ex); possui, no mínimo, um argumento. Exemplo: O pássaro voa hoje; (b) verbos de processos: expressam um evento ou sucessão de eventos, indicando um ACONTECER ou um EXPERIMENTAR, que afeta física ou psicologicamente um Paciente (P) ou Experimentador (Ex) ou um Beneficiário (B); têm, pelo menos, um argumento. Exemplos: “A chuva parou” (Paciente); “Ana sente frio” (Experimentador); “Rosa ganhou uma flor” (Beneficiário); (c) verbos de atividade: ou ação-processo ou mudança de estado ou causativos; expressam uma ação ou um processo realizado por um Agente (Ag) ou uma causação levada a efeito por um Causativo (Ca), sempre apontando uma mudança de estado (afetado), condição (afetado), posição (afetado) ou algo que passa a existir (efetuado); têm, 70 Qualquer elemento usado como participante (pessoa, coisa) em um ato comunicacional, seja como ativo ou passivo daquilo que se indica no predicado. 164 no mínimo, dois argumentos: um agente/causativo e outro afetado/efetuado. Exemplos: “José quebrou o vaso” (afetado), “José escreveu um romance” (efetuado); (d) verbos de estado: expressam uma propriedade (estado, condição ou situação), localizada em um sujeito (ou objeto) que é apenas seu suporte, com o verbo indicando um SER/ESTAR/EXISTIR em relação ao sujeito que é o seu Experimentador (Ex) ou Beneficiário (B); têm, obrigatoriamente, um argumento que é inativo (não é Agentivo, nem Causativo e nem Paciente). Exemplo: “Fernando tem três filhos”. A Figura 18 demonstra uma síntese da representação da classificação sintático- semântica dos verbos. FIGURA 18 – Sistematização dos tipos de situação dos verbos Fonte: SCHWARZE, 2001, p. 97. Nota-se que, dada uma situação específica, é possível determinar qual a sua classe (ação, processo, atividade e estado). Assim, a ausência de um agente permite que se distinga um verbo de processo de um verbo de ação, ou um verbo de atividade de um verbo de estado (SCHWARZE, 2001, p. 97). A partir dessa classificação dos verbos e acrescentando fundamentos à teoria de Borba, Garcia (2004) descreveu três tipos principais de verbos que favorecem a identificação do tipo de expressão verbal que é utilizado para exprimir os relacionamentos entre conceitos em um tesauro: (1) verbos auxiliares: adicionam determinadas características a outros verbos (aspecto, modalidade, etc.), com o papel de complementação: poder, dever, ter que / ter de, haver que / haver de, costumar, ousar; (2) verbos relacionais: estabelecem uma relação entre dois ou mais elementos que compõem o domínio modelado, indicando o que ocorre com tais elementos; podem representar as seguintes relações: (a) designativa (modo-temporal, número-pessoal ou imprimir um aspecto ou característica); (b) equativa (identificação entre dois elementos); (c) existencial (real ou imaginado ou de localização); (d) partitiva (estática); (e) locativa (localização espacial: posicional, conjuntiva ou disjuntiva); (f) possessiva (posse, 165 contiguidade, inclusão, entre outras); (g) efetiva (afetado; agentivo ou instrumental); (h) comunicativa (complementação oracional); (i) comparativa (distinção, relacional ou ativa); (j) condicional (possibilita a ocorrência da situação, embora não seja sua causa); (k) delimitativa (ou aferimento); (l) causal (causa-e-efeito); (m) factiva (agente/causa a um produto/efeito); (3) verbos ativos: determinam uma modificação qualquer no status quo de um ou mais elementos a eles relacionados ou por eles regidos, indicando um processo ou uma relação controlada. Pelo exposto, nota-se que os verbos exprimem operações diversas que se referem às funções ou propósitos de objetos reais, imaginários ou abstratos. Dada essa multiplicidade de dimensões de significados dos verbos, a estrutura dos papéis Qualia, desenvolvida por Pustejovsky (1995) como parte de sua Teoria do Léxico Gerativo, pode ser utilizada como passo inicial na identificação do significado semântico de um verbo. A determinação dos papéis Qualia para as expressões verbais, que representam as relações semânticas na estrutura de um tesauro, permite identificar os fenômenos de hiperonímia/hiponímia (relação de gênero-espécie) e de holonímia/meronímia (relação todo- parte). A estrutura Qualia é composta pelos papéis Formal, Constitutivo, Télico e Agentivo, conforme descrito a seguir: (a) Formal: generalização de uma operação descrita através de outra operação representada; distingue um objeto em um domínio mais amplo ou geral; (b) Constitutivo: constituição de uma operação descrita, expondo-a por meio de outras operações que são necessárias para efetivá-la; indica uma relação entre um objeto e suas partes constituintes; (c) Agentivo: especificação da entrada de uma operação, na forma de argumentos, representados por objetos reais, imaginários ou abstratos; indica elementos ou fatores que estão envolvidos na origem do objeto ou as causas para o objeto acontecer, existir ou ocorrer; (d) Télico: especificação da saída de uma operação, na forma de objetos reais, imaginários ou abstratos; expressa o propósito e a função do objeto. Tanto o sentido verbal (entre o verbo e o sujeito) quanto o sentido nominal (entre o substantivo e o adjetivo) dos papéis Qualia estabelecem as relações existentes entre os termos em um determinado contexto comunicativo. Assim, é preciso destacar que os papéis Qualia que interessam ser representados nesta pesquisa não são aqueles com sentidos nominais, e, sim, os sentidos verbais das relações que expressam a ligação que existe entre dois conceitos em um dado domínio, conforme a síntese no Quadro 5. 166 QUADRO 5 – O sentido verbal dos papéis Qualia RELAÇÃO substância = causa formal (Qualis FORMAL) ter = causa material (Qualis CONSTITUTIVO) qualidade quantidade lugar posição tempo sofrer = causa eficiente (Qualis AGENTIVO) agir = causa final (Qualis TÉLICO) Fonte: elaborado pela autora desta tese, com base em PUSTEJOVSKY (1995). As relações incluídas no Qualis Formal são, sobretudo, as relações lexicais de equivalência (sinonímia, antonímia). As relações denominadas semântico-conceituais são aquelas classificadas com o Qualis Constitutivo, representadas, principalmente, pelas hiperonímias, seguidas pelas meronímias, e as relações classificadas com o Qualis Agentivo e com o Qualis Télico. Estas duas últimas classificações se referem, respectivamente, a uma ação responsável por uma mudança de estado em um objeto e por uma ação sofrida pelo objeto. Com essa exposição, finaliza-se o Capítulo da fundamentação teórico-contextual desta pesquisa, e passa-se à apresentação do Capítulo dos fundamentos teórico- metodológicos. 167 6 FUNDAMENTOS TEÓRICO-METODOLÓGICOS Os navios estão a salvo nos portos, mas não foi para ficar ancorados que eles foram criados. Grace Murray Hopper Neste capítulo estão apresentados os fundamentos teórico-metodológicos que foram aplicados no desenvolvimento desta pesquisa. Primeiramente, o Subcapítulo 6.1 descreve o modelo conceitual adotado, tendo por base o método de reengenharia de tesauros proposto por Dagobert Soergel, a partir de dois artigos: um de Soergel et al. (2004) e outro de Lauser et al. (2006). Logo após, descrevem-se as etapas e os procedimentos metodológicos de conversão do tesauro. Ressalta-se que a exposição sobre a implantação computacional do modelo, composta pela aplicação das Regras “as-you-go”, das alternativas para a sua extensão e do uso de fontes externas e de padrões, está no Apêndice B, Implantação Computacional do Modelo Adotado. Em seguida, descreve-se, no Subcapítulo 6.2, o sistema e-Termos, software que foi utilizado na edição do tesauro tradicional, que oferece suporte ao desenvolvimento e gestão de produtos terminológicos. Depois, no Subcapítulo 6.3, são apresentados os insumos terminológicos e semânticos, compostos pela taxonomia da área temática da Intensificação Agropecuária (Subcapítulo 6.3.1) e pelos três tesauros: THESAGRO (Subcapítulo 6.3.2), AGROVOC (Subcapítulo 6.3.3) e NAL (Subcapítulo 6.3.4) . 6.1 FUNDAMENTOS DO MODELO CONCEITUAL PARA REENGENHARIA Neste Subcapítulo é descrito o modelo de reengenharia de tesauros, inicialmente proposto por Dagobert Soergel, que foi utilizado como método na reengenharia do tesauro THESAGRO. Esse modelo foi apresentado em dois artigos: (1) artigo de Soergel et al. (2004), intitulado Reengineering Thesauri for New Applications: the AGROVOC Example; (2) artigo de Lauser et al. (2006), intitulado From AGROVOC to the Agricultural Ontology Service. No primeiro artigo, os autores propõem a fase de concepção de um modelo de reengenharia para ser aplicado em tesauros tradicionais. Os pesquisadores exemplificam sua aplicação em recortes do tesauro AGROVOC, da área da agropecuária. Já no segundo artigo, Robin Lauser71 e coautores continuaram os estudos iniciais sobre o modelo, usando como ponto de partida um extrato dos resultados obtidos no primeiro artigo. Os autores tinham por objetivo final a reengenharia do AGROVOC visando à criação de uma 71 Lauser foi também coautor do primeiro artigo e trabalha na Food and Agriculture Organization (FAO), uma das mantenedoras do AGROVOC, que, desde 2003, tem se preocupado em desenvolver o AGROVOC de forma que possa oferecer relacionamentos mais específicos e precisos, com o objetivo de caminhar para a construção de uma ontologia do domínio agrícola. 168 ontologia pesada72 de domínio, composta por classes, atributos e relacionamentos, todos expressos em Web Ontology Language (OWL DL). Ressalta-se que, pretendendo facilitar a leitura deste Subcapítulo, doravante, sempre que mencionada a expressão “modelo de Soergel (2004; 2006)”, deve-se entender que as informações oferecidas estão inseridas nos dois artigos já mencionados, fazendo referência a todos os seus autores. O modelo de Soergel (2004; 2006) apresenta os seus procedimentos metodológicos de maneira gradual, o que possibilitou isolar a fase de automatização do processo de conversão do tesauro, e aplicar unicamente os processos intelectuais de reengenharia no THESAGRO, atendendo à proposta desta pesquisa. Uma visão geral do modelo pode ser analisada na Figura 19, que oferece a sua representação gráfica, em alto nível73. Observa-se que a principal característica do modelo é a separação da modelagem em cinco níveis de entidades: (1) conceito; (2) termo ou lexicalização; (3) string ou variação linguística; (4) notas de escopo; e (5) relacionamentos. FIGURA 19 – Modelo conceitual para transição de tesauro tradicional em ontologia Fonte: elaborada pela autora desta tese, traduzido de SOERGEL et al., 2004, p. 11. 72 Ontologias pesadas (heavyweight): adicionam axiomas e restrições para ontologias leves (lightweight); ontologias leves: incluem conceitos, taxonomias dos conceitos, relacionamentos entre conceitos e propriedades que descrevem os conceitos. 73 Os modelos conceituais de alto nível oferecem conceitos próximos aos usuários, podendo ser facilmente compreendidos por usuários finais, pois mostram, de forma não muito diferente, como os dados estão organizados no interior dos programas (no sistema). 169 Nessa proposta, os autores tratam (1) conceitos, (2) termos e (3) strings como entidades em níveis individualizados, para que cada uma delas indique distintos tipos de informação. Ademais, mesmo as (4) notas e os (5) relacionamentos são considerados entidades independentes e podem agregar dados informacionais. Com essa separação, os relacionamentos podem ser atribuídos entre entidades de mesmo nível, ou seja, entre diferentes conceitos ou entre diferentes strings, assim como podem ser estabelecidos relacionamentos entre entidades de níveis distintos. Esses cinco níveis de entidades se sustentam a partir dos seguintes princípios e fundamentos: (1) O nível dos conceitos: um conceito expressa o significado de um objeto, cujas características gerais estão materializadas em sua definição, que deve ser enunciada em ficha terminológica própria. Os autores sugerem que se atribuam notações numéricas aos conceitos, tal como a utilizada em sistemas de classificação bibliográficos ou apenas uma identificação numérica para a sua individualização. Soergel et al. (2004) denominam esse elemento como termo-número. Para os autores, as notações numéricas possibilitam a manutenção de uma sequência significativa e lógica, principalmente quando se quer exibir uma estrutura hierárquica aos usuários. O conceito é o ponto central na aplicação desse modelo e, por essa razão, os autores ressaltam que as relações entre eles são primordiais, uma vez que dão origem à estrutura relacional semântica. Nesse sentido, os autores recomendam que os conceitos sejam organizados em hierarquias, de forma a melhor identificar a rede relacional que está sendo criada, auxiliando a adição de novos relacionamentos entre esses conceitos. Soergel et al. (2004) afirmam que essa hierarquia de conceitos pode ser estruturada a partir de qualquer critério e ilustram com alguns exemplos, tais como: IsA (é- um), Part-Whole (todo-parte) ou Spatial Containment (restrição espacial). Os autores sugerem que os relacionamentos entre conceitos devem ser transitivos e não-simétricos, mas que deve, também, existir relações inversas, como, por exemplo: (componenteDe), que é a relação inversa de (temComponente). Usando os princípios da categorização e agrupamento, Soergel et al. (2004) apontam que cada conceito deve ser alocado em um tipo de classe ou faceta, a ser determinado conforme o domínio, tais como processo, função, substância ou organismo vivo. Segundo os autores, determinar a natureza do conceito restringe sua participação em alguns tipos de relacionamentos. Dessa forma, evitam-se possíveis ambiguidades que podem surgir durante a modelagem de um domínio. Além disso, um conceito pode ser representado por um ou mais termos ou lexicalizações, em um ou mais idiomas, por meio de relações de equivalência. Nos casos das relações de equivalências, os relacionamentos 170 possibilitam a criação de um elo entre os dois níveis de modelagem, ou seja, o nível do conceito e o nível do termo. (2) O nível dos termos ou lexicalizações74: cada termo ou lexicalização representa ou nomeia um conceito através de uma ou mais expressões linguísticas, que podem ser palavras, expressões ou frases. Assim como os conceitos, também os termos podem receber uma notação numérica (termo-número). Soergel et al. (2004) propõem também um tratamento diferenciado para termos homônimos e sinônimos, a saber: (a) para um termo homônimo: o tratamento da homonímia deve ser realizado durante o mapeamento terminológico do domínio; cada termo dever estar ligado a cada um dos seus termos homônimos, assim como a seu conceito correspondente. Como exemplo de homonímia os autores apresentam o termo sede: sede (vontade de beber) e sede (residência). (b) para dois ou mais termos sinônimos: o tratamento da sinonímia deve ser realizado a partir da ligação dos termos equivalentes por relacionamentos dos seguintes tipos: (temSinônimo), (temNomeCientífico), (temAntônimo), (temDescendente75) ou (temTradução76), sempre indicando um dos termos para ser o descritor preferido para representar o conceito. Os autores ressaltam que os termos relacionados por sinonímia podem estar ligados a diferentes manifestações (strings). (3) O nível dos strings ou variações linguísticas: os strings representam as diversas manifestações ou formas linguísticas variantes que um termo pode assumir, podendo receber uma notação numérica, denominada pelos autores do modelo de “termo- número”. Para tratamento dos strings, no modelo de Soergel (2004; 2006), sugere-se que eles sejam conectados por meio de relacionamentos tais como: (temVariaçãoDeInstância), / (pluralDe/singularDe), (temVariaçãoOrtográfica) ou (temAbreviaturaOuAcrônimo). Usando os princípios da categorização e agrupamento, Soergel et al. (2004) alertam que, caso o número de variações linguísticas seja elevado, é possível criar uma 74 Lexicalização é o processo ao fim do qual um sintagma se lexicaliza, transformando-se em unidade lexical autônoma no vocábulo de uma língua. Exemplo: “à-vontade” (lexicalização) é uma palavra diferente da locução “à vontade”; “faz-tudo” (lexicalização) é diferente de “faz tudo”. 75 Termo com a mesma raiz, em distintos idiomas; por exemplo: português, francês e espanhol; inglês e alemão; árabe e hebraico. 76 Um conceito pode estar ligado a termos em diferentes idiomas, tais como o francês e o inglês. 171 classe de strings para agrupá-las, ligando-as por meio da relação . Nesse caso, os autores sugerem que o modelador pode determinar uma das variantes como o descritor preferido para representar o conjunto de strings ou pode determinar a escolha a partir da preferência da comunidade atendida (por exemplo, britânicos X americanos). De forma semelhante como acontece com alguns termos, por exemplo, no caso dos homônimos, quando um mesmo termo pode representar mais de um conceito, é possível que alguns strings estejam associados a mais de um termo. Nessa situação, é necessário fazer a desambiguação do string, cujo procedimento deve ser realizado através das notas. (4) O nível das notas: as notas são tratadas como as “notas de escopo” dos tesauros tradicionais, também denominadas notas explicativas ou notas históricas, que auxiliam a compreensão de um termo e a sua forma de uso. No modelo de Soerguel (2004; 2006), elas são utilizadas para representar os diversos tipos de conteúdos informacionais, tais como: (a) esclarecer a valência semântica de um verbo77: no caso de o verbo ter um sentido diferente do que é usado para o conceito de ação para o qual está sendo utilizado; (b) recomendar registros; (c) indicar se um termo é o descritor preferido para o conceito; (d) apontar dados administrativos; (e) incluir imagens; (f) conter definições; (g) apontar comentários; (h) indicar formas de uso. Os autores consideram que as notas podem estar relacionadas a qualquer outro nível de entidade, assim como conectadas entre si, através de relacionamentos, tais como: - (temTradução); - (temVersãoSimplificada); - (temOutraDefinição). Soergel et al. (2004) ressaltam que uma mesma nota de escopo pode estar expressa em diferentes idiomas, sobretudo no caso de tesauros multilíngues, quando é necessário atribuir um relacionamento ligando o conjunto de notas em diferentes idiomas. (5) O nível dos relacionamentos: o nível dos relacionamentos é considerado o de mais alta abstração da modelagem, dentre os já descritos anteriormente, pois ele representa as associações utilizadas para criar um sistema conceitual, composto pelos distintos níveis de entidades do modelo. Os autores recomendam a definição de um conjunto de relacionamentos necessários, e que sejam suficientes para representar as inter- relações entre essas entidades. Para isso, os pesquisadores sugerem fazer o mapeamento 77 A valência semântica verbal se caracteriza pelo papel semântico que um verbo exerce dentro da oração, e está descrito no Subcapítulo 5.8. 172 do domínio modelado, com o objetivo de identificar as suas diversas instâncias (objetos, eventos, propriedades, fenômenos, processos). A definição desse conjunto de relacionamentos deve levar em consideração as características do domínio modelado, o uso que será dado ao tesauro e o tipo de usuários que será atendido. Pode incluir relações do tipo: equivalência, descendência, causa e efeito, benefício, prejuízo, material, processo ou proximidade situacional dos elementos na realidade. Além disso, os autores sugerem elaborar uma estrutura hierárquica dos relacionamentos, dos mais genéricos aos mais específicos, com o objetivo de identificar a natureza do relacionamento e verificar alguma possível lacuna relacional. Síntese e discussão do modelo por Soergel et al. (2004) Nessa proposta de modelagem, a partir dos cinco distintos níveis de entidades, percebe-se que o nível dos (1) conceitos, considerado o ponto central do modelo, refere-se a informações associadas à semântica (significado) conceitual. Quanto ao nível dos (2) termos, está associado a informações do ponto de vista da Linguística (por exemplo, como parte do discurso, como um termo combina com outros termos nas frases ou o uso habitual do vocábulo de uma língua) ou às informações sobre a etimologia dos termos. Sobre os (3) strings, os autores indicam como um elemento novo, não comumente encontrado em tesauros tradicionais, e englobam algumas informações especiais, tais como variantes linguísticas ou o nome de uma marca (em um idioma específico, por exemplo). Já as (4) notas, são incluídas para complementar todo tipo de informação que facilite o entendimento do usuário sobre o tesauro, sendo que elas podem estar associadas a qualquer um dos níveis de entidade que necessitar de esclarecimento. Quanto aos (5) relacionamentos, os autores os apontam como a espinha dorsal do tesauro, de suma importância na estruturação da informação, uma vez que permitem criar uma rede de relações que interligam todos os níveis de entidades, formando um sistema semântico-conceitual, importante para a representação e entendimento do domínio. Os autores exemplificam a modelagem de um tesauro tradicional com a descrição de um caso hipotético, demonstrando o tipo de informação que pode ser perdida: Suponha a representação realizada em um tesauro tradicional da área biológica, para a doença popularmente conhecida como doença da vaca louca e cientificamente denominada como encefalopatia espongiforme bovina, uma doença neurodegenerativa que afeta o gado doméstico bovino. A representação do conceito dessa doença seria realizada a partir das premissas: (a) BSE é a sigla para BOVINE SPONGIFORM ENCEPHALOPATHYI 173 (encefalopatia espongiforme bovina); (b) MCD é a sigla para MAD COW DISEASE (doença da vaca louca); (c) o descritor preferido para representar essa doença é BOVINE SPONGIFORM ENCEPHALOPATHYI; (d) MAD COW DISEASE e BSE são descritores não-preferidos. Como resultado da representação do conceito sobre essa doença, nesse tesauro tradicional específico, haveria uma relação de equivalência ligando o descritor preferido BOVINE SPONGIFORM ENCEPHALOPATHYI aos descritores não-preferidos BSE e MAD COW DISEASE e, talvez, também ao descritor não-preferido MCD. Os autores ressaltam que esta última relação, com o MCD, talvez não seja feita, porque ele é uma sigla para MAD COW DISEASE, que é também um descritor não-preferido. De forma tradicional, falta tratamento para descritores não-preferidos nos tesauros, ficando essas informações não representadas no instrumento. Assim, esse tipo de informação poderá ficar perdido ou disperso no instrumento, e somente parte da informação poderá ser recuperada pelo usuário e, mesmo assim, somente quando consultar a parte sistemática da apresentação do descritor preferido. O modelo de Soergel et al. (2004), por meio da modelagem isolada nos cinco níveis de entidades (conceito, termo, string, nota e relacionamento), miniminiza, ou até evita, a perda dessas informações, uma vez que ele permite o tratamento separado de cada um dos níveis e a interligações deles por meio de múltiplos relacionamentos. Para aplicação desses cinco níveis de entidades, norteadores deste modelo, os autores propõem procedimentos que devem ser seguidos em um projeto de reengenharia de um tesauro tradicional, tema que será apresentado no próximo Subcapítulo. 6.1.2 Etapas e detalhamento da conversão De acordo com o modelo de Soergel (2004; 2006), a reengenharia de um tesauro tradicional consiste, basicamente, no aperfeiçoamento do tesauro, sob o ponto de vista da explicitação dos relacionamentos em sua estrutura conceitual, passando por três etapas básicas: Etapa 1: Definir a estrutura do tesauro convertido Definir a estrutura desejada para o tesauro convertido, a partir de um tesauro existente no domínio a ser trabalhado. Nessa etapa, a estrutura do tesauro remodelado é mapeado, para a identificação dos cinco níveis de entidades (conceitos, termos, strings, notas de escopo e relacionamentos) que o compõem. 174 Etapa 2: Coletar a terminologia e outras informações Coletar terminologia e outras informações de um ou mais tesauros, no domínio a ser modelado, sempre que existirem vocabulários desse domínio específico. Etapa 3: Editar o tesauro tradicional Editar o tesauro utilizando um editor de tesauros para: (a) tornar a semântica da informação existente mais específica; e (b) adicionar novas informações. Essa parte do processo pode ser semiautomatizada com o uso das regras “as-you-go” (Apêndice B), por exemplo. O detalhamento da conversão do modelo de Soergel (2004; 2006) tem por base o artigo de Lauser et al. (2006), por este trazer exemplificações mais esclarecedoras sobre a conversão. A escolha dos relacionamentos explicitados na estrutura conceitual, em níveis sintático e semântico, foi feita a partir de consulta aos especialistas da área. Em sua aplicação no extrato do AGROVOC, Lauser et al. (2006) utilizaram quatro níveis de entidades de representação: (1) conceitos; (2) termos; (3) strings (variantes de termos); (4) relacionamentos. Sendo assim, não há exemplos para o quinto nível de entidade, no qual estão as notas de escopo. No exemplo apresentado pelos autores, todos os conceitos formaram a hierarquia e a estrutura semântica da ontologia criada, sendo cada termo (em cada idioma) uma entidade separada, podendo estar ligado a outros conceitos ou a termos variantes do mesmo termo. Com essa distinção, foi possível representar as seguintes relações entre os distintos níveis de entidades: conceitos para termos tem_lexicalização (liga os conceitos a seu representante lexical) termo para string tem_acrônimo, tem_variação_ortográfica, tem_abreviação (liga os termos com suas formas variantes) Nota-se, assim, que um string não é um termo novo, mas representa o conjunto de variantes de um mesmo termo. Já as relações que ocorrem dentro de um mesmo nível de entidade, seja no nível do conceito ou no nível do termo, podem ser exemplificadas da seguinte maneira: conceito para conceito é_uma (hierarquia), praga_de termo para termo é_sinônimo_de, é_tradução_de Para capturar a estrutura conceitual e a lexical do tesauro AGROVOC, os autores fizeram a modelagem utilizando a Web Ontology Language (OWL DL), que suporta 175 maior expressividade semântica e possui algumas restrições obrigatórias que resultam em maior consistência estrutural. A modelagem usando OWL DL foi descrita a partir de três conceitos de nível superior (, e ), conforme apresentado na Figura 20. FIGURA 20 – Nível conceitual mais alto Fonte: elaborado pela autora desta tese, com base em LAUSER et al., 2006, p. 4. O nó 78 é a raiz que abriga todos os conceitos do domínio modelado, que constituem o núcleo e o esqueleto da ontologia criada, denominada pelos autores de AOS Concept Server. A partir desse conjunto de conceitos, o domínio é estruturado em uma hierarquia de classes, dentro do nó . A separação desse nó ocorre pela necessidade de inclusão de alguma categoria específica que não esteja coberta pelos conceitos do domínio. Ressalta-se que cada conceito do domínio é também, potencialmente, uma categoria. Em seguida, o conjunto de categorias criado é organizado em classificações, dentro do nó . Já no nó estão as lexicalizações (ou termos), que representam os conceitos, que são modelados como instâncias. A estratégia de separação do nó permite representar as diversas formas de um termo, específicas de cada idioma, como é o caso de tesauros multilíngues. Ademais, isso torna possível estabelecer relações entre as distintas lexicalizações que representam um conceito, proporcionando maior semântica à estrutura do tesauro convertido. Destaca-se que o nó é composto pelo conjunto de palavras e expressões, disponibilizadas na linguagem natural, que compõem a terminologia completa do domínio modelado. Nesse sentido, cada instância do nó advém do nó 78 No caso de uma conversão total do AGROVOC, todos os seus descritores (preferidos e não- preferidos) seriam modelados sob esse nó. 176 , deixando o modelo aberto, para permitir que se incluam outros termos que não somente substantivos (tais como verbos ou adjetivos) na estrutura conceitual, dependendo das necessidades dos usuários. Na parte modelada do extrato do tesauro AGROVOC, todas as relações associativas, que eram apenas do tipo TERMO RELACIONADO (TR), foram transformadas em relacionamentos mais específicos e explícitos. Ademais, foi criada uma taxonomia inicial, que deve ser alimentada à medida que todo o tesauro for sendo modelado, contendo todos os relacionamentos (de equivalência, hierárquicos e associativos), especialmente para o domínio da agricultura. As ligações entre os diferentes níveis de entidades foram realizadas da seguinte maneira: (1) de um conceito para um termo: cada instância de é ligada a uma única instância de , conforme Figura 21. FIGURA 21 – Atribuição conceito-termo Fonte: elaborado pela autora desta tese, com base em LAUSER et al., 2006, p. 4. Como pode ser observado, cada termo contido no nó está ligado, pelo relacionamento <é_termo_de>, ao nó . De forma inversa, cada conceito do domínio modelado, contido no nó , está ligado a pelo menos um termo do nó , pelo relacionamento . (2) de um termo para outro termo: para ligar os termos entre si, foram identificados e aplicados três diferentes tipos de relações que um termo pode ter: (2.a) uma ou mais traduções: relação simétrica ; (2.b) um ou mais sinônimos por idioma: relação simétrica , que substituem as clássicas relações dos tesauros USE e USADO PARA; isto demonstra que o modelo permite uma grande flexibilidade lexical. Por exemplo: ao tratar o termo milho no idioma inglês, ele poderá ser representado por “corn” ou por “maize”; já em francês, o termo 177 que descreve o mesmo conceito é “maïs”, porém esta é uma tradução apenas para o termo “maize”, porque, em francês, não há tradução para o termo “corn”; (2.c) um ou mais nomes científicos: relação unidirecional , para a qual foi também criada uma relação inversa <é_nome_científico_de>; (3) de um termo para uma variante: nessa perspectiva, um mesmo termo pode ser representado por diversas formas, como, por exemplo, o termo University of California at Berkeley (Universidade da Califórnia em Berkeley): (3.a) acrônimo: UCB; (3.b) forma abreviada: Cal; (3.c) abreviatura: UC Berkeley; (3.d) nome oficial: University of California at Berkeley. Nota-se que todos os relacionamentos termo-variante são cadeias simples, implicando, então, que não há previsão, quando utilizando este modelo, de se estabelecerem relações entre as variações linguísticas, já que este é o último estágio da modelagem. Após a descrição dos fundamentos e procedimentos do modelo adotado, passa- se à apresentação das características do software que foi utilizado, nesta pesquisa, para a edição do tesauro tradicional, atendendo ao procedimento da Etapa Três, descrita no início deste Subcapítulo. 6.2 FUNDAMENTOS E CARACTERIZAÇÃO DO SOFTWARE E-TERMOS O sistema e-Termos79, acrônimo de Termos Eletrônicos, é um software criado como resultado de uma pesquisa de doutorado desenvolvida por Leandro Henrique Mendonça de Oliveira. O desenvolvimento desse software envolveu uma parceria composta por: (1) Embrapa Informática Agropecuária (CNPTIA), representado pelo laboratório de pesquisa Laboratório de Organização e Tratamento da Informação Eletrônica (LabInfo); (2) Universidade de São Paulo (USP, Campus de São Carlos, SP), representado pelo laboratório de pesquisa Núcleo Interinstitucional de Linguística Computacional (NILC); e (3) Universidade Federal de São Carlos (UFSCar), representado pelo laboratório de pesquisa Grupo de Estudos e Pesquisas em Terminologia (GETerm). O sistema e-Termos é um ambiente computacional colaborativo web, que auxilia o desenvolvimento de produtos terminológicos. Ele é composto por um conjunto de procedimentos automatizados e semiautomatizados, com o objetivo de dar suporte à criação 79 Disponível em: . 178 e gestão de produtos terminológicos para distintos fins (ensino, glossários, vocabulários controlados). Em um único ambiente, o sistema interliga um conjunto de etapas que simplificam e harmonizam o trabalho terminológico. A característica colaborativa é um dos principais diferenciais do sistema e-Termos, pois permite a interação de diferentes profissionais, especialistas e instituições, sem que haja uma limitação geográfica. Todo o ambiente está estruturado em duas plataformas: o portal e o sistema e- Termos. A Figura 22 mostra a tela principal do portal. FIGURA 22 – Tela principal do portal e-Termos Fonte: tela capturada do portal e-Termos. O portal é acessível via web, de forma livre e irrestrita, e oferece informações gerais sobre o projeto e acesso aos produtos terminológicos finalizados e publicados no 179 portal. Ele é disponibilizado ao usuário final, principalmente àqueles sem permissão à plataforma do sistema e-Termos, mas que são os consumidores dos produtos gerados como resultados dos projetos. A outra plataforma, referente ao sistema e-Termos, é de utilização restrita aos usuários cadastrados, também de forma gratuita. Para isso, o candidato a usuário deve enviar um formulário, submetendo um projeto terminológico novo, e ser aprovado pelo Gestor Principal do sistema e-Termos. Outra forma de participação é ser convidado pelo gerente de algum projeto terminológico já constituído. O sistema e-Termos está hospedado em um provedor da EMBRAPA, mas atende aos interesses de desenvolvimento de terminologias de quaisquer áreas do conhecimento, desde que, como já mencionado, o projeto seja submetido à aprovação. Para qualquer projeto aprovado, há uma equipe de trabalho que pode ser composta a partir de três distintos perfis de integrantes, cujas funções autorizadas definirão o seu papel: (1) gerente de projeto: criador e responsável geral pelo projeto terminológico, incluindo a coordenação, manejo de equipe de trabalho (usuários cadastrados) e controle de todas as etapas do trabalho; executa todas as tarefas, exceto as específicas do especialista de domínio; (2) terminólogo ou linguista: participa das atividades terminológicas e linguísticas; responsável pela compilação do corpus, edição da ficha terminológica; participa de todas as etapas do trabalho; (3) especialista de domínio: representante da área de especialidade do produto terminológico; tem a tarefa de validar os termos e a estrutura conceitual; participa de algumas atividades das etapas quatro e cinco. Cada projeto tem apenas um gerente, mas o número de componentes é ilimitado. Todo integrante de um mesmo projeto pode ter apenas um tipo de perfil, mas cada perfil (com exceção do gerente) permite a participação de um número ilimitado de membros. Ademais, um mesmo indivíduo pode ter, em projetos diferentes, distintos papéis. METODOLOGIA DO e-TERMOS Os fundamentos teóricos do sistema e-Termos são pautados nos postulados da Terminologia com orientação descritiva, em conformidade com a Teoria Comunicativa da Terminologia (TCT), desenvolvida por Cabré, que é adotada nesta pesquisa e está descrita no Subcapítulo 5.3. Segundo Oliveira (2009), a metodologia do sistema e-Termos é composta por seis etapas de trabalho, algumas etapas obrigatórias e outras opcionais, cuja interface de trabalho está apresentada na Figura 23. 180 FIGURA 23 – Tela principal do sistema e-Termos Fonte: tela capturada do sistema e-Termos. PRIMEIRA ETAPA80 A primeira etapa no sistema e-Termos é facultativa. Nela ocorre a construção automática de um corpus de especialidade para os propósitos da pesquisa terminológica, permitindo a realização de consultas e pesquisas a corpora de referência na Web e possibilitando a cópia e transferência de subcorpus para o sistema e-Termos. Dessa maneira, se já existe para o novo projeto um corpus próprio, é possível iniciar o trabalho a partir da segunda etapa. SEGUNDA ETAPA A segunda etapa do sistema e-Termos é facultativa e oferece funcionalidades que permitem gerenciar e manipular corpora e textos. Além da possibilidade de compilação, seu principal objetivo é empreender a tarefa de verificação da qualidade e relevância do corpus de especialidade, antes da submissão do mesmo aos extratores automáticos de 80 A descrição de cada uma das etapas apresentadas neste Subcapítulo são informações obtidas da apresentação do sistema e-Termos, que tem acesso restrito aos assinantes e participantes de projetos aprovados pelo gestor do sistema. O portal está disponível em . 181 termos (tarefa realizada na terceira etapa). Também é possível realizar a edição, a classificação em gênero e tipo textual e o upload de textos em vários formatos e, a partir deles, compilar diferentes corpora, de acordo com a pesquisa e a necessidade de um projeto específico. TERCEIRA ETAPA A terceira etapa do sistema e-Termos é facultativa e apresenta um conjunto de ferramentas que representam diferentes métodos para a extração automática de candidatos a termos. Essa etapa se inicia com a entrada de um corpus previamente compilado na primeira e na segunda etapas, tendo como principal objetivo a aplicação dos métodos de extração automática disponíveis. Dessa forma, é possível identificar e extrair, automaticamente, unidades ou conjuntos lexicais que podem constituir uma unidade terminológica (termo), bem como o armazenamento de forma estruturada desse material. Os resultados das aplicações dos extratores automáticos é uma lista de candidatos a termos que pode ser editada a qualquer momento. Essa lista poderá ser utilizada em quaisquer das etapas seguintes. Alternativamente, caso já exista uma terminologia pronta, nesta etapa pode-se fazer o seu upload. QUARTA ETAPA A quarta etapa do sistema e-Termos é obrigatória e permite a criação de instâncias de uma estrutura conceitual (denominada ontologia) previamente definida. Todos os nós dessa estrutura possuem as mesmas propriedades, sendo elas: , , , , e . Apenas as propriedades: , , e podem ser preenchidas. Todas as instâncias dessa estrutura podem ser visualizadas graficamente de três maneiras diferentes: folder-tree (hierarquia), formato hiperbólico e formato de grafos (TouchGraph). As instâncias da estrutura conceitual, no contexto do sistema e-Termos, servem, principalmente, para criar um mapa conceitual do domínio do projeto em questão, com o objetivo de organizar o conhecimento e os conceitos de maneira hierárquica, sendo, na maioria das vezes, útil também nas etapas seguintes. Dessa forma, como se trata apenas de instâncias, visto que não se pode editar e definir propriedades, esta estrutura conceitual pode ser considerada uma taxonomia. QUINTA ETAPA A quinta etapa do sistema e-Termos é obrigatória e possibilita a elaboração da Ficha Terminológica e da Base Definicional para cada termo. A Ficha Terminológica é um registro completo de todos os termos, composta pelos campos determinados no protocolo 182 da ficha terminológica, e utilizada para criação dos modelos de verbete (na sexta etapa). Já a Base Definicional é um conjunto de excertos definicionais para todos os termos, sendo que cada termo possui um conjunto de excertos que são utilizados na redação da definição do termo. Esta etapa tem como principal objetivo gerenciar um banco de dados terminológicos, a partir dos termos categorizados na estrutura conceitual (tarefa da quarta etapa). Como resultado, oferece um conjunto de verbetes prontos para edição (tarefa que será realizada na sexta etapa). Nesta etapa também é possível a edição completa da Base Definicional. Ressalta-se que é permitido criar apenas um Protocolo de Ficha Terminológica para cada projeto. Entretanto, a criação, a edição e a exclusão dos campos desse protocolo são bastante flexíveis, podendo ele ser alterado a qualquer momento. SEXTA ETAPA A sexta e última etapa do sistema e-Termos oferece ferramentas para a finalização e apresentação do produto final do projeto. Tem como principal objetivo gerenciar os verbetes, sua apresentação, pré-publicação e publicação. Nesta etapa é possível criar vários modelos de apresentação e visualização de verbetes, a partir do Protocolo da Ficha Terminológica (criado na quinta etapa). Quando é feita a publicação final do produto terminológico, automaticamente ele é disponibilizado no Portal do e-Termos e pode ser acessado por qualquer usuário final (público externo). Todas as seis etapas que compõem o gerenciamento do sistema e-Termos para a elaboração de uma terminologia são sustentadas por um conjunto de ferramentas linguísticas e estatísticas, que dão suporte ao Processamento de Língua Natural (PLN), dentre as quais se destacam: (1) Concordanceador: mostra o contexto de uso de uma determinada palavra no corpus, permitindo: (a) definição do tamanho da janela de contexto; (b) buscas por palavras, total (palavra inteira) e parcial, diferenciando maiúsculas e minúsculas; (c) apresentação dos resultados. (2) Contador de Frequência: calcula a frequência das palavras de um determinado corpus, usando: (a) cálculo de todas as palavras; (b) cálculo de uma palavra específica, apresentando o ranking geral da palavra; (c) cálculo do índice vocabular (riqueza vocabular – token/type). (3) Identificação de Siglas, Acrônimos e Nomes Próprios: busca por prováveis siglas, acrônimos e nomes próprios, usando como parâmetro o cálculo da frequência de ocorrência. 183 (4) Método estatístico: utiliza uma abordagem puramente estatística (sem conhecimento linguístico), usando várias medidas, tais como informação mútua, coeficiente dice e log-likelihood. (5) Método linguístico: usa conhecimento linguístico, tais como corpus etiquetado (POS-Tagger) e definição dos padrões de formação de termos, a partir das características do domínio trabalhado e da quantidade de padrões aplicados. (6) Método híbrido: usa estatística e conhecimento linguístico, usando definição e ajustes de padrões, a partir das características do domínio trabalhado e da quantidade de padrões aplicados. Segundo Oliveira (2009), todas as ferramentas colaborativas listadas estão disponíveis em todas as etapas ou para cada etapa específica, e são indispensáveis para garantir os procedimentos que permitem a criação de produtos terminológicos. Para o autor, o compromisso maior, ao disponibilizar tais ferramentas, foi o de criar um ambiente único e interativo que permitisse a gestão e o desenvolvimento de produtos terminológicos. Além dessas ferramentas, foi desenvolvida pela EMBRAPA, para uso privativo, uma ferramenta denominada “Extrator de Termos e Estruturas Conceituais Agrícolas Multilíngue” (ETECAM). Essa ferramenta foi inicialmente criada para o projeto INTAGRO e é capaz de executar uma comparação automática de termos entre terminologias de distintos tesauros. A ETECAM realiza as seguintes tarefas: (a) dada uma lista de termos como entrada, (b) a ferramenta percorre a terminologia do tesauro identificando a existência dos termos da lista de entrada; (c) caso positivo, os termos coincidentes são extraídos, juntamente com o seu agrupamento (cluster) semântico, recuperando todas as estruturas conceituais dos termos, (d) assim como os equivalentes em outros idiomas, quando se tratar de tesauros multilíngues. Destaca-se que a taxonomia da subárea temática da Intensificação Agropecuária, utilizada como ponto de partida para a reengenharia do THESAGRO, foi criada no sistema e-Termos. Nesta pesquisa, além dessa taxonomia, outros insumos terminológicos foram necessários para a coleta de terminologia sobre o domínio da Intensificação Agropecuária, a saber: o tesauro THESAGRO, o tesauro AGROVOC e o tesauro National Agricultural Library (NAL), cujas características são apresentadas nos próximos Subcapítulos. 6.3 INSUMOS TERMINOLÓGICOS E SEMÂNTICOS Neste Subcapítulo estão apresentados os insumos terminológicos e semânticos que alimentaram a estrutura conceitual da área temática da Intensificação Agropecuária, constituído por três tesauros e uma taxonomia: (1) taxonomia da área temática da 184 Intensificação Agropecuária; (2) tesauro THESAGRO; (3) tesauro AGROVOC; (4) tesauro National Agricultural Library (NAL). 6.3.1 A taxonomia da Intensificação Agropecuária A taxonomia da subtemática “intensificação agropecuária” foi desenvolvida na Embrapa, dentro do projeto denominado INTAGRO81. Durante o mapeamento das atividades de intensificação, em que foram consultados os tesauros THESAGRO, AGROVOC e NAL, que são utilizados nas unidades da EMBRAPA, ficou evidente a falta de atualização terminológica desse assunto em tesauros do domínio da agricultura. Dessa maneira, percebeu-se a necessidade da criação de uma estrutura conceitual capaz de representar essa temática. Essa taxonomia foi desenvolvida utilizando-se o sistema e-Termos. Seguindo os procedimentos propostos pelo sistema, primeiramente, foi preparado um corpus textual para a criação da taxonomia. O corpus foi compilado a partir de documentos em um mesmo idioma e em formato digital, selecionados a partir de critérios ad hoc, composto por: (a) textos técnico-científicos (textos completos e resumos); (b) matérias jornalísticas; (c) páginas de websites; (d) relatórios. Esses procedimentos são sugeridos na literatura82 sobre composição de corpus, para assegurar, da forma mais precisa possível, a representatividade terminológica e a diversidade da amostragem, considerando-se os recursos informacionais disponíveis sobre uma determinada temática. O critério utilizado na estratégia de busca para o levantamento bibliográfico para compor o corpus da área de intensificação agropecuária foi a utilização da expressão de busca, em inglês, agricultural intensification. Pierozzi Jr., Oliveira e Souza (2010, p. 5) justificam essa escolha devido à “fraca recuperação de literatura disponível em português a partir da utilização do bigrama [sequência de duas palavras] ‘intensificação agropecuária’”, tanto em bases de dados bibliográficos da área da agricultura, quanto em motores de busca na Internet. Os autores ressaltam, também, que o uso do unigrama “intensificação” ou “intensification” como expressão de busca resultou em uma grande diversidade de sentidos, com o termo se referindo a outros tipos de processos (modernização ou tecnicização, por exemplo), tornando inviável a análise dos documentos recuperados para a composição do corpus. Por esses motivos expostos, o corpus foi composto por itens textuais, publicados em língua inglesa, que foram selecionados a partir da busca com a expressão agricultural intensification. O corpus compilado totalizou 2,5 milhões de palavras. 81 Conforme descrito no Subcapítulo 2.3. 82 Sobre composição de copora, recomenda-se a leitura de Sinclair (2008). 185 Em seguida, passou-se ao processo da extração automática de candidatos a termos, utilizando-se os seguintes parâmetros: (a) tamanho dos candidatos a termos: extração de uni (uma palavra), bi (duas palavras) e trigramas (três palavras); (b) stoplist: lista de palavras que são ignoradas durante o processo; (c) ponto de corte: palavras com frequência absoluta menor que 24 foram desprezadas; (4) regra de formação de palavras: o padrão foi definido para aceitar palavras maiúsculas e minúsculas do idioma inglês. Como resultado desse processo de extração, foram obtidos 6.630 unigramas, 1687 bigramas e 278 trigamas, sendo que na elaboração da taxonomia foram considerados somente os bigramas, uma vez que a análise evidenciou unigramas com conceitos muito genéricos e trigramas com conceitos sobrepostos aos dos bigramas. A esse conjunto de 1687 bigramas, foi aplicado um processo de refinamento que identificou: (a) termos e suas eventuais variantes; (b) relações entre termos; (c) contexto de onde se deu a ocorrência dos termos, para determinação dos seus traços semânticos. Desse trabalho, resultou uma lista com 639 termos, candidatos à representação da temática da Intensificação Agropecuária, que é a classe mais abrangente. Em seguida, foi iniciado um exercício de agrupamento do conjunto de termos, por suas semelhanças e diferenças. Nessa atividade, foram levadas em consideração as características da área, descritas no Subcapítulo 2.3, que foram identificadas a partir dos resultados obtidos pelo projeto INTAGRO, descrito no Subcapítulo 2.2.1. Como resultado, estabeleceram-se nove facetas conceituais: (1) agricultura intensiva; (2) agricultura extensiva; (3) material e métodos; (4) ambiente; (5) agronomia; (6) território e paisagem; (7) socioeconomia; (8) espaço e tempo; (9) instituições. Esse conjunto das nove facetas procurou especificar as características do domínio temático da Intensificação Agropecuária, utilizando os princípios da terminologia e BCI, utilizando os métodos dedutivo e indutivo de análise. Ao aplicar esses princípios, foi evidenciada a inter-relação dessa subárea com as outras subáreas que compõem a área da Agricultura. Em seguida, os 639 conceitos foram organizados em subfacetas, criando-se, assim, uma taxonomia da Intensificação Agropecuária. A estrutura hierárquica da taxonomia pode ser observada no Anexo A. 6.3.2 O tesauro THESAGRO O Thesaurus Agrícola Nacional (THESAGRO) é o único tesauro em português brasileiro especializado em literatura agrícola. Foi criado e desenvolvido segundo diretrizes da UNESCO, estabelecidas pela United Nations Information System (UNISIST), através do documento Principes directeurs pour l’établissement et le développement de thesaurus monolingues (UNISIST, 1973). É mantido pela Biblioteca Nacional de Agricultura 186 (BINAGRI), órgão da Secretaria Executiva, unidade do Ministério da Agricultura, Pecuária e Abastecimento. A BINAGRI é responsável pela coleta, padronização e tratamento de informações disponíveis em bases de dados e outras fontes, atividades que facilitam a recuperação e disseminação de dados do domínio da agricultura e de áreas correlatas. A primeira edição do THESAGRO foi publicada em junho de 1979, quando utilizava o nome “Thesaurus para Indexação/Recuperação da Literatura Agrícola Brasileira”. Em 1989, houve a publicação de uma nova versão revisada e, depois, somente foi atualizado em 2006. Atualmente, é disponibilizado no formato EXtensible Markup Language (XML), podendo ser utilizado de forma gratuita, a partir do registro e aceite de suas condições de uso. O objetivo do THESAGRO é, principalmente, a recuperação de documentos e ele se caracteriza pela sua especificidade, possuindo um escopo amplo, cobrindo assuntos desde energia até educação. Ele possui mais de 9.000 termos, não incluindo categorias de assunto, e especifica as relações entre termos e conceitos por meio de remissivas: (a) de equivalência USE (“use”; utilize) e UF (“used for”; utilizado para), para indicar sinônimos; (b) hierárquicas BT (“broader term”; termo genérico) e NT (“narrower term”; termo específico); (c) associativas RT (“related term”; termo relacionado). Apesar de utilizar uma terminologia em português, os símbolos aplicados para representar os relacionamentos estão apresentados no idioma inglês. Na estrutura do THESAGRO as relações de equivalência, hierárquicas e associativas são apresentadas da seguinte forma: (1) RELAÇÕES DE EQUIVALÊNCIA: são consideradas remissivas, pois aparecem nos dois sentidos. USE: empregado para indicar o descritor preferido para uso. DESCRITOR1 (descritor não-preferido) USE DESCRITOR2 (descritor preferido) ABACAXIZEIRO (descritor não-preferido) USE ABACAXI (descritor preferido) UF: USED FOR (usado para): empregado para indicação do descritor não-preferido, em favor do descritor preferido. ABACAXI UF ABACAXIZEIRO UF ANANAS (2) RELAÇÕES HIERÁRQUICAS: também são consideradas remissivas, pois aparecem nos dois sentidos. BT: BROADER TERM (termo genérico): empregado para indicar um descritor mais amplo, mais abrangente. INTOXICAÇÃO ANIMAL BT INTOXICAÇÃO 187 NT: NARROWER TERM (Termo específico) empregado para indicar Descritores mais definidos. INTOXICAÇÃO NT INTOXICAÇÃO ANIMAL NT INTOXICAÇÃO VEGETAL (3) RELAÇÕES DE ASSOCIAÇÃO RT: RELATED TERM (termo relacionado): empregadas para estabelecer associação entre dois descritores preferidos que possuam significados que, de alguma forma, se relacionam entre si, desde que não haja uma ligação hierárquica entre eles. INTOXICAÇÃO ANIMAL BT INTOXICAÇÃO RT DIAGNÓSTICO DE INTOXICAÇÕES No Quadro 6 está apresentada a estrutura semântica do THESAGRO para descrever MANDIOCA, AIPIM e MANIHOT ESCULENTA. QUADRO 6 – Exemplo de estrutura do THESAGRO AIPIM USE MANDIOCA MANDIOCA UF AIPIM UF MACAXEIRA BT TUBÉRCULO NT MANDIOCA BRAVA NT MANDIOCA MANSA RT PUBA RT TAPIOCA MACAXEIRA USE MANDIOCA Fonte: elaborado pela autora desta tese, adaptado do THESAGRO. O Quadro 6 ilustra as relações: (a) de equivalência, entre o descritor preferido MANDIOCA (USE) e os descritores não-preferidos (AIPIM, MACAXEIRA – UF); (b) hierárquicas, entre o descritor preferido MANDIOCA e o termo mais genérico TUBÉRCULO (BT), assim como com os termos mais específicos MANDIOCA BRAVA e MANDIOCA MANSA (NT); (c) associativas, entre o descritor preferido MANDIOCA e os termos associados PUBA e TAPIOCA (RT). Com essa forma de apresentação sistemática, ao se realizar uma busca usando-se o descritor não-preferido AIPIM, é possível expandir a consulta ao termo equivalente, MANDIOCA, escolhido como descritor preferido. Ao se acessar a estrutura sistemática do descritor preferido MANDIOCA, recuperam-se as informações sobre o termo mais geral, TUBÉRCULO, sobre os termos mais específicos, MANDIOCA BRAVA e MANDIOCA MANSA, e sobre os termos associativos, PUBA e TAPIOCA, minimizando a perda de informações que podem ser importantes ao usuário. Essa é a forma mais tradicional de representação de relacionamentos em tesauros. Atualmente, as bibliotecas de algumas unidades da EMBRAPA adotam o THESAGRO na representação temática de seus recursos informacionais e para a 188 recuperação de informações. Com essa mesma finalidade, o THESAGRO também é utilizado, no Brasil, pela Organização das Nações Unidas para a Educação, a Ciência e a Cultura (UNESCO). 6.3.3 O tesauro AGROVOC O tesauro AGROVOC é uma ferramenta web, multilíngue, cujo escopo cobre conceitos agrícolas, tais como alimentação, nutrição, agricultura, pesca, silvicultura e meio ambiente. Tem sua origem ligada à necessidade de criação de um vocabulário controlado comum para uso na base de dados dos países participantes do Sistema Internacional de Informação para as Ciências e Tecnologias Agrárias (AGRIS), coordenado pela Food and Agriculture Organization of United Nations, (FAO) – Organização para a Alimentação e Agricultura das Nações Unidas. A FAO, juntamente com a Comissão das Comunidades Europeias, desenvolveu esse instrumento, que teve a sua primeira edição publicada em 1982. O AGROVOC é composto por mais de trinta e dois mil conceitos, disponíveis em 23 idiomas, dentre os quais se destacam: árabe, chinês, inglês, francês, alemão, húngaro, italiano, japonês, coreano, polonês, português lusitano, russo e espanhol. Dentre esses idiomas, a FAO é responsável pela manutenção e tradução dos idiomas: inglês, francês, espanhol, árabe, russo e chinês. Para as outras línguas disponíveis, a manutenção terminológica e conceitual é coordenada nos países de origem, a partir de um acordo de parceria com a FAO. Hoje em dia, o tesauro AGROVOC está hospedado e pode ser acessado através do portal83 da Agricultural Information Management Standarts (AIMS). Destaca-se que, desde início da década de 2000, o AGROVOC deixou de ser publicado somente em uma versão impressa, passando a utilizar tecnologias semânticas e, em 2004, adotou o formato Web Ontology Language (OWL). Em 2009, o tesauro estava totalmente reestruturado e tornou-se um recurso publicado em Simple Knowledge Organization System (SKOS). Dessa forma, passou de um sistema lexical, com base em termos, para um sistema com base em conceitos, no qual os relacionamentos foram refinados e mais especificados. No início da década de 2010, na Intranet do banco de dados do AGROVOC, as relações não- hierárquicas (associativas) já estavam sendo substituídas por relacionamentos especificados, por meio de ligações semânticas. Atualmente, os dados do AGROVOC são editados por meio do software VocBench, uma ferramenta colaborativa multilíngue, de código aberto e baseada em web, implantada no AGROVOC como uma instância. O VocBench que utiliza o modelo SKOS e os recursos Resource Description Framework/SKOS/eXtension for Labels (RDF/SKOS-XL), que permite a edição e o 83 Disponível em: . 189 gerenciamento do tesauro por meio de um fluxo de trabalho. O tesauro também está publicado como um conjunto de dados, em Linked Open Data (LOD), estando alinhado com outros treze conjuntos de dados relacionados à área da agricultura. Além do formato OWL, a estrutura do AGROVOC pode ser extraída em TermBase eXchange (TBX), que é um padrão utilizado para representação de terminologias em eXtensible Markup Language (XML), e SKOS. O AGROVOC está organizado em 25 classes temáticas, denominados de “TOP Conceitos”, a saber: Atividades, Entidades, Eventos, Fatores, Características, Grupos, Localização, Medidas, Métodos, Objetos, Organismos, Fenômenos, Processos, Produtos, Recursos, Assuntos, Sistemas, Substâncias, Propriedades, Estado, Estágios, Tecnologia, Tempo, Lugar e Estratégias. A apresentação dos conceitos no AGROVOC é feita nas formas de arranjo alfabético e arranjo sistemático. Na estrutura do tesauro, os conceitos são formalizados como e identificados por uma notação numérica, por meio de uma Uniform Resource Identifier (URI) referencial: Por exemplo: URI é o conceito AGROVOC para milho. Os termos são tratados como instâncias em SKOS e utilizados para designar os conceitos. Por exemplo: para o conceito milho maize e maïs são termos para o mesmo conceito, em inglês e francês, respectivamente. Por sua vez, os termos que representam as variações linguísticas são tratados como atributos e ligados a um vocabulário específico de relacionamentos, denominado Agrontology84, por meio de uma extensão do SKOS. Por exemplo: para singular, plural agrontology:temSingular, agrontology:temPlural No vocabulário Agrontology, os relacionamentos são tratados como propriedades e, dessa forma, o conjunto de relacionamentos é considerado um subvocabulário de SKOS e uma subpropriedade da relação . A estrutura conceitual do tesauro AGROVOC é composta por relacionamentos de equivalências, hierárquicas e associativas, e utiliza a seguinte simbologia básica: 84 Disponível em: . 190 BROADER TERM BT Termo mais amplo, superordenado NARROWER TERM NT Termo mais específico, subordinado RELATED TERM RT Termo relacionado USE USE Indica descritor preferido USED FOR UF Indica descritor não-preferido SCOPE NOTE SNR Nota de escopo SCOPE NOTE X SNX Termo referenciado em nota de escopo (1) relações de equivalência: são identificadas a partir dos símbolos USE (descritor preferido) e UF (descritor não-preferido), usando expressões de SKOS-XL. Por exemplo: para descritores preferidos e não-preferidos para descritores preferenciais para descritores não-preferenciais (2) relações hierárquicas entre conceitos: são expressas em SKOS, usando: Por exemplo: para BT e NT (BT) para conceitos mais amplos (NT) para conceitos mais específicos Os tipos de relações hierárquicas não são especificadas, algumas vezes sendo utilizadas no sentido de <éUm> e, outras vezes, utilizadas no sentido de ou . Destaca-se que os endentamentos das hierarquias não ultrapassam o nível de quatorze subordinações. (3) relações associativas: são expressas em SKOS, usando a expressão (RT), cujos relacionamentos estão conectados ao vocabulário de relações, o Agrontology. Por exemplo: para o conceito “arroz” [Oryza sativa] agrontology:produz [rice] [rice] agrontology:é_produzido_por [Oryza sativa] [rice] skos:related [Oryza sativa] Assim, o conceito “arroz” é representado tanto em SKOS como também pelas relações específicas do vocabulário Agrontology. Atualmente, o vocabulário Agrontology possui 170 tipos de relacionamentos, incluindo as relações reversas. (4) notas de escopo: as notas somente são utilizadas para esclarecer o uso de descritores que necessitam de instruções. 191 Por exemplo: nota para o conceito “poluição” Nota de Escopo: Do ambiente; para plantas, animais ou produtos, usar o descritor <28317>. Com a implementação e desenvolvimento de ferramentas cada vez mais semânticas, o tesauro agora é considerado um AGROVOC Concept Server (CS), representando relações específicas entre conceitos, bem como as ligações entre termos em todos os idiomas para os quais o tesauro é traduzido. Dessa forma, a estrutura do AGROVOC permite perceber a distinção entre o nível terminológico e o nível conceitual. A Figura 24 mostra a nova interface do AGROVOC. FIGURA 24 – Interface do AGROVOC (versão out. 2014) Fonte: tela capturada do AGROVOC85. A Figura 24 apresenta o arranjo sistemático do conceito POLLUTION (poluição), indicando: (1) relação hierárquica: (1.a) BT, para o conceito mais amplo NATURAL PHENOMENA; (1.b) NT, para os conceitos mais específicos, tais como ACID DEPOSITION 85 Disponível em: . 192 e AIR POLLUTION; (2) relação de equivalência: indicadas pela expressão ALTERNATIVE LABEL, que inclui os descritores não preferidos, tais como ENVIRONMENTAL CONTAMINATION e IMMISSION; (3) relação associativa: composta pelos relacionamentos específicos AFFECTS (afeta), CAUSES (causa) e INFLUENCES (influencia). Também mostra a nota de escopo que esclarece sobre o uso do descritor. 6.3.4 O tesauro NAL O NAL Thesaurus86 é uma ferramenta web, originalmente publicada pela National Agricultural Library (NAL) – Biblioteca Nacional de Agricultura –, nos Estados Unidos, em 2002. Desde 2007, é desenvolvido e mantido em cooperação com a NAL, com o United States Department of Agriculture (USDA) – Departamento de Agricultura dos Estados Unidos – e com o Inter-American Institute for Cooperation on Agriculture (IICA) – Instituto Interamericano de Cooperação para a Agricultura –, sendo, atualmente, também disponibilizado em espanhol. O tesauro NAL é atualizado anualmente e está em sua décima quarta edição, versão de 2015, com mais de 110.000 termos. A cada ano, os desenvolvedores apresentam uma lista de novos descritores e, também, dos descritores que foram substituídos ou tornaram-se obsoletos. Ademais, a estrutura completa do tesauro está disponível para download nos seguintes formatos: XML, RDF-SKOS, Portable Document Format (PDF), Machine Readable Cataloging (MARC) e Document (DOC), e seus dados também são acessíveis através de Linked Data, que é um conjunto dos dados do tesauro, e seus relacionamentos, disponíveis na web para exploração, uso e criação de novos dados. O tesauro NAL é organizado em dezessete categorias de assuntos: (1) Ciência Animal e Produtos de Origem Animal; (2) Ciências Biológicas; (3) Reprodução e Melhoramento Genético; (4) Economia, Administração e Indústria; (5) Fazendas e Sistemas Agrícolas; (6) Alimentação e Nutrição Humana; (7) Ciência Florestal e de Produtos Florestais; (8) Locais geográficos; (9) Governo, Lei e Regulamentos; (10) Saúde e Patologia; (11) Insetos e Entomologia; (12) Recursos Naturais, Terra e Meio Ambiente; (13) Ciências Físicas e Químicas; (14) Ciência das Plantas e Produtos Vegetais; (15) Investigação, Tecnologia e Engenharia; (16) Sociologia Rural e Agrícola; (17) Classificação Taxonômica de Organismos. Essas categorias criam arranjos sistematizados que comportam toda a terminologia da área agrícola e de áreas correlatas. O tesauro possui, à parte, um glossário de definições para os conceitos agrícolas, cujas fontes bibliográficas são apresentadas ao final da definição de cada termo. O glossário é denominado Definition Source e as definições aparecem da seguinte forma: 86 Disponível em: . 193 Termo: consorciação Definição: Crescimento simultâneo de duas ou mais diferentes espécies de culturas, cultivadas em linhas alternadas, em um mesmo local ou área única de terra. Fonte: NAL Thesaurus Staff Esse glossário é considerado uns dos mais atualizados da área e, na sua edição de 2015, foram incluídas 4.465 novas definições. A estrutura conceitual do NAL possui relacionamentos de natureza hierárquica, de equivalência e associativa, as quais aparecem da seguinte maneira: (a) hierárquicas: indicadas pelas designações do superordenado BROADER TERM (termo mais amplo) e do subordinado NARROWER TERM (termo específico). Termo: consorciação BROADER TERM: sistemas de cultivo NARROWER TERM: cultivos em aleias Assim, o conceito de CULTIVOS DE ALEIAS é subordinado ao conceito de CONSORCIAÇÃO, pois é um tipo mais específico de CONSORCIAÇÃO, que pertence à classe superordenada SISTEMAS DE CULTIVO. (b) de equivalência: representadas quando ocorre equivalência entre termos sinônimos, nomes populares de organismos e seu equivalente científico, variantes ortográficas, variantes de uso e siglas. O termo escolhido para representar um conceito é denominado, no tesauro NAL, “descritor” ou “terminologia preferida”, e os demais termos em equivalência são denominados “não-descritores” ou “termos não-preferenciais” ou “ingresso de terminologia87”. Os não-descritores são identificados pelas designações USE e USED FOR (usado para), aparecendo em itálico, visando a alertar os usuários de que estes são termos não-preferenciais. Termo: Schizaphis graminum USED FOR: pulgão USED FOR: Toxoptera graminum Termo: pulgão USE: Schizaphis graminum Termo: Toxoptera graminum USE: Schizaphis graminum 87 Tradução da expressão em inglês “lead-in terminology”. 194 Nesse exemplo, o termo SCHIZAPHIS GRAMINUM é o descritor, e os termos em itálico, PULGÃO e TOXOPTERA GRAMINUM, são os não-descritores. (c) associativas: são aquelas que não são relações hierárquicas ou de equivalência; são designadas por RELATED TERMS, e utilizadas em ligações sempre recíprocas. Termo: fotossíntese RELATED TERMS: tilacoide Termo: tilacoide RELATED TERMS: fotossíntese Assim, o processo de FOTOSSÍNTESE é um conceito que mantém certo relacionamento com TILACOIDE88, mas o tipo de relacionamento não é especificado. O tesauro NAL também possui 51.926 referências cruzadas, que são usadas ocasionalmente, designadas por “Use AND type” e “Used for AND type”, da seguinte maneira: Termo: água alcalina Use AND type: alcalinidade Use AND type: água Termo: água Used AND type: água alcalina Termo: alcalinidade Used AND type: água alcalina Dessa forma, a instrução a ser seguida pelo indexador é atribuir os termos ÁGUA e ALCALINIDADE sempre que aparecer o conceito de ÁGUA ALCALINA em um documento. O tesauro NAL apresenta também notas de escopo, que são utilizadas para esclarecer o significado e a aplicação de um termo, em relação aos outros termos no instrumento. Termo: anorexia NOTA DE ESCOPO: use para descontrole ou perda de apetite para alimento; para a doença de transtorno alimentar, caracterizado pela falsa percepção da imagem corporal USE anorexia nervosa. FONTE: Instituto para a Segurança Alimentar e Nutrição Aplicada 88 Os tilacóides são constituídos por uma membrana que cobre uma substância aquosa, nas plantas, que são responsáveis pela captação da energia luminosa utilizada no processo de fotossíntese. 195 A primeira parte da nota de escopo esclarece a definição do conceito, que foi representado pelo termo, e a segunda parte oferece orientações sobre a aplicação do termo com sentido similar. As notas sempre indicam a fonte, uma autoridade ou organização, de onde foi retirado o significado do termo. Finalmente, o tesauro NAL faz o tratamento da desambiguação de homógrafos por meio de inserção de um qualificador entre parênteses. Termo: Togo (África) Termo: Togo (Heteroptera) Assim, o termo TOGO possui dois conceitos diferentes, cujos sentidos são distinguidos por meio dos qualificadores ÁFRICA, para indicar que se refere ao país africano oficialmente denominado República Togolesa, e HETEROPTERA, para indicar uma espécie animal de invertebrado dessa subordem. Com isso, respeita-se o princípio da univocidade entre conceito e termo, em conformidade com as normas NISO Z39.19 (2005) e ISO 25964 (2011). 196 7 DESCRIÇÃO DOS PROCEDIMENTOS E RESULTADOS Não há nada que conduza à verdade. Temos que navegar por mares sem roteiros para encontrá-la. J. Krisnamurti Neste Capítulo estão apresentados a descrição detalhada dos procedimentos que compõem o método de reengenharia aplicado no tesauro THESAGRO, assim como os resultados alcançados. A escolha por apresentar esses dois elementos em um único Capítulo tem como objetivo promover o entendimento do fenômeno pesquisado e dos resultados obtidos, uma vez que a análise será orientada pelos procedimentos realizados, pois ficará próxima à exposição objetiva do percurso metodológico. Dessa forma, espera-se que o método aplicado possa ser facilmente reproduzido e os resultados verificados. Os procedimentos do modelo de reengenharia escolhido, desenvolvido por Soergel et al. (2004) e Lauser et al. (2006), está descrito no Capítulo Seis. Esse modelo é composto por três etapas: (1) definição da estrutura do novo tesauro; (2) coleta da terminologia na literatura e em outros tesauros; (3) aplicação da reengenharia do tesauro, por meio de um software, para a sua edição. A principal característica do modelo proposto é a possibilidade de modelagem, de forma isolada, dos cinco níveis de entidades (conceito, termo, string, notas de escopo e relacionamentos). Para melhor condução dos procedimentos que compõem as etapas do modelo, foi necessário fazer um planejamento inicial para, posteriormente, detalhar as três etapas, uma vez que, originalmente, os autores não deixaram explícitos alguns passos metodológicos para a reengenharia do tesauro. O planejamento inicial e o detalhamento dos procedimentos de cada etapa foram desenvolvidos a partir do estudo e análise da aplicação do modelo, sendo tal planejamento considerado um dos primeiros resultados desta pesquisa. Nos próximos Subcapítulos, serão apresentados a descrição dos procedimentos e os resultados, na seguinte ordem: primeiramente apresenta-se a fase de planejamento inicial, no segundo momento, o detalhamento das três etapas e, por fim, os resultados da aplicação do modelo. 7.1 PLANEJAMENTO INICIAL No planejamento inicial da reengenharia do tesauro tradicional, aplicando o modelo de Soergel (2004; 2006), foi necessário perpassar cinco etapas, a saber: (1) definição da equipe de trabalho; (2) escolha do domínio a ser modelado; (3) determinação do objetivo proposto; (4) definição do público-alvo; (5) seleção do tesauro para aplicar o modelo de reengenharia. 197 (1) definição da equipe de trabalho Para que se cumpram as diversas atividades envolvidas na reengenharia de um tesauro, é necessária uma equipe multidisciplinar, composta por profissionais de distintas especialidades. No caso específico deste estudo, essa equipe contou com integrantes das seguintes especialidades: (a) modelagem conceitual: a proponente, como profissional da informação, doravante denominada “modelador”; (b) validação terminológica: as terminólogas Gladis Maria de Barcellos Almeida e Dayse Simon Landim de Souza Kamikawachi, ambas da UFSCar, doravante denominadas “terminólogos”; (c) validação especializada: o especialista do domínio Ivo Pierozzi Júnior, da EMBRAPA, doravante denominado “especialista”; (d) apoio instrumental: o tecnólogo Leandro Henrique Mendonça de Oliveira, da EMBRAPA, doravante denominado “tecnólogo”. (2) escolha do domínio a ser modelado Um tesauro é, por definição, um instrumento especializado, que representa um domínio bem demarcado. No caso deste estudo, o domínio escolhido foi o da Agropecuária, uma vez que a EMBRAPA, instituição na qual se ambienta esta pesquisa, é focada na geração de conhecimento e tecnologia para agropecuária brasileira, conforme descrito no Subcapítulo 2.2. (3) determinação do objetivo proposto O objetivo da reengenharia do tesauro escolhido foi a organização e representação semântica do domínio da Agropecuária, visando a facilitar o gerenciamento das informações disponibilizadas pela Embrapa, servindo como uma interface de comunicação para os especialistas da área. (4) definição do público-alvo O público-alvo definido foram especialistas, agricultores e sociedade em geral. (5) seleção do tesauro no qual será aplicado o modelo de reengenharia O THESAGRO foi o instrumento selecionado para a reengenharia, por ser um tesauro brasileiro especializado em literatura agrícola, cujas características estão descritas no Subcapítulo 6.3.2. A seleção do tesauro foi feita por meio de um levantamento dos instrumentos terminológicos já construídos que cobrissem o domínio da Agropecuária. Entre os tesauros arrolados, o THESAGRO foi escolhido por ser o único vocabulário controlado, em português brasileiro. Esse critério garantiu que o domínio fosse representado de forma a refletir, especificamente, a agricultura brasileira. A necessidade dessa representação se 198 explica porque diferentes países possuem diferenças quanto às características de seus processos agrícolas, já que apresentam histórias agrárias distintas. Além disso, algumas unidades da EMBRAPA já utilizam o THESAGRO para a representação temática de recursos informacionais, estando integrado na base de dados do serviço web da empresa. 7.2 ETAPA UM – DEFINIÇÃO DA ESTRUTURA A definição da estrutura do tesauro convertido foi iniciada com o mapeamento das características estruturais do tesauro THESAGRO para que, posteriormente, fosse realizada a sua reengenharia. Assim, a definição da estrutura incluiu outros procedimentos, a saber: (1) mapeamento da estrutura conceitual do tesauro THESAGRO; (2) determinação do recorte temático; (3) subdivisão do recorte temático em categorias; (4) demarcação e composição da amostra. 7.2.1 Mapeamento da estrutura conceitual do tesauro THESAGRO Primeiramente, foi realizada uma análise na estrutura do THESAGRO, para mapear e identificar como os cinco níveis de entidades (conceitos, termos, strings, notas de escopo e relacionamentos) propostos no modelo estão representados em sua estrutura. Esse mapeamento resultou nas seguintes análises: (1.a) O THESAGRO possui cerca de 9.400 termos descritores, preferidos e não- preferidos, que representam todo o escopo conceitual do domínio da Agropecuária. Todos os termos descritores possuem um número de identificação (ID), atribuído em algarismos romanos e sequencialmente. (1.b) A estrutura do THESAGRO apresenta, em sua rede semântica, os três relacionamentos básicos que ocorrem nos tesauros tradicionais – de equivalência, hierárquica e associativa –, por meio de referências cruzadas e remissivas (reciprocidade), utilizando os símbolos na língua inglesa: Relações de equivalência: USE e USED FOR (UF) Relações hierárquicas: BROADER TERM (BT) e NARROWER TERM (NT) Relações associativas: RELATED TERM (RT) A estrutura hierárquica do THESAGRO é composta por cerca de 5.000 relações genéricas (BT) e cerca de 9.000 relações específicas (NT), o que lhe permite ser considerado um tesauro com alta especificidade e amplo escopo. Sua rede semântica forma grupos (cluster) de conceitos, agrupados do geral para o específico, indicando a 199 superordenação (BT) e a subordinação (NT), conforme mostra o extrato da estrutura do THESAGRO para o conceito AGRICULTURA. AGRICULTURA NT AGRICULTURA DE PRECISÃO NT AGRICULTURA EM TEMPO PARCIAL NT AGRICULTURA FAMILIAR NT AGRICULTURA ALTERNATIVA NT AGRICULTURA SUSTENTÁVEL NT AGRICULTURA DE SUBSISTÊNCIA NT AGRIMENSURA NT AGRONOMIA NT FITOTECNIA NT PISCICULTURA CONSORCIADA NT SILVICULTURA NT ZOOTECNIA Pelo exemplo é possível notar que o conceito superordenado AGRICULTURA estabelece relações hierárquicas com os outros conceitos do extrato, que são subordinados e identificados pelo símbolo NT (Narrower Term; termo específico). Porém, não é possível perceber, a não ser com base em conhecimentos prévios, que tipo de relação hierárquica esses conceitos mantêm entre si: de gênero-espécie, de todo-parte ou de instância. Sabe-se que essas relações reúnem conceitos que têm características comuns entre si, já que o conceito superordenado é composto por um conjunto de características que agrupam os conceitos subordinados. Por sua vez, os conceitos subordinados estão coordenados entre si, por serem conceitos que estão em mesmo nível de especificidade dentro do grupo (cluster). O controle da equivalência é realizado, nos tesauros tradicionais, por meio da indicação de um descritor preferido para representar um determinado conceito, que é ligado aos seus equivalentes, formando uma rede semântica por meio de remissivas. Essas remissivas sempre conectam o descritor preferido ao descritor não-preferido, garantindo a inter-relação entre todos os sinônimos existentes para um dado conceito, em um determinado domínio. Por exemplo, a estrutura semântica de um tesauro pode representar um organismo vivo por sua nomenclatura científica ou por seu nome popular, criando uma rede de remissivas entre eles, dependendo do público-alvo a que o instrumento vai atender: especialistas ou leigos, respectivamente. Porém, diferentemente dos tesauros tradicionais, verificou-se que o THESAGRO representa a equivalência entre nomenclaturas científicas e nomes populares de outra maneira: utilizam-se as relações associativas (TR). No THESAGRO, em geral, toda vez que foi incluído na sua terminologia o conceito de um organismo vivo, foram determinados um descritor preferido com a sua nomenclatura científica e outro descritor preferido com o seu nome popular, e a ligação entre eles é expressa por meio de uma relação associativa (TR). Dessa forma, não fica configurada, na 200 estrutura do THESAGRO, a existência de uma relação de equivalência entre os descritores que remeta o descritor preferido para o não-preferido, e vice-versa. Isso faz com que a representação semântica de um conceito que possui um equivalente não seja expressa em toda a sua extensão, o que dificulta o entendimento do conhecimento do domínio. Isso pode ser observado no exemplo da representação do conceito de GATO no tesauro THESAGRO: GATO BT MAMÍFERO DOMÉSTICO NT GATO ANGORÁ NT GATO DO MATO RT FELIS CATTUS DOMESTICUS RT FELIS DOMESTICA FELIS CATTUS DOMESTICUS RT GATO FELIS DOMESTICA RT GATO No tesauro THESAGRO, FELIS CATTUS DOMESTICUS89 e FELIS DOMESTICA são nomenclaturas científicas para o nome popular GATO. No entanto, ao invés de indicar que há uma relação de equivalência (USE/UF) entre esses três descritores, os modeladores do THESAGRO atribuíram uma relação associativa (RT) entre o descritor GATO e cada uma das duas nomenclaturas científicas do mesmo conceito. Percebe-se, com essa abordagem de modelagem, que foi perdida a função semântica que conecta os descritores FELIS CATTUS DOMESTICUS e FELIS DOMESTICA, pois eles não estão em uma relação de equivalência, mas apenas associados ao descritor GATO, ficando dispersos na estrutura. Essa situação se repete para todos os organismos vivos incluídos na terminologia do THESAGRO. Pode-se observar que o exemplo de GATO ilustra bem a deliberação dos modeladores do THESAGRO em atribuir relações RT que não são muito evidentes. Entretanto, não há maiores explicações sobre quais critérios foram empregados na atribuição de relações associativas (RT) na estrutura do THESAGRO, e essa questão também não ficou evidente na análise que foi feita na estrutura do tesauro. Foram identificadas cerca de 12.000 representações de relações associativas (RT). A versão impressa do THESAGRO apresenta uma nota explicativa que esclarece e justifica o uso de um alto número de ligações associativas (RT): para os responsáveis pela manutenção do THESAGRO, essa foi uma decisão intencional, visando a “manter certas associações reais detectadas entre os termos, mesmo à primeira vista não sendo evidentes” (THESAGRO, 2006, p. 8). (1.c) Constatou-se, também, que, entre os descritores preferidos, cerca de 2.000 descritores não pertencem a qualquer grupo (cluster) na estrutura hierárquica, estando 89 Ressalta-se que a nomenclatura científica aceita internacionalmente para GATO é FELIS CATUS, originalmente atribuída por Carolus Linnaeus. Contudo, esse ponto não está sendo discutido no escopo desta pesquisa. 201 apenas ligados por relações associativas (TR), e a maior parte desse total não está semanticamente vinculada a outros descritores nem pelo controle da equivalência (USE/UF), sendo considerados descritores órfãos. Essa ocorrência pode ser observada, no THESAGRO, por meio da representação do conceito EXTENSÃO RURAL: EXTENSÃO RURAL RT ASSISTÊNCIA SOCIAL RT ASSISTÊNCIA TÉCNICA RT COMUNICAÇÃO RT COOPERATIVA ESCOLAR RT DIA DE CAMPO RT CURSO RT DIVULGAÇÃO RT ECONOMIA DOMÉSTICA RT EDUCAÇÃO RT EXTENSIONISTA RT FAZENDA EXPERIMENTAL RT JORNALISMO RT RELAÇÕES PÚBLICAS Para melhor percepção do significado expresso nessa representação, apresenta- se a definição do conceito EXTENSÃO RURAL, para análise: Serviços de educação não formal, de caráter continuado, no meio rural, que promovem processos de gestão, produção, beneficiamento e comercialização das atividades e dos serviços agropecuários e não agropecuários, inclusive das atividades agroextrativistas, florestais e artesanais; têm por objetivo garantir assistência de natureza educacional e técnica aos agricultores, visando provocar mudanças de comportamento do povo rural, para a promoção do desenvolvimento sustentável das comunidades do campo. Além disso, possuem objetivos secundários de natureza social (aspiração por melhor padrão de vida), natureza comunitária (sentimento de grupo ou classe rural) e natureza econômico- financeira (aumento de renda da família rural para obtenção das mudanças). Utilizam diversos métodos, dentre os quais se destacam: Curso, Dia de Campo, Unidade Demonstrativa, Demonstração de Resultados, Convenção, Mutirão, Campanha, Exposição, Entrevista, Reunião com Informação, Visita Técnica, entre outros (PEIXOTO, 200990). Observa-se que, na estrutura do tesauro THESAGRO, o descritor EXTENSÃO RURAL não está subordinado a qualquer termo mais genérico (BT), assim como não possui qualquer termo específico (NT). Analisando-se a definição do descritor EXTENSÃO RURAL, é possível perceber que os descritores DIA DE CAMPO e CURSO são considerados tipos 90 PEIXOTO, Marcus. A extensão privada e a privatização da extensão: uma análise da indústria de defensivos agrícolas. 332f. Tese (Doutorado em Ciências) – Universidade Federal Rural do Rio de Janeiro. Rio de Janeiro: UFRRJ, 2009. 202 de método utilizado na extensão rural. Verificando a representação dos descritores DIA DE CAMPO e CURSO no THESAGRO, tem-se: EXTENSÃO RURAL RT ASSISTÊNCIA SOCIAL RT ASSISTÊNCIA TÉCNICA RT COMUNICAÇÃO RT COOPERATIVA ESCOLAR RT DIA DE CAMPO RT CURSO RT DIVULGAÇÃO RT ECONOMIA DOMÉSTICA RT EDUCAÇÃO RT EXTENSIONISTA RT FAZENDA EXPERIMENTAL RT JORNALISMO RT RELAÇÕES PÚBLICAS CURSO BT TREINAMENTO RT EDUCAÇÃO RT EXTENSÃO RURAL DIA DE CAMPO RT EXTENSÃO RURAL Nesse caso, conforme a definição mencionada, CURSO e DIA DE CAMPO poderiam estar subordinados ao descritor EXTENSÃO RURAL, em uma relação hierárquica (BT/NT). Analisando-se as representações dos descritores CURSO e DIA DE CAMPO, percebe-se que o descritor DIA DE CAMPO não está relacionado a qualquer outro descritor na estrutura do THESAGRO, mas poderia estar subordinado ao descritor EXTENSÃO RURAL, em uma relação hierárquica (BT/NT) específica, de gênero-espécie. No entanto, esses dois descritores apresentam apenas uma relação associativa (RT). Observou-se que essa situação é recorrente na representação de outros conceitos, principalmente na representação de organismos vivos, como ilustrado anteriormente, no exemplo do conceito de GATO. Nota-se, assim, que a abordagem de modelagem adotada na construção do THESAGRO reduz o número de relacionamentos hierárquicos e de equivalência e prioriza as relações associativas (RT). (1.d) Outra observação que deve ser apontada trata sobre a identificação de termos e strings, pois o THESAGRO não traz qualquer especificação para que eles possam ser distinguidos. No tesauro THESAGRO, por exemplo, a sistematização do termo MANDIOCA mostra: MANDIOCA UF AIPIM UF MACAXEIRA RT MANIHOT ESCULENTA RT MANIHOT UTILISSIMA MANIHOT ESCULENTA RT MANDIOCA MANIHOT UTILISSIMA RT MANDIOCA Nesse caso, o descritor MANDIOCA é o preferido, e AIPIM e MACAXEIRA são descritores não-preferidos, estando em uma relação de equivalência (USE/UF) com MANDIOCA. Essa é a representação usual da relação de equivalência na estrutura de todo 203 tesauro tradicional. Contudo, a falta de especificação do tipo de equivalência que há entre esses descritores não permite inferir que eles são variações regionais para um mesmo conceito. Com a estrutura conceitual do THESAGRO, nota-se que, a não ser que parta de conhecimentos prévios, não é provável que o usuário perceba a qual tipo de equivalência essa relação se refere. Ele pode colocar-se questões, tais como: trata-se de um sinônimo total ou parcial? Trata-se de variações regionais? É sabido que, na linguagem de especialidade, assim como na linguagem natural, a existência de uma equivalência do tipo sinônimo total ocorre raramente. Sendo assim, quando dois descritores estão relacionados por sinonímia, de modo geral, eles têm sentidos semelhantes, mas não necessariamente iguais, e a informação dessa diferença pode ser relevante para o usuário. A partir do exposto, nesta pesquisa, acredita-se que é possível e preciso agregar maior valor semântico a essas representações, para que o tesauro tradicional possa ser utilizado como um SOC, em ambiente digital. No sentido de especificar as relações existentes na estrutura de um tesauro, principalmente para o seu uso como um SOC, em ambiente digital, o modelo de Soergel (2004; 2006) propõe um formato que permite deixar claro, ainda utilizando o exemplo acima, o tipo de relacionamento existente entre os termos do grupo (cluster) do descritor MANDIOCA. Nesse caso, os descritores não-preferidos AIPIM e MACAXEIRA estariam em uma relação de string, do tipo (UP EQS-LOC), com o descritor preferido MANDIOCA. Com isso, fica claro para o usuário o sentido da relação existente entre esses descritores, pois ela mostra que os descritores são variações regionais para um mesmo conceito. Ainda utilizando o mesmo exemplo, novamente percebe-se o uso de descritor preferencial tanto para a nomenclatura científica de um organismo vivo quanto para o seu nome popular, pois os descritores MANIHOT ESCULENTA e MANIHOT UTILISSIMA são nomes científicos para MANDIOCA. Porém os descritores estão em uma relação associativa (RT), e, não, em uma relação de equivalência com o descritor preferido MANDIOCA. Nome Científico: Manihot esculenta Autor: Crantz Nome Popular: Mandioca, Macaxeira, Aipim Família (Cronquist): Euphorbiaceae Família (APG2): Euphorbiaceae Gênero: Manihot Nome Científico: Manihot utilissima Autor: Pohl Nome Popular: Mandioca, Macaxeira, Aipim Família (Cronquist): Euphorbiaceae Família (APG2): Euphorbiaceae Gênero: Manihot Percebe-se que, com a adoção dessa modelagem, que não é a usual, na estrutura do THESAGRO, há perda de informação semântica sobre o conceito. Além disso, semelhante ao que ocorreu com as relações de equivalência (BT/NT), também não está explicitado qual o tipo específico de relação associativa (RT) existente entre os descritores MANDIOCA, MANIHOT ESCULENTA e MANIHOT UTILISSIMA. Para um usuário leigo, por 204 exemplo, poderá ser difícil entender que MANIHOT ESCULENTA e MANIHOT UTILISSIMA são nomenclaturas científicas para MANDIOCA. Ademais, a existência de uma relação de equivalência entre MANIHOT ESCULENTA e MANIHOT UTILISSIMA se perderá na estrutura semântica do THESAGRO. Isso acontecerá, porque não há registro desse relacionamento, ou de qualquer outra das relações semânticas que compõem o tesauro, entre eles. Nesse caso, já se pode notar a contribuição do modelo de Soergel (2004; 2006), pois, se for aplicado, os descritores MANIHOT ESCULENTA e MANIHOT UTILISSIMA poderão ser ligados ao descritor MANDIOCA por uma relação de equivalência, especificada por: (UP EQ-CIEN). Dessa forma, a representação semântica do conceito MANDIOCA pode ser demonstrada conforme Figura 25. FIGURA 25 – Representação de MANDIOCA, a partir modelo de Soergel (2004; 2006) Fonte: elaborado pela autora desta tese (tela capturada do sistema e-Termos). Percebe-se, através da aplicação do modelo de Soergel (2004; 2006), que é possível representar a estrutura conceitual do conceito MANDIOCA, garantindo a sua representação semântica, em toda a sua extensão. Desta forma, o modelo possibilita que todos os elementos que compõem o conceito MANDIOCA estejam relacionados, de forma explícita, evitando-se que suas relações de equivalência (MANDIOCA, MANIHOT ESCULENTA, MANIHOT UTILISSIMA) e os strings (AIPIM, MACAXEIRA) fiquem dispersos na estrutura do tesauro. 205 A partir desse mesmo exemplo, utilizando a representação gráfica do sistema e- Termos, quando o descritor AIPIM é colocado em foco, tem-se a seguinte representação, conforme Figura 26. FIGURA 26 – Relação de string: descritor AIPIM Fonte: elaborado pela autora desta tese (tela capturada do sistema e-Termos). Neste caso, ao selecionar o descritor AIPIM, fica evidente que ele é um descritor não-preferido, mas que está ligado ao descritor preferido MANDIOCA (USE), em uma relação de equivalência. Percebe-se, também, que os três descritores MANDIOCA, AIPIM e MACAXEIRA estão ligados por uma relação de string, indicando que são variações regionais para um mesmo conceito. Isso pode ser entendido, porque a relação entre eles está explicitada pela expressão verbal (UP EQS-LOC). A identificação de uma relação de string permite e facilita entender que aqueles descritores representam distintos padrões linguísticos para um mesmo conceito, estabelecidos pelas diferenças da cultura, política ou economia de um local, grupo social ou região. Ressalta-se que existe um glossário, composto pelas definições de todos os tipos de relacionamentos utilizados, nesta pesquisa, para o domínio da Agropecuária, apresentado no Apêndice E – Definições das Relações do Domínio da Agricultura. (1.e) O mapeamento na estrutura do THESAGRO indicou a existência de 41 notas de escopo (SN, Scope Note, em inglês), que estão sempre ligadas a um descritor preferido e são utilizadas para explicar o significado desse descritor ou para determinar o seu uso, conforme exemplos a seguir: ALIMENTAÇÃO SUPLEMENTAR SN (adição de concentrados ou de feno à forragem quando esta é insuficiente) 206 ALIMENTAÇÃO SN (para alimentação animal e/ou vegetal, usar, respectivamente, nutrição animal e/ou nutrição vegetal) (1.f) Apesar de a BINAGRI gerenciar a Base Bibliográfica da Agricultura Brasileira (AGROBASE), possuindo diversos glossários sobre o domínio da Agropecuária, o único mecanismo utilizado pelo THESAGRO para apresentar as definições dos conceitos é por meio das notas de escopo (SN). Esse fato dificulta o entendimento das representações que são empregadas na modelagem da estrutura conceitual do tesauro. 7.2.2 Determinação do recorte temático O recorte temático Intensificação Agropecuária, dentro do domínio da Agropecuária, foi o escolhido para iniciar a modelagem. As características desse recorte temático estão descritas no Subcapítulo 2.3. O domínio da Agropecuária é extenso, e o mapeamento da estrutura do THESAGRO evidenciou que o tesauro possui um escopo amplo, que cobre temas que vão de energia a educação. Essa característica do THESAGRO dificultou a aplicação do modelo de conversão em toda a sua estrutura conceitual. O modelo de gestão da Embrapa sugere o desenvolvimento de estruturas conceituais para subáreas do domínio da agricultura, visando a inter-relacioná-las no futuro. 7.2.3 Subdivisão do recorte temático em classes básicas Analisando-se as características da área temática Intensificação Agropecuária, percebeu-se que ela é composta por processos inter-relacionados e, para entendê-la, é preciso levar em consideração diversas variáveis, tais como ambientais, agronômicas, territoriais, socioeconômicas e os contextos institucionais específicos. Na Embrapa já existe uma taxonomia sobre a Intensificação Agropecuária, já descrita no Subcapítulo 6.3.1, que foi elaborada pelos especialistas desse domínio, que tiveram os parâmetros acima como orientação. Por isso, a reengenharia do THESAGRO teve por base a estrutura conceitual dessa taxonomia, que foi empregada como ponto de partida na conversão do tesauro. Conforme descrito no Subcapítulo 6.3.1, essa estrutura conceitual está organizada por um conjunto de nove facetas semânticas, utilizadas para o agrupamento dos conceitos que compõem a taxonomia da Intensificação Agropecuária, a saber: (1) agricultura extensiva; (2) agricultura intensiva; (3) material e métodos; (4) ambiente; (5) agronomia; (6) território e paisagem; (7) socioeconomia; (8) espaço e tempo; (9) instituições. Em uma reunião em Campinas-SP, em agosto de 2014, a equipe de trabalho decidiu manter essas nove facetas semânticas para representar o recorte temático modelado. 207 O estabelecimento das classes básicas e o agrupamento dos conceitos foram realizados em conformidade com os princípios da Teoria do Conceito de Dahlberg (1978a) e da Teoria da Classificação Facetada, segundo a qual uma classe é também considerada um conceito do domínio. Foi aplicada uma modelagem híbrida, com a combinação dos métodos dedutivo e indutivo: (a) método dedutivo: a aplicação desse método iniciou-se com a análise do domínio da Intensificação Agropecuária, caracterizado a partir da teoria de Boserup (1965), cujos princípios determinam uma inter-relação entre a dinâmica da população, seu crescimento ou não, o meio ambiente e o uso da tecnologia, com o aumento ou manutenção da produção agrícola em um dado tempo e lugar. Com esse mapeamento, o domínio foi categorizado pelo conjunto das nove facetas, que representam os campos semânticos da Intensificação Agropecuária; (b) método indutivo: a aplicação do método indutivo partiu das análises dos resultados obtidos pelo projeto INTAGRO sobre os processos de Intensificação Agropecuária da soja e da cana de açúcar, assim como da terminologia extraída do corpus compilado. Os termos extraídos do corpus foram sendo inseridos nas facetas, determinadas no método dedutivo. A terminologia resultante dessa modelagem híbrida possibilitou a estruturação, a delimitação e a representatividade do domínio, culminando na taxonomia da Intensificação Agropecuária, composta por 639 conceitos validados pelo especialista. 7.2.4 Demarcação e composição da amostra Como a taxonomia da Intensificação Agropecuária é composta por 639 conceitos, esse conjunto foi considerado muito extenso para a aplicação do modelo. Dessa forma, foi necessário fazer um recorte mais específico. Assim sendo, desse total, foi selecionada uma amostra, validada pelo especialista e composta por um conjunto de 30 conceitos representativos da área temática de Intensificação Agropecuária. Esse conjunto foi capaz de reproduzir as mesmas características da população de origem. Essa decisão foi tomada em conjunto com o autor do modelo, Dagobert Soergel, que, à época da qualificação desta tese, se encontrava na Escola de Ciência da Informação, como professor visitante. O autor esclareceu que cada conceito carrega o seu grupo (cluster) semântico e, com isso, o número de relacionamentos, que ocorre nessa rede semântica, gera um desdobramento que inviabilizaria o trabalho. Portanto, para a realização desta pesquisa, o professor Dagobert sugeriu que se selecionassem entre 20 e 30 conceitos que fossem representativos do domínio, sendo esta considerada uma amostra de tamanho apropriado e suficiente para a avaliação do modelo. A técnica utilizada para a seleção da amostra foi a amostragem não-aleatória (ou não-probabilística), cujo processo de seleção teve por base o controle da variabilidade 208 amostral. Portanto, os termos que compõem essa amostra foram selecionados intencionalmente (amostragem intencional), pelo modelador e especialista, a partir dos critérios: (a) cada uma das nove facetas deve fazer ser um dos conceitos da amostra ou ter pelo menos um conceito que a represente; (b) o conjunto de termos, em cada faceta, deve ser representativa da classe; (c) o conjunto dos 30 conceitos deve ser representativo do recorte temático da Intensificação Agropecuária. Como resultado dessa análise, os 30 conceitos selecionados foram os seguintes: QUADRO 7 – Conjunto dos conceitos da amostra 1. INTENSIFICAÇÃO AGROPECUÁRIA 2. AGRICULTURA EXTENSIVA 3. AGRICULTURA INTENSIVA MATERIAL E MÉTODOS 4. cultura 5. sensoriamento remoto 6. sistema de informação geográfica AMBIENTE 7. meio ambiente 8. ambiente físico 9. solo AGRONOMIA 10. manejo da cultura 11. manejo do solo 12. pousio 13. período de pousio 14. pesticida 15. ciclo da cultura 16. cultura anual 17. pecuária 18. adubo verde 19. produto agropecuário 20. biomassa TERRITÓRIO E PAISAGEM 21. posse da terra 22. escassez de terra 23. cobertura da terra 24. mudança de cobertura da terra SOCIOECONOMIA 25. densidade demográfica 26. crescimento populacional 27. pressão populacional ESPAÇO E TEMPO 28. mudança agrícola 29. análise de séries temporais INSTITUIÇÕES 30. Embrapa Fonte: elaborado pela autora desta tese. Considera-se que esse conjunto de 30 conceitos possui representatividade satisfatória e suficiente do recorte temático da Intensificação Agropecuária. Visando esclarecer sobre a capacidade da amostra em representar o recorte temático, apresenta-se um texto explicativo, com base nos princípios da teoria de Boserup. Essa teoria pressupõe que a Intensificação Agropecuária é toda prática agropecuária que aumenta a produção em uma mesma área de plantio, sempre levando em consideração a biodiversidade, a sustentabilidade e segurança alimentar. Para facilitar a identificação dos itens da amostra, as facetas semânticas estão marcadas em negrito e os conceitos da amostra estão sublinhados. 209 A INTENSIFICAÇÃO AGROPECUÁRIA expressa uma relação estabelecida entre a população de uma região, o ambiente dessa região e a tecnologia utilizada para a produção de culturas e pecuária. Esse processo é determinado em um dado espaço e tempo, pois é um fenômeno que deve ser medido, para determinar-se se ocorre ou não. Ele pode ser identificado por meio de análises de séries temporais da produção dessa região, com dados obtidos através de ferramentas computacionais de geoprocessamento, tais como os sistemas de informação geográfica. No contexto da Intensificação Agropecuária, a população envolve a análise de fatores socioeconômicos (socioeconomia), abarcando a densidade demográfica, seu tamanho absoluto e a taxa de seu crescimento populacional. Por sua vez, o meio ambiente tem relação com o ambiente físico (recursos físicos e químicos), a posse da terra, a utilização dos recursos do solo, a cobertura da terra, a qualidade do solo e as influências climáticas na produção. Já a tecnologia engloba todo tipo de aparato tecnológico, os materiais e métodos empregados na produção, sejam os maquinários (trator, colheitadeira), as técnicas de uso da terra (pousio, período de pousio, conservação do solo, mudança na cobertura da terra) ou os insumos utilizados, tais como o adubo verde e o adubo animal. Sempre que a população cresce, há uma pressão populacional que gera escassez de alimentos, demandando por uma maior produção de alimentos, cuja primeira alternativa de solução é, geralmente, uma agricultura extensiva. Nesse sentido, no processo da agricultura extensiva, percebe-se uma alteração no território e paisagem, evidenciando uma mudança agrícola, quando maiores extensões de terras, com vegetação natural, são desmatadas para o cultivo de plantas e/ou animais. Caso a escassez de terra ou as políticas públicas inviabilizem o desflorestamento, outra alternativa é empregar a agricultura intensiva. O processo da agricultura intensiva envolve o uso de tecnologia para maximizar a produção em uma mesma área de cultivo (animal e vegetal). Nesse contexto, é preciso aplicar técnicas e conhecimentos advindos da agronomia, tais como o manejo da cultura, manejo do solo, ciclo da cultura (por exemplo, cultura anual e cultura perene), combate a pragas e doenças (por exemplo, usando pesticidas e fertilizantes), métodos de colheita, armazenamento e distribuição da safra e do produto agropecuário. Também abrange a utilização de recursos renováveis, tal como a biomassa, que é toda matéria orgânica, de origem vegetal ou animal, empregada na produção de energia. Instituições no mundo, tal como a brasileira EMBRAPA, desenvolvem pesquisas no domínio da agropecuária para atender às demandas dos agricultores e da sociedade em geral. Nessa atividade, fazem também o mapeamento de toda a produção nacional, empregando tecnologias sofisticadas para, por exemplo, obtenção e registro de imagens e dados da superfície terrestre – o sensoriamento remoto. 210 7.3 ETAPA DOIS: COLETA DE TERMINOLOGIA Para esta etapa, Soergel (2004; 2006) recomenda coletar a terminologia e outras informações acerca do domínio que será modelado, utilizando como insumos a terminologia e a estrutura conceitual de outros tesauros, e a partir de consulta a especialistas, glossários, dicionários e bases de dados com bibliografia técnica e científica. O reuso de conhecimento é importante na reengenharia de tesauros, portanto, cada fonte de informação foi analisada detalhadamente, verificando-se quais termos candidatos poderiam ser realmente incluídos no tesauro. O detalhamento desta etapa resultou nos seguintes procedimentos: (1) identificação e seleção de tesauros e outras fontes; (2) coleta de terminologia; (3) análise e escolha de terminologia. 7.3.1 Identificação e seleção de tesauros e outras fontes Como já mencionado, a coleta de terminologia teve como ponto de partida a taxonomia da Intensificação Agropecuária (descrito no Subcapítulo 6.3.1). Para a seleção dos tesauros, foram identificados, na literatura, tesauros no domínio Agropecuário, conforme exposto no Apêndice D. Os seguintes tesauros foram selecionados: (a) tesauro THESAGRO (descrito no Subcapítulo 6.3.2); (b) tesauro AGROVOC (descrito no Subcapítulo 6.3.3); (c) tesauro NAL (descrito no Subcapítulo 6.3.4). Destaca-se que a terminologia utilizada para a reengenharia do THESAGRO teve por base a taxonomia da Intensificação Agropecuária (item “a”), que foi alimentada pelos insumos terminológicos e de estruturas conceituais do próprio THESAGRO, tesauro que foi escolhido para a conversão, do AGROVOC e do NAL. Esses instrumentos foram selecionados pelos seguintes fatores: (1) não foi encontrado qualquer vocabulário com escopo específico da Intensificação Agropecuária; (2) os tesauros AGROVOC e NAL, juntamente com o THESAGRO, já são utilizados, em diferentes unidades da Embrapa, para a organização e indexação de documentos; (3) os três tesauros possuem escopo mais abrangente, dentro do domínio mais amplo, da Agropecuária; (4) o AGROVOC e o NAL já integram, como fonte externa de informação, alguns outros tesauros existentes no domínio. Para dar apoio à composição da estrutura conceitual final dos 30 conceitos da amostra e, principalmente, à confecção das definições desses conceitos, e para o entendimento do domínio, foram identificadas outras fontes de informação, tais como glossários, dicionários e bases de dados, com bibliografia técnica e científica sobre o 211 domínio da agricultura. Assim, além de consultas aos especialistas, foram selecionadas as seguintes fontes de informação: (a) AGROBASE: base referencial gerenciada pela Biblioteca Nacional de Agricultura (BINAGRI), cobrindo temas sobre a área da Agropecuária e áreas afins, que inclui documentos técnicos e científicos, tais como monografias, relatórios, documentos de congressos, teses e dissertações, publicações seriadas e artigos de periódicos; (b) Base de Dados da Pesquisa Agropecuária – BDPA: base composta pelos acervos das bibliotecas da EMBRAPA, constituída por documentos tais como relatórios, informações técnicas e científicas, livros, teses, trabalhos apresentados em eventos; (c) Dicionário Agrícola CERES – Agronomia Século XXI: inclui informações científicas e técnicas sobre vegetais, animais, minerais e tecnologias geradas pela pesquisa agronômica; (d) Glossário de Termos usados na Agricultura: dicionário que apresenta a tradução de termos da área da Agropecuária, em português/inglês e inglês/português; (e) Glossário de Termos Usados em Atividades Agropecuárias, Florestais e Ciências Ambientais: possui cerca de três definições para termos da área da agricultura e afins, inclusive para alguns termos em língua estrangeira. Destaca-se que o resultado do levantamento, na literatura, dos tesauros e das outras fontes de informação agrícolas está exposto no Apêndice D, Lista de Tesauros e Fontes da Agricultura. 7.3.2 Coleta de terminologia A coleta de terminologia foi realizada por meio da comparação entre os 30 conceitos da amostra, oriundos da terminologia da taxonomia, e a terminologia existente em cada um dos três tesauros selecionados (THESAGRO, AGROVOC e NAL). A listagem original para a comparação foi composta pelos 30 conceitos da amostra, que foi subdividida em duas listas: Lista Um: composta pelos 30 termos, que representam os 30 conceitos da amostra, em português brasileiro, adicionando-se as expressões desses termos no singular e plural; Lista Dois: composta pelos 30 termos, que representam os 30 conceitos da amostra, traduzidos para o inglês, adicionando-se as expressões desses termos no singular e plural, assim como na sua forma inversa (adjetivo + substantivo), por essa inversão ser comum na língua inglesa. As traduções dos termos da amostra foram realizadas, com a ajuda do especialista, pelos textos e informações recuperadas nas fontes de informação selecionadas 212 na fase anterior (dicionários, glossários e bases de dados) e pela ferramenta Concordanceador, que é integrante do sistema e-Termos. Essa ferramenta permitiu que se observasse a ocorrência de uma palavra ou expressão em seu contexto textual, para melhor entendimento de seu significado. O procedimento da comparação terminológica foi realizado utilizando-se a ferramenta ETECAM, descrita no Subcapítulo 6.2, que foi desenvolvida pela Embrapa. A ferramenta permitiu recuperar os termos coincidentes com as duas listas elaboradas, comparando os termos de cada uma delas com a terminologia existente nos tesauros, separadamente. Acoplados aos termos coincidentes nos tesauros, foram recuperados os seus grupos (clusters) semânticos, que representam a estrutura conceitual de cada termo. Após o resultado da comparação automática, foi feita a comparação intelectual, a partir da análise in loco das estruturas semânticas dos três tesauros, para conferência e validação. O conjunto da rede semântica, obtido pela comparação automática e intelectual, que representa todos os termos coincidentes à amostra encontrados nos tesauros, está apresentado no Quadro 8 (lista de termos em inglês) e no Quadro 9 (lista de termos em português). QUADRO 8 – Comparação terminológica nos tesauros, em inglês AGROVOC THESAGRO PT/BR NAL 1. agricultural products 2. annual (annual crop) 3. biomass 4. crop management 5. crops 6. environment 7. extensive farming 8. fallow 9. geographical information systems 10. green manures 11. intensive farming 12. land cover 13. land cover change 14. land tenure 15. livestock 16. pesticides 17. population density 18. population growth 19. population pressure 20. remote sensing 21. soil 22. soil management 23. time series analysis Não possui terminologia em inglês. 1. agricultural products 2. biomass 3. crop management 4. crops 5. environment 6. fallow 7. land cover 8. land tenure 9. livestock 10. pesticides 11. population density 12. population growth 13. remote sensing 14. soil 15. soil management Fonte: elaborado pela autora desta tese. 213 O resultado da comparação realizada com a lista dos 30 conceitos, da amostra em inglês, recuperou 23 termos coincidentes no AGROVOC, que representam mais de 75% dos termos da amostra; 15 termos coincidentes no NAL, que representam 50% dos termos da amostra. No THESAGRO não foram recuperados termos coincidentes usando a lista em inglês. Isso ocorreu por ele ser um tesauro monolíngue, com terminologia em português brasileiro (PT/BR). No AGROVOC, a comparação automática somente deixou de recuperar um único termo “annual (annual crop)”, que foi resgatado pela comparação intelectual, conforme pode ser observado no item dois do Quadro 8. O Quadro 9 apresenta os resultados da comparação realizada nos três tesauros, com a lista dos 30 conceitos, utilizando a amostra dos termos em português brasileiro (PT/BR). QUADRO 9 – Comparação terminológica nos tesauros, em português AGROVOC PT/EU THESAGRO PT/BR NAL 1. adubo verde 2. agricultura extensiva 3. agricultura intensiva 4. alteração do coberto vegetal (mudança de cobertura da terra) 5. ambiente (meio ambiente) 6. análise de séries cronológicas (análise de séries temporais) 7. biomassa 8. cobertura do solo (cobertura da terra) 9. crescimento demográfico (crescimento populacional) 10. cultura 11. densidade demográfica 12. gado (pecuária) 13. gestão da colheita (manejo da cultura) 14. pesticida 15. planta anual (cultura anual) 16. posse da terra 17. pousio 18. preparação do solo (manejo do solo) 19. pressão demográfica (pressão populacional) 20. produto agrícola (produto agropecuário) 21. sistema de informação geográfica 22. solo 23. teledetecção (sensoriamento remoto) 1. adubo verde 2. biomassa 3. cultivo anual (cultura anual) 4. cultivo intensivo (agricultura intensiva) 5. cultura 6. densidade demográfica 7. evolução populacional (crescimento populacional) 8. manejo do solo 9. meio ambiente 10. pecuária 11. pesticida 12. posse de terra (posse da terra) 13. pousio 14. produto (produto agropecuário) 15. sensoriamento remoto 16. solo Não possui terminologia em português. Fonte: elaborado pela autora desta tese. 214 O Quadro 9 mostra o resultado da comparação automática e a intelectual entre os tesauros de terminologia em português. No THESAGRO, no total, foram recuperados 16 termos coincidentes, que representam pouco mais de 50% dos termos da amostra. Desse total, a comparação automática conseguiu recuperar onze termos, que representam quase 70% do total dos termos da amostra, e, com a comparação intelectual, foram resgatados os cinco termos restantes, ou pouco mais de 30% do total. Como o NAL é um tesauro multilíngue, apresentando termos em inglês e espanhol, não foram recuperados termos coincidentes utilizando a lista de termos em português. Já no AGROVOC, utilizando a amostra em português, a comparação recuperou 23 termos coincidentes no total, que representam mais de 75% da amostra. Nota-se que esse número de termos extraídos foi igual ao resultado da comparação realizada com a lista dos termos da amostra em inglês. Do total dos 23 termos coincidentes, a comparação automática recuperou 11 termos, que representam menos de 50% dos termos da amostra em português. Por sua vez, a comparação intelectual resgatou 12 termos, que representam pouco mais de 50% dos termos da amostra, que são aqueles termos destacados entre parênteses. A dificuldade observada com a comparação automática no AGROVOC, utilizando a lista em português brasileiro (PT/BR), ocorreu porque o AGROVOC possui equivalência terminológica com o português europeu (PT/EU), que às vezes se diferencia da terminologia utilizada no Brasil, conforme mostra o Quadro 10. QUADRO 10 – Diferenças de padrões terminológicos em português europeu e brasileiro PORTUGUÊS EUROPEU (PORTUGAL) PORTUGUÊS BRASILEIRO Planeamento agrícola Planejamento agrícola Controlo da reprodução Controle da reprodução Coberto arbóreo ou arbustivo Cobertura arbórea ou arbustiva Investigação agrária Pesquisa agrícola Criação de aves de capoeira Avicultura Pousio inculto Pousio nu Mobilização do solo Trabalho do solo Administração da exploração agrícola Gestão agrícola Dotação de irrigação Grau de irrigação Cultivo estreme Cultivo puro Gestão da colheita Manejo da cultura Bosta Esterco Dimensão do talhão Dimensão da parcela Tratamento do pescado Processamento de pescado Penúria alimentar Escassez alimentar Mobilização do solo para conservação Práticas de conservação do solo Agente de luta biológica Agente de controle biológico Monda Capina 215 PORTUGUÊS EUROPEU (PORTUGAL) PORTUGUÊS BRASILEIRO Teledetecção Sensoriamento remoto Abelhão Mamangava; mamangaba Fonte: resultados da comparação terminológica, no projeto INTAGRO. Nesses casos, percebem-se claramente as diferenças nos padrões linguísticos entre Brasil e Portugal, o que dificulta a adequação da terminologia do AGROVOC, em sua versão em português, para representar a Agropecuária brasileira. Voltando à composição dos grupos (clusters) semânticos dos 30 conceitos da amostra que representam o recorte temático da Intensificação Agropecuária, verificou-se que a coleta de terminologia realizada a partir das comparações terminológicas com os três tesauros (THESAGRO, AGROVOC e NAL), apresentadas nos Quadros 8 e 9, deixou de resgatar os agrupamentos de sete conceitos, a saber: (1) intensificação agropecuária; (2) ambiente físico; (3) período de pousio; (4) ciclo da cultura; (5) escassez de terra; (6) mudança agrícola; (7) Embrapa. Sendo assim, os grupos (clusters) semânticos desses sete conceitos foram extraídos da estrutura da taxonomia da Intensificação Agropecuária. 7.3.3 Análise e escolha de terminologia As comparações terminológicas realizadas na fase anterior, Coleta de Terminologia, tiveram como resultados distintos grupos (clusters) semânticos para cada termo coincidente à amostra. A análise foi realizada em todos esses resultados, visando à construção de uma estrutura conceitual para os 30 conceitos da amostra, a partir da combinação dos grupos (clusters) semânticos recuperados na comparação terminológica. Para a criação dessa estrutura, anteriormente foram efetuadas diversas reformulações e validações, para que ela ficasse adequada ao propósito desta pesquisa. A estrutura com cerca de 300 conceitos está apresentada no Apêndice C, Estrutura Semântica Inicial. 7.4 ETAPA TRÊS: EDIÇÃO DO THESAGRO Esta etapa da edição do tesauro THESAGRO incluiu a atividade intelectual da modelagem do domínio e a inserção da estrutura conceitual em um software para a gestão da terminologia. Os procedimentos aplicados tiveram por base os princípios dos trabalhos terminológicos e documentários, descritos nos Subcapítulos 5.1, 5.2, 5.3 e 5.4, juntamente com os princípios da organização do conhecimento para a disponibilização e recuperação de informação, que tem por base os fundamentos da Ciência da Informação. O detalhamento desta etapa resultou nos seguintes procedimentos: (1) escolha do software; (2) compilação da base definicional; (3) elaboração de glossário (com as 216 definições dos termos); (4) registro das fichas terminológicas; (5) construção do sistema de conceitos; (6) determinação de notas de escopo. 7.4.1 Escolha do software O software escolhido para o trabalho terminológico foi o sistema e-Termos, cujas características estão descritas no Subcapítulo 6.2, que permitiu o gerenciamento da terminologia criada. O sistema e-Termos permitiu a sistematização operacional, manipulação e armazenamento do recurso informacional necessários à reengenharia do tesauro, organizando o trabalho terminológico em seis etapas: (1) compilação do corpus; (2) suporte de análise do corpus; (3) extração automática de termos; (4) criação do mapa conceitual; (5) gerenciamento da base de dados terminológicos; (6) edição do verbete e publicação do produto terminológico. No caso específico desta pesquisa, partiu-se de uma estrutura conceitual já pronta, referente aos 30 termos da amostra trabalhada, não sendo necessário passar pelas etapas um, dois e três do sistema e-Termos. Dessa maneira, o trabalho terminológico de reengenharia do THESAGRO foi realizado de forma semiautomática, utilizando-se as etapas quatro, cinco e seis do software. Ressalta-se que, ainda que haja certa linearidade na sistematização e realização das etapas, o trabalho terminológico exigiu o constante refinamento das definições dos termos e da estrutura conceitual do tesauro convertido. Sendo assim, muitas vezes foi necessário voltar às etapas já concluídas e reformular a estrutura do tesauro, para a sua readequação ao objetivo proposto ou pelas próprias limitações do software utilizado. 7.4.2 Compilação da base definicional A compilação da base definicional é uma das etapas que compõem o sistema e- Termos e foi utilizada para recolher e armazenar contextos explicativos ou definitórios sobre o domínio modelado. Essa fase foi realizada de forma dinâmica, o que permitiu a constante atualização da base. Posteriormente, esse recurso auxiliou a elaboração das definições terminológicas dos conceitos da amostra. A busca pelos contextos definitórios foi realizada utilizando-se os textos e as informações recuperadas nas fontes de informação selecionadas na etapa dois – glossários, dicionários e bases de dados da área da agricultura –, assim como buscas na web, em textos técnicos e científicos. A escolha dos excertos para compor a base definicional de cada termo se deu a partir da análise intelectual das fontes selecionadas. 217 7.4.3 Elaboração do glossário O glossário criado foi composto pelas definições dos 30 conceitos da amostra, que delimitou o campo nocional ou conceitual, dentro do domínio de especialidade. Essa delimitação seguiu os critérios: (a) a adequação do texto definitório conforme o público-alvo e a finalidade pretendida; (b) os conteúdos definitórios estabelecidos; (c) os contextos inseridos na base definicional; (d) as convenções quanto à estrutura textual. A elaboração da definição foi a fase mais complexa do processo, pois exigiu a participação conjunta da equipe de trabalho, e as definições foram inicialmente redigidas com base nos conteúdos dos excertos da base definitória, no sistema e-Termos. Dessa forma, as definições se dividiram em: (i) definição inicial: elaborada com maior exaustividade; (ii) definição do especialista: validada pelo especialista do domínio; (iii) definição final: elaborada em conjunto pela equipe de trabalho; (iv) definição do modelador: elaborada pelo modelador para adequação ao modelo definitório determinado para a proposta desta pesquisa, apresentada no Apêndice H, Definições para os Conceitos da Amostra. Ressalta-se que, em geral, os termos sinônimos e os quase sinônimos não são definidos, assim como as suas variantes (strings), sendo definido apenas o termo selecionado como descritor preferido. O enunciado definitório do modelador incluiu uma série de elementos, não necessariamente obrigatórios, que foram descritos o mais exaustivamente possível: . As definições elaboradas pelo modelador estão descritas no Apêndice H, “Definições para os Conceitos da Amostra”. Esse modelo de enunciado, com a descrição dos atributos e características dos termos da amostra, levou em consideração os fundamentos teóricos específicos sobre a definição, descritos no Subcapítulo 5.4.3. Assim, as definições iniciais foram elaboradas com a maior exaustividade possível, por extensão (conceito superordenado) e/ou por intensão (características específicas) e/ou por coordenação (elementos em mesmo nível dentro de uma classe). Todas as informações relevantes foram também registradas nas fichas terminológicas, no banco de dados do sistema e-Termos. 7.4.4 Registro das fichas terminológicas Para sistematizar e registrar as características e os campos semânticos dos 30 conceitos da amostra, foram utilizadas as fichas terminológicas, compostas por 38 campos 218 semânticos. Essa é uma das etapas que compõem o sistema e-Termos e é auxiliada pelos excertos da base definicional. No sistema e-Termos, o protocolo da ficha terminológica possui os campos semânticos Termo e Código do Termo, que são automáticos, aos quais foram adicionados os 36 campos obrigatórios ou opcionais, descritos no Quadro 11. QUADRO 11 – Campos semânticos da ficha terminológica CAMPOS DA FICHA CONTEÚDO SEMÂNTICO OBRIG. Morfologia Indica a classe morfológica à qual o termo pertence, com as opções: Adjetivo (adj.); Advérbio (adv.); Substantivo feminino (s.f.); Substantivo masculino (s.m.); Verbo (v.) SIM Definição Inicial Definição elaborada pelo terminólogo. SIM Definição do Especialista Definição elaborada pelo especialista do domínio. NÃO Definição Final Definição elaborada em conjunto, pelo terminólogo e pelo especialista de domínio. NÃO Definição do Modelador Definição elaborada pelo modelador para adequação ao modelo definitório determinado na proposta de pesquisa. SIM Nota de Escopo (NE) Definição que explica o sentido e a maneira como o termo definido deve ser empregado. NÃO Glosa Contém informações de caráter linguístico, que comentam o sentido e aspectos referentes à origem, formação, explicação e interpretação do termo definido. NÃO Informação Enciclopédica Reúne um conjunto de conhecimentos, dentro do domínio modelado, sobre o termo definido, com informações que se referem ao histórico ou à utilização do termo (ou unidade terminológica) definido, tendo por base os excertos coletados e armazenados na base definitória e informações coletadas por sugestão da equipe de trabalho. NÃO Equivalente em Inglês Indica o termo equivalente do termo definido no idioma inglês. Ex.: agricultura intensiva intensive agriculture NÃO Equivalente Sinônimo Indica um termo que é sinônimo do termo definido, de forma que ambos podem ser intercambiados, sem que se perca o sentido esperado. Ex.: agricultura intensiva exploração agrícola intensiva NÃO Equivalente Aproximado Indica um termo considerado sinônimo do termo definido, com significado aproximado, mas não exatamente igual. Ex.: agricultura extensiva produção extensiva. NÃO Equivalente Mais Amplo Recomenda uma postagem genérica, indicando um termo que representa uma classe de termos considerados sinônimos do termo definido. Ex.: cadeira mobília. NÃO Equivalente Específico Recomenda uma postagem genérica, indicando um termo sinônimo que compõe a classe de termos representada pelo termo definido. Ex.: mobília cadeira; mesa; sofá NÃO Equivalente Nome Antigo Indica um termo obsoleto, que foi descartado ou está em desuso, que foi substituído pelo termo definido. Ex.: camponês <é nome antigo de> agricultor familiar NÃO 219 CAMPOS DA FICHA CONTEÚDO SEMÂNTICO OBRIG. Equivalente Nome Científico Indica a nomenclatura científica, determinada por convenção internacional, para o termo definido. Ex.: abelha Apis mellifera scutellata NÃO Equivalente Nome Comercial ou Institucional Indica o nome comercial do termo definido. Ex.: Sadia Brasil Foods NÃO Equivalente Antônimo Indica um termo em equivalência por oposição ao termo definido, pois possuem traços semânticos que permitem conectá-los, semelhante a uma dicotomia. Ex.: agricultura extensiva agricultura intensiva NÃO String Abreviatura Indica um termo composto por letras, símbolos ou sinais como recurso convencional para representar, de forma reduzida, o termo definido. Ex.: Eng.-Agr.<é string abreviatura de> Engenheiro-Agrônomo NÃO String Acrônimo Indica um termo composto por um conjunto das letras iniciais de uma expressão, com mais de uma palavra, que é utilizado para representar o termo definido. Ex.: CONFEA <é string acrônimo de> Conselho Federal de Engenharia, Arquitetura e Agronomia NÃO String Fórmula Indica um conjunto de letras, números e/ou símbolos que representa o termo definido. Ex.: água H2O NÃO String Nome Local Indica uma variação local ou regional para o termo definido. Ex.: Manihot esculenta aipim NÃO String Transliteração Indica um termo composto por caracteres que translitera o termo definido a partir do termo no idioma de origem. Ex.: a palavra russa ПAПA papa (a tradução é pai); o nome em russo Владимир Vladimir (a tradução também é Vladimir). NÃO String Símbolo Indica um símbolo que representa o termo definido. Ex.: joaninha <é string símbolo de> agricultura orgânica NÃO String Ortográfica Indica uma variação ortográfica do termo definido, podendo ser de grafia, plural/singular e preposicional (de, da, para, em, etc.). Ex.: cultura culturas NÃO Termo Genérico (TGG) Indica um termo mais genérico, que liga o termo definido à sua classe mais ampla. Ex.: cobertura da terra Território e Paisagem NÃO Termo Específico (TEG) Indica um termo mais específico, que liga o termo definido às suas espécies. Ex.: Território e Paisagem cobertura da terra NÃO Termo Geral Partitivo (TGP) Indica um termo que representa um todo, que inclui o termo definido. Ex.: crescimento populacional Socioeconomia NÃO Termo Específico Partitivo (TEP) Indica um termo que representa uma parte inerentemente incluída no termo definido. Ex.: Socioeconomia crescimento populacional NÃO 220 CAMPOS DA FICHA CONTEÚDO SEMÂNTICO OBRIG. Termo Geral Instância (TGI) Indica um termo que representa uma classe de objetos ou eventos, que inclui o termo definido. Ex.: crescimento populacional Dinâmica Populacional NÃO Termo Específico Instância (TEI) Indica um termo, que representa uma classe de objetos ou eventos, que inclui o termo definido. Ex.: Dinâmica Populacional crescimento populacional NÃO Termo Relacionado (TR) Indica um termo que está não hierarquicamente relacionado com o termo definido, de diferentes formas, a partir do repertório de relacionamentos para a Intensificação Agropecuária. NÃO Variação Conceitual (homonímia) Indica a existência de variação conceitual (homonímia) para o termo. Ex.: Togo (país da África) e Togo (espécie de animal invertebrado) NÃO Área Indica a área de conhecimento do domínio ao qual o termo definido pertence. Ex.: Agropecuária SIM Subárea Indica a subárea de conhecimento do domínio ao qual o termo definido pertence. Ex.: Intensificação Agropecuária SIM Data Criação Informa a data de criação da ficha terminológica do termo definido. SIM Responsável Ficha Informa o responsável pelo preenchimento da ficha terminológica do termo definido. SIM Fonte: elaborado pela autora desta tese. Observa-se que a maior parte dos campos não é obrigatória, uma vez que seu preenchimento dependerá das demandas e dos objetivos específicos de cada conceito registrado. 7.4.5 Construção do sistema de conceitos A construção do sistema de conceitos foi realizada a partir dos conteúdos das definições e dos registros das fichas terminológicas. Essa estruturação dos conceitos foi possível utilizando-se as referências de significado dos 30 conceitos da amostra, com a verificação da forma que cada um dos conceitos é concretamente usado no discurso da especialidade e no domínio em geral. Para que o tesauro pudesse ter uma significação própria, que atendesse ao objetivo proposto, foi necessário que suas unidades (conceitos) tivessem um arranjo que estabelecesse relacionamentos mútuos entre eles. Esse arranjo foi estabelecido com base nos princípios da Biblioteconomia e Ciência da Informação, conforme descritos nos Subcapítulos 5.4, 5.6 e 5.7, o que permitiu a definição e estruturação dos conceitos de forma sistêmica. Eles foram organizados nas nove classes básicas, formando a estrutura semântica do sistema de conceitos. Além disso, foram empregados os 221 aportes da Terminologia, que respaldaram o processo de delimitação e definição dos conceitos e termos do domínio. Esses aspectos forneceram subsídios para a interpretação do significado dos conceitos da área da Intensificação Agropecuária, fundamentos estes que estão descritos nos Subcapítulos 5.2, 5.3 e 5.4. Para a reengenharia do THESAGRO, foram consideradas as bases do modelo de reengenharia de Soergel (2004; 2006) e as recomendações da norma ISO 25964, Parte 1 (2011) e Parte 2 (2013), que é a compilação dos requisitos mais atualizados para a construção de tesauros. A adoção de normas internacionais para a construção de tesauros facilita a reengenharia desse instrumento, sua conversão em ontologias e auxilia na interoperabilidade com outros vocabulários, por oferecer parâmetros que permitem maior formalidade nessa atividade, conforme evidenciou a revisão de literatura, exposta no Capítulo Quatro. Destaca-se que, diferentemente dos tesauros tradicionais, que somente indicam uma ligação genérica da relação associativa (RT), no AGROVOC, essa relação está representada de outra maneira. Na reformulação do AGROVOC, conforme já mencionado no Subcapítulo 6.3.3, os tipos específicos das relações associativas entre conceitos foram explicitados na sua estrutura. Como parte dessa reformulação, foi elaborado o vocabulário Agrontology91, composto por 170 distintos tipos de relacionamentos (de equivalência, hierárquicas e associativas), incluindo os relacionamentos inversos92, para o domínio da Agropecuária, que é considerado um subvocabulário do AGROVOC. Esse conjunto de relacionamentos foi analisado para ser adotado, nesta pesquisa, como recurso para o estabelecimento do sistema de conceitos da amostra. Desse total de 170 relacionamentos, somente 48 deles, menos de 30% do total, possuíam definição que explicasse o seu significado e uso. Sendo assim, foram elaboradas definições para as 122 relações restantes, somando mais de 70% do total. Além disso, foi necessário acrescentar treze novos tipos de relacionamentos, para que fosse possível representar o domínio e para que o conjunto de relações fosse adequado ao modelo utilizado para a reengenharia do tesauro. Ao final, esse conjunto de relações e suas respectivas definições foram validados e está apresentado no Apêndice E, Definições das Relações do Domínio da Agricultura. Nesse Apêndice, junto às definições dos relacionamentos, está indicada a classificação de cada tipo de relação, segundo o seu papel Qualia (Formal, Télico, Agentivo ou Constitutivo), conforme descrito no Subcapítulo 5.8. Para o agrupamento sistemático dos relacionamentos, foi elaborada uma taxonomia que estrutura as relações por seus tipos (gênero-espécie, partitiva, instância, equivalência, 91 Disponível em: . 92 Consideram-se inversos os relacionamentos que indicam reciprocidade de ligação entre conceitos como, por exemplo, a relação associativa que possui a relação associativa inversa <é_influenciado_por>. 222 string, associativa e definitória). Esse resultado está exposto no Apêndice F, Taxonomia das Relações do Domínio da Agricultura. Na modelagem dos 30 conceitos da amostra, foram aplicados 44 diferentes tipos de relações, incluídos alguns relacionamentos inversos, conforme mostra o Quadro 12. QUADRO 12 – Conjunto relações aplicado na amostra NOME DA RELAÇÃO PAPEL QUALIA TIPO RELAÇÃO 1. afeta (TR) AGENTIVO ASSOCIATIVA 2. atuaSobre (TR) AGENTIVO ASSOCIATIVA 3. causa (TR) AGENTIVO ASSOCIATIVA 4. éAfetadoPor (TR) AGENTIVO ASSOCIATIVA 5. éControladoPor (TR) AGENTIVO ASSOCIATIVA 6. éFeitoAPartirDe (TR) AGENTIVO ASSOCIATIVA 7. éInfluenciadoPor (TR) AGENTIVO ASSOCIATIVA 8. éInfluenciadoPorOuDependeDe (TR) AGENTIVO ASSOCIATIVA 9. influencia (TR) AGENTIVO ASSOCIATIVA 10. seDesenvolveEm (TR) AGENTIVO ASSOCIATIVA 11. temBenefícioDe (TR) AGENTIVO ASSOCIATIVA 12. temMétodoDeControle (TR) AGENTIVO ASSOCIATIVA 13. éInsumoPara (TR) CONSTITUTIVO ASSOCIATIVA 14. éTipoRelacionadoA (TR) CONSTITUTIVO ASSOCIATIVA 15. inclui (TR) CONSTITUTIVO ASSOCIATIVA 16. incluídoEm (TR) CONSTITUTIVO ASSOCIATIVA 17. temPropriedade (TR) CONSTITUTIVO ASSOCIATIVA 18. utilizaValor (TR) CONSTITUTIVO ASSOCIATIVA 19. éPráticaPara (TR) TÉLICO ASSOCIATIVA 20. éProcessoPara (TR) TÉLICO ASSOCIATIVA 21. éUsadoComo (TR) TÉLICO ASSOCIATIVA 22. éUsadoEm (TR) TÉLICO ASSOCIATIVA 23. éUtilizadoComo (TR) TÉLICO ASSOCIATIVA 24. fazUsoDe (TR) TÉLICO ASSOCIATIVA 25. temObjetivoOuProcesso (TR) TÉLICO ASSOCIATIVA 26. temObjetoDeAtividade (TR) TÉLICO ASSOCIATIVA 27. temPrática (TR) TÉLICO ASSOCIATIVA 28. usaProcesso (TR) TÉLICO ASSOCIATIVA 29. temNotaDeEscopo (NE-TEM) FORMAL DEFINITÓRIA 30. referenciadoEmNotaEscopo (NE-REF) FORMAL DEFINITÓRIA 31. temSinonímiaAproximada (UP EQ-APR) FORMAL EQUIVALÊNCIA 32. temSinônimo (UP EQ-SIN) FORMAL EQUIVALÊNCIA 33. temTraduçãoEN FORMAL EQUIVALÊNCIA 223 NOME DA RELAÇÃO PAPEL QUALIA TIPO RELAÇÃO 34. éProdutoDe (TGG) AGENTIVO GENÉRICA 35. termoEspecíficoGênero (TEG) FORMAL GENÉRICA 36. termoGenéricoGênero (TGG) FORMAL GENÉRICA 37. termoEspecíficoInstância (TEI) CONSTITUTIVO INSTÂNCIA 38. éComponenteDe (TGP) CONSTITUTIVO PARTITIVA 39. éCompostoDe (TEP) CONSTITUTIVO PARTITIVA 40. éParteDe (TGP) CONSTITUTIVO PARTITIVA 41. temComponente (TEP) CONSTITUTIVO PARTITIVA 42. temParte (TEP) CONSTITUTIVO PARTITIVA 43. temAcrônimo (UP EQS-ACR) FORMAL STRING 44. temVariaçãoOrtográfica (UP EQS-ORT) FORMAL STRING Fonte: elaborado pela autora desta tese. Observando-se a classificação das relações segundo o seu papel Qualia, percebe-se que o papel Formal identifica e distingue o conceito em um contexto mais amplo, abarcando seus sinônimos e variações linguísticas, estando estreitamente vinculado a relações de hiperonímia e hiponímia (relação de gênero-espécie). Também o papel Qualia Agentivo pode estar vinculado a relações de hiperonímia e hiponímia, a partir de um processo de inclusão, porém refere-se, especialmente, às relações associativas causativas. Nota-se que o papel Qualia Constitutivo expressa sempre uma relação entre um todo e suas partes constituintes, principalmente representando as relações de holonímia e meronímia (relação partitiva), ainda que também englobe relações não qualificadas como hierárquica, ou seja, as relações associativas. Já o papel Qualia Télico está sempre ligado às relações associativas, ligando um objeto ou um ente (ser) às suas funções, processos, atividades ou objetivos. Considera-se que a identificação do papel Qualia dos relacionamentos auxiliou a elaboração de suas definições, pois permitiu associar um conjunto de propriedades às relações, o que facilitou uma melhor descrição do significado de cada relação semântica. Ressalta-se que na modelagem da amostra não foram representadas as relações de instâncias, porque elas são de ocorrência mais rara no domínio temático da Intensificação Agropecuária. Conforme descrito no Subcapítulo 5.7.2, elas se incluem no grupo dos relacionamentos hierárquicos, cujos exemplos poderiam ser: BRASIL PONTOS CULMINANTES termoEspecíficoInstância (TEI) Serra do Imeri termoEspecíficoInstância (TEI) Serra do Caparaó termoEspecíficoInstância (TEI) Parque Nacional Itatiaia termoEspecíficoInstância (TEI) Serra Fina BRASIL ECOSISTEMAS COSTEIROS termoEspecíficoInstância (TEI) Duna Jalapão termoEspecíficoInstância (TEI) Lençóis Maranhenses termoEspecíficoInstância (TEI) Restinga Marambaia termoEspecíficoInstância (TEI) Restinga Seca As relações de instância são caracterizadas por uma classe geral de objetos, eventos, propriedades ou fenômenos, em geral representados por uma faceta expressa por 224 um descritor mais genérico, na forma de um substantivo comum, que agrupa os nomes próprios de suas instâncias individuais. A aplicação do conjunto de 44 relações criou uma rede semântica para os 30 conceitos da amostra, que foi composta por seus grupos (clusters) semânticos, gerando um desdobramento que totalizou cerca de 600 relacionamentos. Como resultado, o sistema de conceitos foi formado pelos relacionamentos: de gênero e suas espécies, do todo e suas partes, de equivalências, de strings e associativas. Como esperado, houve uma predominância dos relacionamentos hierárquicos, totalizando 286 ocorrências, sendo 225 relações de gênero-espécie (com 52 TGG e 173 TEG) e 61 relações todo-partes (com 22 TGP e 39 TEP). Isso demonstra o caráter específico da estrutura semântica modelada para os 30 conceitos da amostra. Também, foi representado um número significativo de relações associativas, somando 232 relacionamentos, evidenciando a complexidade do domínio da Intensificação Agropecuária, conforme apontada pela teoria de Boserup, com substancial inter-relação de seus conceitos. O conjunto de toda a estrutura conceitual criada, juntamente com as relações específicas do grupo (cluster) de cada conceito da amostra, está apresentado no Apêndice G, Estrutura Semântica Final. Alguns exemplos desses grupos (clusters) serão expostos e descritos a seguir, para a análise dos resultados obtidos com a aplicação do modelo de reengenharia, mais especificamente na explicitação das relações. (1) Relações gênero-espécie: estabeleceram agrupamentos genéricos, ligando uma classe a seus membros ou espécies, sempre de mesma natureza. Os grupos (clusters) formam estruturas de hiperonímia (conceitos superordenados), de hiponímia (conceitos subordinados) e de coordenação, quando ocorrem dois ou mais conceitos específicos para um mesmo conceito genérico. Por convenção, os símbolos que representaram essas relações foram: TGG (superordenado): Termo Genérico de Gênero TEG (subordinado): Termo Específico de Gênero As relações gênero-espécie estabelecem subordinações analíticas e lógicas entre conceitos, pois a classe mais específica tem todas as características da classe mais geral, superordenada, e sempre possui uma característica a mais. Por exemplo, o conceito específico e subordinado CULTURA DE MILHO é um tipo do conceito superordenado CULTURA, e, comparando esses dois conceitos, percebe-se que CULTURA DE MILHO inclui todas as características do conceito CULTURA, além de apresentar a característica específica de ser “de milho”, que lhe é própria. Conforme descrito no Subcapítulo 5.7.2, o mapeamento desse tipo de relação pode ser realizado pelos testes lógicos “todo-algum” e “algum-algum”. 225 Como exemplo para ser comparado com a reengenharia do tesauro, apresenta- se a estrutura semântica para o conceito PESTICIDA no tesauro THESAGRO: PESTICIDA UF PRAGUICIDA NT ACARICIDA NT CARRAPATICIDA NT FUNGICIDA NT GERMICIDA NT INSETICIDA NT MOLUSCICIDA NT NEMATICIDA NT PERSISTÊNCIA DE PESTICIDA NT RATICIDA NT REPELENTE Nesse exemplo, o conceito PESTICIDA, descritor preferido, está em uma relação de equivalência com o descritor não-preferido PRAGUICIDA. Nota-se que, na estrutura do THESAGRO, o descritor PESTICIDA não possui um conceito superordenado, que indique o seu pertencimento a uma classe mais genérica. Por sua vez, o conceito superordenado PESTICIDA (BT) é uma classe mais genérica que forma uma relação hierárquica abarcando os conceitos subordinados, mais específicos (NT), ACARICIDA, CARRAPATICIDA, FUNGICIDA, GERMICIDA, INSETICIDA, MOLUSCICIDA, NEMATICIDA, PERSISTÊNCIA DE PESTICIDA, RATICIDA e REPELENTE. Nesse caso, entende-se que todos esses conceitos subordinados carregam as mesmas características do conceito PESTICIDA, que é a classe mais genérica, sendo que cada um deles, isoladamente, possui uma característica a mais que o distingue dos outros. Contudo, não está especificado se a hierarquia se refere a uma relação gênero-espécie, todo-parte ou de instância. Assim, o entendimento do sentido da relação hierárquica depende do conhecimento prévio do usuário sobre o domínio. Com a aplicação do modelo de Soergel (2004; 2006), a remodelagem da representação do conceito PESTICIDA possibilitou determinar o tipo de relação existente entre os conceitos, conforme mostra a Figura 27. 226 FIGURA 27 – Relação gênero-espécie: conceito PESTICIDA Fonte: elaborado pela autora desta tese (tela capturada do sistema e-Termos). Na remodelagem, diferentemente do que ocorreu na estrutura do THESAGRO, em que a relação de equivalência é genérica, foi possível especificar que a relação de equivalência entre o conceito PESTICIDA e PRAGUICIDA é do tipo . Além disso, foi possível determinar uma relação gênero-espécie entre o conceito superordenado SUBSTÂNCIA QUÍMICA (identificado pela seta), que é uma classe mais genérica para o conceito subordinado PESTICIDA, que é um tipo mais específico de “substância química”. Também foi possível determinar a existência de uma relação gênero-espécie entre o conceito superordenado PESTICIDA e os conceitos subordinados ACARICIDA, BIOPESTICIDA, CARRAPATICIDA, FUNGICIDA, GERMICIDA, HERBICIDA, INSETICIDA, MOLUSCICIDA, NEMATICIDA, OVICIDA, RATICIDA e REPELENTE, pois todos estes são tipos distintos de “pesticidas”, possuindo, cada um deles, uma característica específica que os distingue dentro da classe mais genérica PESTICIDA. Por sua vez, o conjunto de 227 conceitos subordinados ao superordenado PESTICIDA está em uma relação lógica de coordenação, formando um renque. Ademais, diferentemente do que ocorre no tesauro THESAGRO, na presente proposta de reengenharia desse tesauro, o conceito PERSISTÊNCIA DE PESTICIDA não está em uma relação hierárquica de subordinação ao conceito PESTICIDA, e, sim, em uma relação associativa (TR) do tipo . Com o mapeamento do conceito PESTICIDA, percebeu-se que a característica de persistência é uma propriedade (porcentagem de desprendimento de elementos químicos) que indica o período no qual a toxicidade do pesticida permanece inalterada (longevidade do produto), afetando o ambiente no qual foi aplicado. Por isso, ao decidir estabelecer-se uma relação associativa entre PESTICIDA e PERSISTÊNCIA DE PESTICIDA, pretendeu-se estabelecer uma melhor representação do tipo de vinculação que possuem, facilitando a compreensão do domínio. (2) Relações todo-parte: estabeleceram agrupamentos todo-parte, ligando um todo às suas partes constituintes, formando estruturas de holonímia (conceito do todo; superordenado), meronímia (conceitos das partes; subordinados) e de coordenação lógica, quando ocorrem dois ou mais conceitos de uma mesma dimensão (partes) do conceito do todo, conforme descrito no Subcapítulo 5.7.2. São consideradas relações ontológicas por ser o resultado da subdivisão das propriedades dos conceitos, ou seja, as partes constituintes dos objetos que são representados pelos conceitos. Por convenção, os símbolos que representaram essas relações foram: TGP (holônimo; superordenado): Termo Genérico Partitivo TEP (merônimo; subordinado): Termo Específico Partitivo Essas relações podem ocorrer, segundo a Norma ISO 25964, em quatro situações: (a) órgãos e sistemas dos seres vivos; (b) localizações geográficas; (c) disciplinas ou campos de discurso; (d) estruturas hierárquicas sociais. Na estruturação dos 30 conceitos da amostra, essas relações foram demonstradas a partir dos seguintes agrupamentos: TERMOS GENÉRICOS TERMOS ESPECÍFICOS éComponenteDe (TGP) temComponente (TEP) éParteDe (TGP) temParte (TEP) éCompostoDe (TEP) A estrutura do THESAGRO não apresenta a explicitação das relações todo- parte, que estão incluídas nas representações das relações hierárquicas existentes no tesauro. Para exemplificação, apresenta-se a estrutura hierárquica do conceito PECUÁRIA 228 no tesauro THESAGRO, que, posteriormente será comparada com a remodelagem desse mesmo conceito, realizada com o modelo de Soergel (2004; 2006). PECUÁRIA BT PRODUÇÃO ANIMAL Nesse extrato da estrutura do THESAGRO, o conceito PECUÁRIA está em uma relação hierárquica com o conceito superordenado PRODUÇÃO ANIMAL (BT). Contudo, não está especificado qual tipo de hierarquia ocorre entre os conceitos: se é uma relação gênero-espécie, todo-parte ou de instância. Nesse caso, a compreensão de em que contexto essas relações ocorrem sempre dependerá do conhecimento prévio do usuário sobre o domínio. Porém, ao aplicar o modelo de Soergel (2004; 2006), pôde-se notar que as relações entre conceitos ficaram mais explícitas, conforme mostra a Figura 28. FIGURA 28 – Relação partitiva: conceito PECUÁRIA Fonte: elaborado pela autora desta tese (tela capturada do sistema e-Termos). Conforme pode ser percebido na reengenharia do THESAGRO, o conceito PECUÁRIA está subordinado, em uma relação de gênero-espécie, ao conceito superordenado ANIMAIS DOMÉSTICOS (apontado pela seta), indicando que a pecuária envolve a criação de animais domésticos, que é uma forma diferente daquela apresentada na estrutura atual do THESAGRO. Analisando-se o domínio, verifica-se que a produção 229 pecuária se refere ao conjunto de técnicas empregadas e destinadas à criação e reprodução de animais domésticos com fins econômicos. Atualmente, a estrutura do THESAGRO traz o conceito PECUÁRIA hierarquicamente subordinado ao conceito PRODUÇÃO ANIMAL. Porém, na perspectiva adotada na reengenharia do tesauro, a atividade da pecuária envolve, além da produção de carnes, leite, couro ou ovos, também processos relacionados com a própria criação e reprodução dos animais. Nesse contexto, o conceito PECUÁRIA não poderia estar em relação de subordinação com o conceito PRODUÇÃO ANIMAL. Sendo assim, decidiu-se determinar uma relação associativa, do tipo (TR), entre os conceitos PRODUÇÃO ANIMAL (identificado pela estrela) e PECUÁRIA. Considera-se que essa decisão resultou em uma semântica mais representativa do conhecimento disponível sobre o conceito de PECUÁRIA. Com a reengenharia realizada, a estrutura semântica do THESAGRO, que antes limitava a compreensão do domínio, ficou mais inteligível e clara para o usuário, mesmo nos casos em que ele não possua conhecimentos prévios sobre o domínio. No processo de reengenharia também foram mapeadas as relações todo-parte que inter-relacionam o conceito superordenado PECUÁRIA aos conceitos subordinados CIRCUITO PECUÁRIO CENTRO-OESTE, CIRCUITO PECUÁRIO LESTE, CIRCUITO PECUÁRIO NORDESTE, CIRCUITO PECUÁRIO NORTE e CIRCUITO PECUÁRIO SUL. Com essa representação, agrega-se maior valor semântico à informação disponibilizada, pois é possível ao usuário compreender que, no Brasil, a atividade da pecuária é dividida em cinco subdivisões geográficas que reúnem todos os Estados brasileiros. (3) Relações de equivalência: estabeleceram relacionamentos entre termos, e, não, entre conceitos, por meio de remissivas que referenciaram termos sinônimos ou quase sinônimos existentes para um mesmo conceito, dentro do recorte temático, assim como outros tipos de equivalência entre termos. Por convenção, os símbolos que representaram essas relações foram: USE Use = Descritor Preferido UP EQ-SIN Equivalente Sinônimo = Descritor Não-Preferido UP EQ-APR Equivalente Sinônimo Aproximado = Descritor Não-Preferido UP EQ-TG Equivalente Sinônimo Mais Amplo = Descritor Não-Preferido UP EQ-TE Equivalente Sinônimo Mais Específico = Descritor Não-Preferido UP EQ-ANTG Equivalente Nome Antigo = Descritor Não-Preferido UP EQ-CIEN Equivalente Nome Científico = Descritor Não-Preferido UP EQ-COM Equivalente Nome Comercial = Descritor Não-Preferido UP EQ-INS Equivalente Nome Institucional = Descritor Não-Preferido 230 EQ-ANTO Equivalente Antônimo = Descritor Preferido EQ-EN Equivalente Tradução em Inglês = Descritor Equivalente em Inglês Na modelagem dos 30 termos da amostra, somente três dessas relações de equivalência foram representadas: , e . Para exemplificar, apresenta-se, primeiramente, a estrutura conceitual do conceito CULTIVO INTENSIVO no THESAGRO e, posteriormente, a estrutura reformulada: CULTIVO INTENSIVO (descritor preferido) BT PRÁTICA CULTURAL Nota-se que, na estrutura do THESAGRO, o termo CULTIVO INTENSIVO não possui qualquer representação de equivalência. Somente é apresentada a sua relação hierárquica, na qual é subordinado (termo específico) do conceito superordenado PRÁTICA CULTURAL (BT). Porém, não é possível identificar se se trata de uma relação gênero- espécie, todo-parte ou de instância. Com a aplicação do modelo de reengenharia, a representação do conceito CULTIVO INTENSIVO permitiu que se explicitassem todos os casos de relações de equivalência ocorridos na modelagem da amostra. Destaca-se que, no THESAGRO, o descritor preferido é CULTIVO INTENSIVO, porém, na estrutura reformulada, o descritor preferido passa a ser AGRICULTURA INTENSIVA, conforme a Figura 29. AGRICULTURA INTENSIVA temTraduçãoEN (EQ-EN) temSinonímiaAproximada (UP EQ-APR) temSinonímiaAproximada (UP EQ-APR) temSinônimo (UP EQ-SIN) temSinônimo (UP EQ-SIN) termoGenéricoGênero (TGG) temPrática (TR) (descritor preferido) INTENSIVE FARMING AGRICULTURA INDUSTRIAL CULTIVO INTENSIVO EXPLORAÇÃO AGRÍCOLA INTENSIVA PRODUÇÃO INTENSIVA SISTEMA DE EXPLORAÇÃO AGRÍCOLA PRÁTICA DE CULTURA VEGETAL 231 FIGURA 29 – Relação de equivalência: conceito AGRICULTURA INTENSIVA Fonte: elaborado pela autora desta tese (tela capturada do sistema e-Termos). Como pode ser observado na proposta de reengenharia, o termo CULTIVO INTENSIVO (indicado pela seta), que, na estrutura do THESAGRO, era o descritor preferido, agora está em uma relação de equivalência, do tipo , com o conceito de AGRICULTURA INTENSIVA, que agora é o descritor preferido. Este termo foi escolhido como descritor preferido porque, ao se analisar sua definição, pôde-se verificar que esse grupo (cluster) faz referência às atividades intensivas com vegetais e, em alguns casos, o termo “cultivo” também é usado no sentido de cultivo de animais aquáticos (aquicultura), por exemplo. Assim, decidiu-se que, semanticamente, o descritor AGRICULTURA INTENSIVA representa mais adequadamente esse grupo (cluster). Também, com a reengenharia do THESAGRO, outras relações de equivalência do termo AGRICULTURA INTENSIVA foram passíveis de ser representadas, a saber: (1) com o termo INTENSIVE FARMING; (2) com os termos AGRICULTURA INDUSTRIAL e CULTIVO INTENSIVO; e (3) com os termos EXPLORAÇÃO AGRÍCOLA INTENSIVA e PRODUÇÃO INTENSIVA. 232 A partir da reengenharia do tesauro, pôde-se observar que, diferentemente da estrutura conceitual atual do THESAGRO, em que é utilizada a expressão “prática cultural”, na reformulação proposta foi utilizada a expressão “prática de cultura vegetal”, que também expressa, semanticamente melhor, o grupo (cluster) que representa. Considerou-se que a expressão “prática cultural” conduz mais ao sentido de padrões culturais, que envolve os comportamentos e manifestações dos indivíduos, do que às práticas efetuadas na cultura de vegetais. Além disso, na estrutura atual do THESAGRO, pode-se observar que o conceito superordenado PRÁTICA CULTURAL (que na proposta de reengenharia utiliza a expressão PRÁTICA DE CULTURA VEGETAL) representava uma classe mais genérica e estava em uma relação hierárquica com o conceito AGRICULTURA INTENSIVA, seu subordinado (termo específico). Porém, na reengenharia, esses conceitos estão em uma relação associativa, do tipo . Isso ocorreu porque houve mudança na abordagem de modelagem, a partir das definições terminológicas, e, assim, as práticas de culturas vegetais passaram a estar vinculadas a atividades tais como cobertura do solo e limpeza da lavoura, que são estágios da produção de qualquer cultura. Com essa nova abordagem, o conceito AGRICULTURA INTENSIVA ficou subordinado, em uma relação gênero-espécie, ao conceito superordenado SISTEMA DE EXPLORAÇÃO AGRÍCOLA, que antes não existia no THESAGRO. Assim, este conceito representa uma classe mais genérica que inclui e forma agrupamentos (clusters) de práticas culturais e de sistemas de exploração da agricultura (como a agricultura intensiva e a agricultura extensiva). (4) Relações de string: estabeleceram ligações de equivalência entre termos, e, não, entre conceitos, referentes às variações ou variantes linguísticas e regionais dos termos. Por convenção, os símbolos que representaram essas relações foram: UP EQS-ABR Equivalente String Abreviatura = Descritor Não-Preferido UP EQS-ACR Equivalente String Acrônimo = Descritor Não-Preferido UP EQS-FOR Equivalente String Fórmula = Descritor Não-Preferido UP EQS-LOC Equivalente String Nome Local = Descritor Não-Preferido UP EQS-TRANS Equivalente String Transliteração = Descritor Não-Preferido UP EQS-SIM Equivalente String Símbolo = Descritor Não-Preferido UP EQS-ORT Equivalente String Variação Ortográfica = Descritor Não-Preferido Ressalta-se que nenhum dos termos do THESAGRO coincidentes à amostra trabalhada apresentou estrutura conceitual em que fosse possível comparar a representação de relações de string. Por isso, para a comparação entre a estrutura atual do THESAGRO e a estrutura da reengenharia proposta, utiliza-se o caso hipotético da 233 representação da “doença da vaca louca”. Na estrutura do tesauro THESAGRO, o conceito DOENÇA DA VACA LOUCA, e seus desdobramentos, estão representados da seguinte forma: DOENÇA DA VACA LOUCA UF EEB UF ENCEFALOPATIA ESPONGIFORME BOVINA BT DOENÇA ANIMAL ENCEFALOPATIA ESPONGIFORME BOVINA USE DOENÇA DA VACA LOUCA EEB USE DOENÇA DA VACA LOUCA DOENÇA ANIMAL BT DOENÇA NT DOENÇA DA VACA LOUCA DOENCA NT DOENÇA ANIMAL NT DOENÇA DE PLANTA Na representação atual do THESAGRO, é possível compreender que o conceito DOENÇA DA VACA LOUCA é subordinado (termo mais específico) e está em uma relação hierárquica com o conceito superordenado DOENÇA ANIMAL (BT). Por sua vez, o conceito DOENÇA ANIMAL é subordinado e está em uma relação hierárquica com o conceito superordenado DOENÇA (BT). Porém, em quaisquer dos casos, não é possível saber se as estruturas hierárquicas se referem a relações gênero-espécie, todo-parte ou de instância, o que permitiria maior compreensão do domínio. Observa-se, também, que o termo DOENÇA DA VACA LOUCA está em relação de equivalência com os termos EEB e ENCEFALOPATIA ESPONGIFORME BOVINA. Entretanto, não está claro que tipo específico de equivalência ocorre entre os termos, a não ser a partir do conhecimento prévio do usuário. Ademais, não está explícito se existe uma ligação entre os termos EEB e ENCEFALOPATIA ESPONGIFORME BOVINA, a não ser que ambos estão ligados por uma relação de equivalência ao termo DOENÇA DA VACA LOUCA. Com essa informação, é provável inferir que os termos EEB e ENCEFALOPATIA ESPONGIFORME BOVINA também são, de alguma forma, equivalentes entre si, mas, novamente, não é possível saber qual o tipo específico de relação de equivalência liga esses dois termos. Quando se aplica o modelo de Soergel (2004; 2006) na reengenharia do tesauro THESAGRO, a modelagem do conceito DOENÇA DA VACA LOUCA é representada da seguinte forma: DOENÇA DA VACA LOUCA temTraduçãoEN (EQ-EN) temAbreviatura UP EQS-ABR temNomeCientífico UP EQ-CIEN termoGenéricoGênero (TGG) éTipoRelacionadoA (TR) BOVINE SPONGIFORM ENCEPHALOPATHYI EEB ENCEFALOPATIA ESPONGIFORME BOVINA DOENÇA ANIMAL DOENÇA SCRAPIE ENCEFALOPATIA ESPONGIFORME BOVINA USE DOENÇA DA VACA LOUCA temAbreviatura EQS-ABR EEB 234 EEB USE DOENÇA DA VACA LOUCA éAbreviaturaDe EQS-ABR ENCEFALOPATIA ESPONGIFORME BOVINA DOENÇA ANIMAL termoGenéricoGênero (TGG) DOENÇA termoEspecíficoGênero (TEG) DOENÇA DA VACA LOUCA DOENÇA termoEspecíficoGênero (TEG) termoEspecíficoGênero (TEG) DOENÇA ANIMAL DOENÇA DE PLANTA Observa-se que, aplicando-se o modelo de reengenharia, todas as relações ficam explicitadas na estrutura do tesauro, permitindo que se visualizem todos os agrupamentos (clusters) do conceito DOENÇA DA VACA LOUCA. Dessa forma, mesmo sem conhecimento prévio, o usuário pode compreender que este conceito está subordinado (espécie mais específica), por uma relação gênero-espécie, ao conceito superordenado DOENÇA ANIMAL (TGG), que representa uma classe mais genérica (gênero). É possível apreender que o termo DOENÇA DA VACA LOUCA é o descritor preferido e que possui uma relação de equivalência do tipo com o termo BOVINE SPONGIFORM ENCEPHALOPATHYI e do tipo com o termo ENCEFALOPATIA ESPONGIFORME BOVINA. Portanto, o termo DOENÇA DA VACA LOUCA é o nome popular da doença. Também nota-se que o termo DOENÇA DA VACA LOUCA tem uma relação de string, do tipo , com o termo EEB. Além disso, modelando-se o conceito DOENÇA DA VACA LOUCA foi possível mapear, por meio das fontes selecionadas para coleta de informações, que essa é uma doença priônica (termo mais abrangente), que somente ataca o gado bovino, mas que há uma doença semelhante, também priônica, denominada scrapie, que afeta as ovelhas. Por isso, na remodelagem, decidiu-se por estabelecer uma relação associativa, <é_tipo_relacionado_a>, entre o conceito DOENÇA DA VACA LOUCA e o conceito DOENÇA SCRAPIE. Com isso, foi possível perceber que a explicitação dos relacionamentos entre conceitos e termos permitiu que se representasse uma rede semântica sobre o conceito em foco, capaz de oferecer maior quantidade de informação, auxiliando o usuário na compreensão do contexto desse conceito, mesmo se o usuário não possuir um conhecimento prévio sobre o domínio modelado. Com a modelagem dos 30 conceitos da amostra foram representadas relações de string do tipo e do tipo , conforme mostram as Figuras 30 e 31. 235 FIGURA 30 – Relação de string: conceito MANEJO DE CULTURA Fonte: elaborado pela autora desta tese (tela capturada do sistema e-Termos). Nesse caso, o termo MANEJO DE CULTURA está em relação de string com o termo MANEJO DA CULTURA, pois as expressões dos dois termos somente se diferem pelas preposições e . É sabido que a diversidade de uso de termos para representar um conceito, tais como termos no singular, plural e de distintas preposições (da, de, do), pode causar dispersão de informação, dificultando a sua recuperação, ainda que, em alguns sistemas de busca, as diferenças na grafia pelo uso de singular/plural não interfiram no resultado da recuperação. Contudo, as preposições, dependendo do contexto, possuem significados semânticos diferentes, por exemplo: de, da, do: causa; matéria ou atributo; origem; função; posse, entre outros. A Figura 31 mostra um exemplo para o termo SISTEMA DE INFORMAÇÃO GEOGRÁFICA: FIGURA 31 – Relação de string: conceito SISTEMA DE INFORMAÇÃO GEOGRÁFICA Fonte: elaborado pela autora desta tese (tela capturada do sistema e-Termos). 236 A Figura 31 mostra que o termo SISTEMA DE INFORMAÇÃO GEOGRÁFICA está em uma relação de string com o termo SIG. Nesse caso, dependendo do público-alvo, o modelador pode escolher um desses dois termos como descritor preferido, estabelecendo uma remissa para o outro, que será o descritor não-preferido. (5) Relações associativas: estabeleceram relacionamentos que não se enquadraram como agrupamentos (clusters) hierárquicos, representando diversas associações entre conceitos (Quadro 12). Essas relações são consideradas analíticas, uma vez que foram evidenciadas a partir da análise do domínio e das características da estrutura conceitual construída. Além disso, elas também são consideradas relações ontológicas, porque ocorrem de forma indireta, por proximidade no tempo (origem ou desencadeamento) e por proximidade no espaço (compartilhamento de um espaço), em situações tais como de causa e efeito, parentesco, contiguidade, instrumento e seu uso, atividade e seu objeto. Por convenção, o símbolo utilizado foi TR (Termo Relacionado), acrescido ao final das expressões específicas de cada uma das relações associativas. O conjunto das relações associativas compiladas para representar o domínio modelado está representado em uma taxonomia e está apresentada no Apêndice F, Taxonomia das Relações do Domínio da Agricultura. Foram elaboradas definições para todas as relações e estão compiladas no Apêndice E, Definições das Relações do Domínio da Agricultura. O Quadro 13 mostra o conjunto das relações associativas que foram representadas na modelagem dos 30 conceitos da amostra: QUADRO 13 – Conjunto de relações associativas representadas na amostra NOME DA RELAÇÃO TIPO RELAÇÃO afeta (TR) ASSOCIATIVA atuaSobre (TR) ASSOCIATIVA causa (TR) ASSOCIATIVA éAfetadoPor (TR) ASSOCIATIVA éControladoPor (TR) ASSOCIATIVA éFeitoAPartirDe (TR) ASSOCIATIVA éInfluenciadoPor (TR) ASSOCIATIVA éInfluenciadoPorOuDependeDe (TR) ASSOCIATIVA influencia (TR) ASSOCIATIVA seDesenvolveEm (TR) ASSOCIATIVA temBenefícioDe (TR) ASSOCIATIVA temMétodoDeControle (TR) ASSOCIATIVA éInsumoPara (TR) ASSOCIATIVA éTipoRelacionadoA (TR) ASSOCIATIVA inclui (TR) ASSOCIATIVA incluídoEm (TR) ASSOCIATIVA 237 NOME DA RELAÇÃO TIPO RELAÇÃO temPropriedade (TR) ASSOCIATIVA utilizaValor (TR) ASSOCIATIVA éPráticaPara (TR) ASSOCIATIVA éProcessoPara (TR) ASSOCIATIVA éUsadoComo (TR) ASSOCIATIVA éUsadoEm (TR) ASSOCIATIVA éUtilizadoComo (TR) ASSOCIATIVA fazUsoDe (TR) ASSOCIATIVA temObjetivoOuProcesso (TR) ASSOCIATIVA temObjetoDeAtividade (TR) ASSOCIATIVA temPrática (TR) ASSOCIATIVA usaProcesso (TR) ASSOCIATIVA Fonte: elaborado pela autora desta tese. Observa-se que, na modelagem dos 30 conceitos da amostra, foram representados 28 tipos de relações associativas, incluindo algumas inversas, de um total de 116 diferentes tipos de relações possíveis, também incluindo as inversas. Isso equivale à representação de quase 25% do conjunto de relações associativas determinadas para o domínio da Agropecuária. Para exemplificar e comparar as estruturas conceituais, apresenta-se, primeiramente, a estrutura conceitual do conceito SENSORIAMENTO REMOTO, no tesauro THESAGRO, e, posteriormente, a estrutura reformulada pela proposta de reengenharia. SENSORIAMENTO REMOTO UF IMAGEM DE SATÉLITE RT SATÉLITE RT AEROFOTOGRAMETRIA AEROFOTOGRAMETRIA BT LEVANTAMENTO TOPOGRÁFICO RT SENSORIAMENTO REMOTO RT TOPOGRAFIA SATÉLITE BT EQUIPAMENTO RT SENSORIAMENTO REMOTO Na estrutura do THESAGRO, percebe-se que o conceito SENSORIAMENTO REMOTO está em uma relação de equivalência com o descritor IMAGEM DE SATÉLITE (UF), estando também em uma relação associativa com os conceitos SATÉLITE (RT) e AEROFOTOGRAMETRIA (RT). Porém, tanto a relação de equivalência quanto as relações associativas não estão especificadas, exigindo do usuário um conhecimento prévio sobre a área para entender que tipo específico de associação ocorre entre esses conceitos. Além disso, SENSORIAMENTO REMOTO é considerado um termo órfão, porque não pertence a quaisquer agrupamentos hierárquicos no atual sistema de conceitos do THESAGRO. Ainda que não usual, a literatura (MOREIRA; MOURA, 2006) aponta que é possível utilizar esse 238 recurso quando o tesauro é o único mecanismo utilizado para a recuperação de informação. Na perspectiva dessa abordagem, pode-se alegar que a construção do THESAGRO empregou esse recurso, fazendo a representação semântica dos conceitos por meio de descritores órfãos, visando a facilitar a recuperação desses conceitos. Porém, acredita-se que o uso de descritores órfãos resulta em perda de informação, dificultando a compreensão e apreensão do conhecimento do domínio modelado, uma vez que não representa a rede semântica do grupo (cluster) do conceito. Após a aplicação do modelo de reengenharia de Soergel (2004; 2006), foi possível observar que a representação das relações associativas do conceito SENSORIAMENTO REMOTO ficou mais explícita na estrutura do tesauro, como é demonstrado no extrato da nova modelagem. SENSORIAMENTO REMOTO temSinonímiaAproximada (UP EQ-APR) IMAGEM DE SATÉLITE éParteDe (TGP) éParteDe (TGP) termoGenéricoGênero (TGG) éAfetadoPor (TR) fazUsoDe (TR) fazUsoDe (TR) fazUsoDe (TR) fazUsoDe (TR) fazUsoDe (TR) fazUsoDe (TR) fazUsoDe (TR) fazUsoDe (TR) fazUsoDe (TR) fazUsoDe (TR) fazUsoDe (TR) usaProcesso (TR) usaProcesso (TR) AGRIMENSURA GEOMETRIA GEOESPACIAL MATERIAL E MÉTODOS FATORES CLIMÁTICOS AEROFOTOGRAMETRIA AVHRR IMAGEM ESPECTRAL IMAGEM LOCAL LEVANTAMENTO AÉREO MAPAS PROCESSAMENTO DE IMAGENS RADAR SATÉLITES ARTIFICIAIS SENSOR REMOTO SISTEMAS DE POSICIONAMENTO GLOBAL FOTOGRAMETRIA TELEMETRIA Nota-se que, agora, a relação de equivalência entre os conceitos SENSORIAMENTO REMOTO e IMAGEM DE SATÉLITE está especificada com , apontando ao usuário que, em algumas circunstâncias, esses dois termos podem não ser considerados sinônimos. Porém, na reengenharia do THESAGRO, esses termos foram considerados sinônimos. Além das duas únicas relações associativas (TR) com as quais a estrutura atual do THESAGRO representa o conceito SENSORIAMENTO REMOTO, com a remodelagem, proposta na reengenharia, este conceito passa a ser representado, por quatorze relações associativas, a saber: (1) uma relação do tipo <é_afetado_por (TR)> com o conceito FATORES CLIMÁTICOS, para explicitar informações sobre imagens de satélite e a presença de nuvens, por exemplo, que pode afetar e impedir que a energia emitida pelo alvo da superfície terrestre seja registrada pelo sensor a bordo do satélite; (2) onze relações do tipo com os conceitos AEROFOTOGRAMETRIA, AVHRR, IMAGEM ESPECTRAL, IMAGEM LOCAL, 239 LEVANTAMENTO AÉREO, MAPAS, PROCESSAMENTO DE IMAGENS, RADAR, SATÉLITES ARTIFICIAIS, SENSOR REMOTO e SISTEMAS DE POSICIONAMENTO GLOBAL, para explicitar que a tecnologia do “sensoriamento remoto” faz uso dessas diversas técnicas, métodos e ferramentas para a representação e coleta de dados da superfície terrestre, visando a indicar estimativas para, por exemplo, área plantada, produção agrícola ou vigor vegetativo das culturas; (3) duas relações do tipo com os conceitos com FOTOGRAMETRIA e TELEMETRIA, uma vez que são processos que têm estreita relação com a tecnologia do “sensoriamento remoto”, pois o primeiro é um processo utilizado na confecção de mapas e cartas topográficas, e o segundo é um processo de comunicação automatizado, no qual os dados coletados são transmitidos para equipamentos de recepção. Observa-se, também, que, diferentemente do que ocorreu na estrutura conceitual do THESAGRO, na qual o conceito SENSORIAMENTO REMOTO não pertence a qualquer hierarquia, quando aplicado o modelo de reengenharia este conceito passa a ser subordinado, em uma relação todo-parte, com dois conceitos que representam disciplinas, estando em um relacionamento poli-hierárquico com os superordenados AGRIMENSURA (TGP) e GEOMETRIA GEOESPACIAL (TGP). Ao mesmo tempo, o conceito SENSORIAMENTO REMOTO é mais específico, passando para diretamente subordinado, em uma relação gênero-espécie, com o conceito superordenado MATERIAL E MÉTODOS, que está posicionado em uma classe bem mais genérica na estrutura hierárquica reformulada, representando uma das nove facetas semânticas da taxonomia da Intensificação Agropecuária. A maior parte da literatura aponta para a dificuldade em determinar quais relações associativas podem ser utilizadas para representar um dado domínio, porque, diferentemente das relações hierárquicas, as relações associativas não pressupõem ordem e subordinação lógicas entre conceitos, podendo ser estabelecidas a qualquer par de conceitos que possuam alguma ligação em um dado contexto. Notou-se, contudo, que a explicitação da natureza do relacionamento que foi estabelecido entre conceitos minimizou essa dificuldade e evitou julgamentos subjetivos. (6) Notas de Escopo e seus relacionamentos: foram elaboradas notas de escopo para alguns dos descritores do conjunto dos 30 conceitos da amostra, a partir de uma avaliação realizada pelos membros da equipe de trabalho quanto à necessidade de representação de notas de escopo, para cada conceito da amostra. Por convenção, o símbolo que as representa as notas de escopo é NE e elas podem ser inter-relacionadas a partir de quatro distintos tipos possíveis de relações, incluindo as inversas, que são denominadas “relações definitórias”: 240 NE-É é nota de escopo NE-TEM tem nota de escopo NE-REF nota de escopo referencia NE-ADO referenciado em nota de escopo Esses quatro tipos de relacionamentos entre notas de escopo foram criados e ajuntados ao conjunto de relações que compõem o Apêndice E, Definições das Relações do Domínio da Agricultura, com o objetivo de atender ao modelo de reengenharia do THESAGRO. Destaca-se que a estrutura do THESAGRO não apresenta qualquer relação entre notas de escopo, a não ser o próprio conteúdo das notas de escopo: AGROSSILVICULTURA SN (Sistema no qual árvores florestais crescem juntamente com culturas agrícolas, incluindo ou não o gado) Nesse exemplo, pode-se considerar que a nota de escopo faz menção aos conceitos “cultura agrícola” e “gado”. Porém, somente o descritor GADO está representado na estrutura do THESAGRO. O termo “cultura”, isoladamente, pode ser encontrado, mas é um descritor não-preferido, sendo o descritor preferido PRODUÇÃO VEGETAL. Ao se analisarem as notas de escopo disponibilizadas no THESAGRO, pôde-se observar essa dispersão terminológica, que dificulta que se associe o conteúdo de uma nota de escopo de um descritor a outros descritores na estrutura do tesauro. Com a aplicação da reengenharia proposta, foram representadas relações entre notas de escopo (NE), inter-relacionando também os conceitos que estão apontados no conteúdo das NE. Por isso, as NE foram elaboradas utilizando a mesma terminologia adotada na estrutura conceitual criada. Elas apresentam definições sucintas, ampliando ou restringindo o significado de um descritor, indicando associações com outros descritores e, às vezes, oferecendo instruções de uso, conforme apresentado no Quadro 14. QUADRO 14 – Notas de Escopo (NE) da amostra DESCRITOR NUM. NE NOTA DE ESCOPO (NE) CULTURA NE-1 Todas as plantas úteis, cultivadas ou não. AMBIENTE FÍSICO NE-2 Conjunto de recursos físicos e químicos, representado pelos fatores abióticos que compõem o meio ambiente. SOLO NE-3 Camada superior da terra, em que as plantas crescem; para os diferentes tipos de solo de uma região, país, etc., usar . MANEJO DA CULTURA NE-4 Decisões sobre práticas culturais, do plantio à colheita. POUSIO NE-5 Período de tempo em que a terra permanece não cultivada, por exemplo, entre uma safra e outra, em ciclos culturais anuais. 241 DESCRITOR NUM. NE NOTA DE ESCOPO (NE) ADUBO VERDE NE-6 Subprodutos de culturas ou restos culturais incorporados ao solo, enquanto ainda não apodrecidos, para melhorar a preparação do solo. PRODUTO AGROPECUÁRIO NE-7 Produtos em seu estado original ou processados, disponíveis para venda (marketing). BIOMASSA NE-8 Quantidade total ou o peso de organismos disponíveis numa dada área. Fonte: elaborado pela autora desta tese (dados da pesquisa). Conforme exposto no Quadro 14, a aplicação da reengenharia proposta resultou na elaboração de notas de escopo (NE) para oito dos 30 conceitos da amostra, representando pouco mais de 25% do total. Observa-se que a maior parte das NE é utilizada para ampliar ou restringir o significado dos descritores, facilitando a delimitação do mesmo dentro do escopo do tesauro e evidenciando as relações mais relevantes ocorridas no grupo (cluster) do conceito. Somente uma das notas de escopo, a NE-3, do descritor SOLO, oferece tanto a delimitação quanto as instruções para o seu uso. Observa-se que o conteúdo de algumas das NE faz referência a outros conceitos que compõem a amostra, a saber: (1) NE-2 de AMBIENTE FÍSICO referencia MEIO AMBIENTE; (2) NE-5 de POUSIO referencia CICLO DA CULTURA e CULTURA ANUAL; (3) NE-6 de ADUBO VERDE referencia CULTURA e SOLO. Para exemplificar, na Figura 32 apresenta-se a representação da NE-5, do descritor POUSIO. FIGURA 32 – Representação de relações entre Notas de Escopo (NE) Fonte: elaborado pela autora desta tese (tela capturada do sistema e-Termos). Nesse exemplo, a NE-5 é nota de escopo para os conceitos POUSIO, cujo conteúdo referencia os conceitos CICLO DA CULTURA e CULTURA ANUAL. Com a 242 aplicação da reengenharia proposta, cria-se uma rede semântica inter-relacionando as notas de escopo, permitindo-se apontar que existe relevante relação entre esses conceitos. Nesse caso específico, do conceito POUSIO, a estrutura conceitual reformulada é a seguinte: POUSIO temNotaDeEscopo (NE) NE-5: Período de tempo em que a terra permanece não cultivada, por exemplo, entre uma safra e outra, em ciclos culturais anuais. temTraduçãoEN (EQ-EN) temSinônimo (UP EQ-SIN) termoGenéricoGênero (TGG) termoGenéricoGênero (TGG) éParteDe (TGP) termoEspecíficoGênero (TEG) incluídoEm (TR) Influencia (TR) éAfetadoPor (TR) éAfetadoPor (TR) FALLOW CULTIVO POUSIO PRÁTICAS DE MANEJO SISTEMAS DE CULTIVO AGRONOMIA PERÍODO DE POUSIO PREPARAÇÃO DO SOLO SISTEMAS DE POUSIO CICLO DA CULTURA CULTURA ANUAL Como pode ser observado na estrutura conceitual da reengenharia proposta, os conceitos CICLO DA CULTURA e CULTURA ANUAL estão em uma relação associativa com o conceito POUSIO, pois afetam o pousio e o período de pousio das terras cultiváveis. A presença desses dois conceitos na NE-5 evidencia a significativa associação deles com o conceito de POUSIO, possibilitando o direcionamento do usuário para essa ocorrência. De maneira semelhante, conforme se vê na Figura 32, a rede semântica da nota de escopo NE- 5 evidencia a estreita relação entre esses três conceitos. (7) Controle de termos homônimos O Subcapítulo 5.5 discorre sobre a polissemia e homonímia, cujos fenômenos se referem à existência de um único significante para dois significados diferentes, que estão em contextos de uso distintos. Considera-se, assim, ser o contexto no qual o termo está inserido o fator determinante para definir qual sentido foi o empregado. Na construção de tesauros, esses fenômenos devem ser controlados, evitando-se as inconsistências e ambiguidades na estrutura conceitual do instrumento. Os fundamentos da Teoria Comunicativa da Terminologia (TCT), que foi utilizada como aporte teórico nesta pesquisa, têm por princípio o reconhecimento da existência da homonímia, tanto na linguagem natural quanto na linguagem de especialidade, ainda que indique que a homonímia é um caso raro na linguagem de especialidade. Este fato pode ser observado na modelagem realizada nos 30 conceitos da amostra. Os fenômenos da hiponímia ou polissemia não ocorreram na aplicação da reengenharia proposta, confirmando que a homonímia não estará usualmente presente na linguagem de especialidade. 243 Conforme descrito no Subcapítulo 5.5, na construção de tesauros ou terminologias, a forma mais comum de desambiguação de homônimos é a utilização de qualificadores, entre parênteses, que funcionam como pistas que contextualizam o uso de um dado termo (significante). Em ambiente digital, os qualificadores são úteis, porque os resultados podem ser agrupados por contextos, facilitando a busca e descoberta de novas informações. Por exemplo, uma busca por “manga (alimento)” trará como resultado itens do contexto da alimentação e, uma busca por “manga (vestuário)” trará como resultado itens do contexto de vestuários. Nesse caso, observa-se que fica evidente o valor semântico de cada descritor e seu contexto de uso. Outras formas, sugeridas na literatura, para exercer o controle da homonímia são: por meio das notas explicativas, das relações estabelecidas entre os conceitos e utilizando-se os seguintes recursos: (i) adjetivação do termo: atribuir a função de adjetivo a um termo de outra classe gramatical (verbo, substantivo, advérbio); e (ii) substantivação dos termos: atribuir a função de substantivo a um termo de outra classe gramatical (verbo, adjetivo, advérbio, pronome, numeral, preposição). Nesta pesquisa, apresenta-se uma proposta para o controle da homonímia, tendo por base a teoria desenvolvida por Cabré na Teoria Comunicativa da Terminologia (TCT). Nessa perspectiva, a definição do conceito especifica o lugar (campo semântico) que ele ocupa na estrutura semântica do tesauro, ajudando a controlar os homônimos. Esses fundamentos estão descritos no Subcapítulo 5.4.3. Sendo assim, sempre que a natureza do conceito o permitir, a definição elaborada apresentará, primeiramente, o genus próximo (extensão) desse conceito no domínio, que é a classe mais geral que representa as características às quais o conceito definido se aplica. Posteriormente, determina-se a intensão (differentia especifica) do conceito, que é a propriedade (ou qualidade ou característica) que determina a particularidade própria do conceito definido. Com isso, a desambiguação dos termos homônimos (ou polissêmicos) pode ser realizada conforme os exemplos a seguir: (a) Desambiguação pelo genus (gênero) próximo: neste caso, o controle de homônimos é realizado pela extensão do conceito. Por exemplo: significante: Barbeiro Barbeiro: inseto hematófago existente em várias regiões do Brasil, sendo transmissor da doença de chagas. Barbeiro: profissional que trabalha com o cabelo humano, realizando diversas atividades tais como de corte ou coloração. Nesse caso, os genus próximos “inseto” e “profissional” indicam o contexto, estabelecendo o controle da homonímia. 244 (b) Desambiguação pela differentia (diferença) específica: nesse caso, o controle de homônimos é realizado pela diferença específica, quando o genus próximo é considerado vazio. Por exemplo: significante: Mistura Mistura: composto de resíduos de dejeto animal usado como adubo e formado a partir da técnica de compostagem. Mistura: composto de elementos químicos distintos, para formar uma nova combinação. Observa-se que o genus “composto” é o mesmo para os dois conceitos, porém, as differentiae (diferenças) específicas não são iguais. Assim, as expressões “resíduos de dejeto animal” e “elementos químicos” representam as diferenças específicas de cada conceito, que estão dentro dos domínios Agricultura e Química, respectivamente, o que permite fazer o controle da homonímia. Neste Capítulo foram descritos os detalhamentos e a aplicação do modelo utilizado na reengenharia do THESAGRO, procurando apresentar os resultados obtidos e as análises realizadas, a partir da comparação entre a estrutura atual do THESAGRO e a estrutura reformulada utilizando o modelo de Soergel (2004; 2006). No próximo Capítulo, apresentam-se as Considerações Finais sobre os resultados desta pesquisa e as sugestões de trabalhos futuros. 245 8 CONSIDERAÇÕES FINAIS A partir de certo ponto, não há retorno. Este é o ponto que é preciso alcançar. Franz Kafka Os estudos acerca dos sistemas de organização do conhecimento (SOC) estão inseridos no contexto da organização e representação do conhecimento, possuindo aplicabilidade em ambientes informacionais impressos e eletrônicos. Eles abrangem todos os tipos de esquemas que possibilitam a organização e a gestão do conhecimento, além de sua disseminação. Entre os diferentes tipos de SOCs existentes, os tesauros são instrumentos fundamentais de mediação, sendo elaborados com fins comunicacionais em áreas de especialidade, pois têm a função de representar e organizar o conhecimento de um domínio, facilitando a interação do usuário com os recursos informacionais disponibilizados no sistema. O trabalho de construção de um tesauro é bastante complexo, pois exige o envolvimento de profissionais capacitados (bibliotecários, terminólogos, especialistas), bem como o estudo das necessidades do usuário, pois a terminologia de um tesauro é uma linguagem de especialidade que deve também considerar a linguagem de busca do usuário. Por essa razão, é importante a fase de planejamento inicial do tesauro, quando se dão a definição do domínio a ser modelado, o mapeamento da estrutura do conhecimento desse domínio e a identificação do público-alvo. Assim, a criação de um sistema de conceitos capaz de representar o conhecimento de um dado domínio pressupõe considerarem-se, além das necessidades do usuário, outras garantias tais como a do usuário ou de uso (termos de busca do usuário), a literária (diversas fontes técnico-científicas de informação), a organizacional (terminologia do ambiente corporativo), a acadêmica (consenso científico), a profissional (conhecimento tácito dos especialistas) e a cultural (crenças e valores). O atendimento a essas garantias irá respaldar a aplicação de um conjunto de regras e princípios, na construção do tesauro, que sejam os mais adequados para atender aos objetivos propostos para a criação desse tesauro. O desenvolvimento da presente pesquisa iniciou-se com a perspectiva da agregação de maior enriquecimento semântico na construção da estrutura conceitual nos tesauros tradicionais. Partiu-se do pressuposto de que esses instrumentos já apresentam uma representação semântica bastante consistente, estabelecendo um sistema de conceitos composto por relações de equivalência, hierárquicas e associativas. Porém considerou-se que a semântica representada nos tesauros tradicionais ainda não é suficiente para classificá-los como um SOC, designação que abarca os instrumentos que podem ser compreendidos pela máquina, em ambiente digital, como já apontado por 246 Soergel (1999). Dessa forma, o principal interesse deste estudo foram as relações semânticas entre conceitos, considerados o elemento básico da organização do conhecimento e, portanto, da construção de tesauros. Tendo em vista esses pressupostos e os objetivos propostos nesta pesquisa, foi selecionado e utilizado o modelo de reengenharia de tesauros desenvolvido por Soergel et al. (2004) e Lauser et al. (2006). Nesse modelo, a estrutura conceitual do tesauro tradicional, geralmente com base em termos, é reformulada e passa a ser uma estrutura com base em conceitos. Para garantir essa reformulação, a proposta dos autores tem como principal característica a separação da modelagem em cinco níveis de entidades: conceito, termo ou lexicalização, string ou variação linguística, notas de escopo e relacionamentos. A partir da abordagem proposta pelos autores, o nível dos conceitos representa os significados relevantes dentro do domínio, e o nível dos termos e o dos strings têm estreita relação com o discurso linguístico para as construções ideológicas dentro de uma especialidade, vinculadas às bases da Terminologia. Por sua vez, o nível das notas de escopo complementa informações e orienta o usuário para o uso do instrumento. No que diz respeito ao nível dos relacionamentos, os autores apontam que estes são a sustentação da estrutura do tesauro, uma vez que formam um sistema semântico-conceitual que dá significado ao conhecimento sobre o domínio modelado. A pesquisa bibliográfica realizada evidenciou a incipiência de publicações pautadas somente no refinamento das relações em tesauros tradicionais. Por outro lado, foram recuperados trabalhos que apresentaram modelos para a conversão de tesauros em ontologias, modelos nos quais se verificou o uso de processos semiautomáticos ou totalmente intelectuais na remodelagem dos tesauros. Dessa forma, os trabalhos descritos e analisados na revisão de literatura tratam, especificamente, de propostas de modelos de conversão de um tesauro tradicional em uma ontologia de domínio, uma vez que os procedimentos empregados nesses modelos incluem uma etapa intelectual de enriquecimento semântico da estrutura conceitual do tesauro, que foi a fase foco da presente investigação. Foi possível verificar com a pesquisa bibliográfica que os modelos para a conversão de tesauros em ontologias vêm sendo desenvolvidos desde o ano 2000, sendo que alguns deles se restringiram à conversão sintática dos tesauros (VAN ASSEM et al., 2004; SOUALMIA; GOLBREICH; DARMONI, 2004), resultando em ontologias leves. Porém os modelos mais recentes (KLESS et al., 2012; SANAA et al., 2013) abordam soluções para evitar problemas de integração de dados, questões que não foram tratadas no modelo aplicado nesta pesquisa, de Soergel et al. (2004) e Lauser et al. (2006). Por meio da análise da bibliografia selecionada, pôde-se observar um aumento no uso das estruturas dos tesauros tradicionais na criação de ontologias de domínio, confirmando uma tendência atual 247 de reuso de conhecimento já estruturado (CAMPOS 1995; DODEBEI, 2002; VILLAZÓN- TERRAZAS, 2011). No entanto, também ficou claro que, para que seja vantajoso o aproveitamento das estruturas dos tesauros na criação de ontologias de domínio, é importante estabelecer uma maior formalização da rede semântica e das definições dos conceitos existentes nos tesauros, pois essas medidas permitem que se evidenciem as características desses conceitos e de seus contextos de uso, possibilitando a construção de instrumentos em conformidade com normas e padrões internacionais. Para estudar mais profundamente e determinar a viabilidade de sua aplicação, o modelo de reengenharia de Soergel et al. (2004) e Lauser et al. (2006) foi aplicado no Thesaurus Agrícola Nacional (THESAGRO). Este é o único tesauro brasileiro que cobre a área da Agropecuária, domínio escolhido para a modelagem. Dentro desse domínio, determinou-se como recorte temático a subárea da Intensificação Agropecuária, que foi analisada e modelada com base na teoria de Boserup (1965). Os princípios dessa teoria estabelecem a existência de uma inter-relação entre a dinâmica da população de uma região, gerando seu crescimento ou não, o meio ambiente e o uso da tecnologia na produção de vegetais e animais, determinando o aumento ou a manutenção de uma produção agropecuária em um dado tempo e lugar. Apoiada nessa abordagem, a subárea da Intensificação Agropecuária foi categorizada em nove facetas semânticas, determinadas a priori. Isso permitiu uma melhor organização e estruturação das hierarquias e a determinação mais adequada dos termos que representaram os conceitos do domínio. Dentro do recorte da Intensificação Agropecuária, foi selecionada uma amostra composta por 30 conceitos representativos da temática e das categorias, a partir de uma taxonomia já existente. Como insumos terminológicos para a composição do sistema de conceitos da amostra, foram utilizados os grupos (clusters) semânticos extraídos das estruturas dos tesauros THESAGRO, AGROVOC e NAL. Essa extração foi realizada por meio de uma comparação semiautomática entre os conceitos da amostra e as estruturas dos tesauros, resgatando-se, destes últimos, os grupos dos conceitos coincidentes com a amostra. Nessa comparação, o AGROVOC se mostrou a fonte mais eficiente, porque ofereceu elementos mais estruturados para a composição da rede semântica do recorte temático. Ao final da análise e compilação das redes semânticas extraídas da taxonomia e dos três tesauros, o sistema de conceitos da amostra foi representado por cerca de seiscentos relacionamentos. Como consequência, foi possível representar fenômenos tais como a sinonímia e a variação linguística, uma vez que a estrutura lexical do tesauro, que se refere aos termos (ou lexicalizações) e aos strings (variantes), são níveis de entidade diferentes, que foram tratados de forma separada. Porém, o que ainda pode ser considerado uma limitação no modelo é a falta de previsibilidade do estabelecimento de relações entre 248 as distintas variações linguísticas, que estão ligadas apenas aos descritores. Confirmando sua especificidade, a abordagem empregada na modelagem da amostra apresentou predominância de relacionamentos hierárquicos, com maiores ocorrências de relações gênero-espécie, seguidas das relações todo-parte. O número significativo de representações de relações associativas demonstrou a complexidade que caracteriza a subárea da Intensificação Agropecuária, ratificando a visão de Boserup sobre a temática. O arcabouço teórico-contextual apresentado e discutido nesta pesquisa deu subsídios para o seu desenvolvimento, permitindo que se evidenciassem abordagens para a construção de tesauros que seguem perspectivas políticas, ideológicas, teóricas e metodológicas distintas. No percurso das apresentações desses fundamentos, foram realizadas reflexões sobre essas questões, a partir dos fundamentos da Biblioteconomia e Ciência da Informação (BCI), Filosofia, Semântica, Pragmática e Terminologia. No âmbito da BCI, a literatura estudada indicou aportes teóricos e metodológicos para a construção de tesauros, assim como os princípios para a organização e sistematização dos conceitos de um domínio, sobretudo com as bases da Teoria do Conceito, de Dahlberg. As ponderações sobre essa teoria resultaram em uma proposta, elaborada pela autora da presente tese, de um conceito de conceito, cuja concepção foi construída a partir de uma relação triádica, pautada no Triângulo Semântico de Ogden e Richards e no Triângulo do Conceito de Dahlberg. Revisitando os pensamentos filosóficos, foram percebidas duas importantes questões acerca da significação do conceito: sobre a natureza e sobre a função do conceito. A primeira, discute sobre a natureza do conceito e a determinação das características essenciais de um objeto. Já a segunda, trouxe aportes sobre a função do conceito e do signo que o representa, pois este signo está em relação de significação com o conceito. Da ampla esfera teórica da Semântica, em especial, foi buscado o entendimento sobre os campos semânticos, uma vez que os conceitos, termos e relações têm suas significações dependentes do valor que lhes são impressos, garantindo uma ligação consistente entre os elementos da estrutura do tesauro. Integradas à Semântica, as teorias da Pragmática ofereceram fundamentos que não encerram os significados em sistemas estanques, o que respaldou a exploração de relações mais contextualizadas ao ambiente de uso. Por sua vez, as bases da Teoria Geral da Terminologia (TGT), de Wüster, considerada importante nas reflexões dentro da própria área da Terminologia, também contribuíram e influenciaram os avanços dos fundamentos para a construção de tesauros na BCI. Como forma de superar as limitações dos princípios wüsterianos, com um rigor semelhante às propostas filosóficas clássicas, esta pesquisa trouxe os aportes da Teoria Comunicativa da Terminologia (TCT), desenvolvida por Cabré, visando a minimizar o 249 enrijecimento que ocorre na estruturação conceitual dos tesauros devido à sua visão normalizadora em contextos comunicativos. Essa autora apresenta um construto teórico, defendendo que toda linguagem de especialidade está inserida no sistema das línguas gerais e, como tal, é regida pelas mesmas regras e caracterizada pelos mesmos fenômenos de sinonímia e variação linguística, presentes na linguagem geral. Com isso, a univocidade, defendida por Wüster e, por muito tempo, assumida na construção de tesauros, é discutida e contestada. No caminho metodológico percorrido, consideram-se atingidos os objetivos propostos nesta pesquisa. No que diz respeito ao objetivo de testar um modelo de reengenharia e verificar a sua aplicabilidade, isto foi contemplado, pois foi possível analisar e testar o modelo escolhido a partir do conjunto dos 30 conceitos da amostra, confirmando- se a exequibilidade do modelo na conversão de um tesauro tradicional em uma estrutura semanticamente enriquecida. No caso específico desta pesquisa, essa estrutura permitiu a representação do recorte temático em um sistema de conceitos e a inter-relação dos distintos elementos a partir das relações estabelecidas entre os seus componentes (conceitos, termos, strings, notas de escopo). Porém, visando a atender ao objetivo de verificar a aplicabilidade do modelo, para uma melhor condução dos procedimentos empregados na reengenharia do THESAGRO, houve a necessidade de incluir, inicialmente, uma fase de planejamento geral do trabalho, além do detalhamento das três etapas propostas pelo modelo. Houve tal demanda, porque, originalmente, nem todos os passos metodológicos indispensáveis à reengenharia do tesauro foram descritos pelos autores. Esse foi considerado o primeiro resultado deste estudo, pois apontou a importância de um planejamento inicial para a delimitação do domínio a ser modelado, bem como da determinação da subárea que se pretende representar e das demais fases pormenorizadas para a execução de um projeto de reengenharia de tesauros, cujos procedimentos estão fundamentados em princípios teóricos e metodológicos da Terminologia e da BCI. Quanto à viabilidade da conversão de um tesauro tradicional em uma estrutura conceitual semanticamente mais rica, ficou evidenciada a possibilidade da conversão de um tesauro tradicional em um SOC. Os resultados da comparação realizada entre a estrutura conceitual do atual THESAGRO e a remodelagem obtida com a aplicação do modelo de reengenharia nesse tesauro demonstraram que o instrumento reformulado apresentou uma estrutura semanticamente mais enriquecida. Essa reformulação foi alcançada por meio da análise e do mapeamento do conhecimento do domínio, o que permitiu identificar e especificar as relações existentes entre conceitos (nível conceitual) e termos (nível lexical). Nessa perspectiva, a especificação das relações entre conceitos realizada na remodelagem do THESAGRO exigiu uma análise mais verticalizada, refinada e crítica do domínio trabalhado. Dessa forma, os resultados dessas análises demonstraram que os 250 conceitos da amostra e dos seus grupos (cluster) semânticos formaram a estrutura hierárquica do tesauro, assim como inter-relacionou conceitos com conceitos (representando hierarquias), conceitos com seus termos (ligando os conceitos aos seus representantes lexicais), termos com termos (apontando equivalências), termos com strings (indicando formas variantes dos termos), o que resultou em uma estrutura conceitual e uma estrutura lexical. Como os tesauros são, essencialmente, criados para domínios de especialidade, a decisão sobre o conjunto de relações que melhor representaram o domínio modelado foi tomada levando-se em consideração as especificidades do contexto da subárea Intensificação Agropecuária e as necessidades do usuário, ou seja, ad hoc. Os resultados demonstraram que a expressão explícita das relações entre pares de entidades (conceitos, termos, strings e notas de escopo) refinou a semântica da estrutura do tesauro, dando subsídios para facilitar a interoperabilidade entre diferentes tesauros ou sistemas, porém isso ainda é dificultado pela adoção de distintos formatos de dados. Essa situação ocorre na instituição de pesquisa, EMBRAPA, onde, ao longo do tempo, as suas diversas unidades descentralizadas desenvolveram soluções tecnológicas próprias para o compartilhamento de informações. Para superar esse problema, há, dentro da EMBRAPA, um genuíno interesse em integrar e alinhar o recurso informacional da instituição por meio do desenvolvimento de SOCs. A solução apresentada nesta tese vai ao encontro da proposta da EMBRAPA, de fazer a modelagem por subáreas específicas, de forma gradual, e a partir de uma mesma abordagem metodológica global, visando a permitir que os diferentes departamentos possam interagir dentro de um mesmo contexto. Dessa forma, os resutados desta pesquisa irá facilitar a obtebção de interoperabilidade entre os sistemas de organização, auxiliando na minimização da falta de acordo e de orientação sobre o significado (semântica) e o formato adotado para a representação das informações compartilhadas entre os distintos sistemas. Acrescenta-se que o uso de formatos e padrões internacionais na construção dos tesauros pode auxiliar o intercâmbio de informações e facilitar a implementação de soluções interoperáveis. Acredita-se, ainda, que essa abordagem pode ser empregada em outros subdomínios do conhecimento que buscam soluções com base em teorias e metodologias da área da Organização e Representação do Conhecimento. Os resultados também apontaram que a reengenharia no THESAGRO possibilitou organizar e representar o conhecimento da subárea da Intensificação Agropecuária de forma mais clara e inteligível. Nesse contexto, acredita-se que os resultados obtidos facilitaram a compreensão do usuário sobre o tema modelado. Ainda que, nesta fase da pesquisa, a estrutura do tesauro não tenha sido implantada em formatos tais como SKOS, RDFS ou OWL, as explicitações das relações entre conceitos e a maior 251 formalidade na elaboração das suas definições podem ser consideradas contribuições importantes, no futuro, para a criação de representações compreensíveis por máquinas. Nesta pesquisa, no processo de reengenharia do tesauro, o gerenciamento da construção da terminologia foi auxiliado pelo e-Termos, sistema disponível em ambiente computacional interativo. Esse software é composto por seis etapas e constituído por processos automatizados e semiautomatizados. Essa ferramenta forneceu suporte aos procedimentos para a criação de produtos terminológicos e permitiu o completo controle e refinamento das redes semânticas do THESAGRO. Retomando as três questões emblemáticas deste estudo: (1) que elementos são necessários para desenvolver tesauros com relacionamentos semanticamente mais ricos?; (2) como desenvolver estruturas semanticamente enriquecidas para os tesauros?; (3) o modelo de Soergel e coautores (2004) e Lauser e coautores (2006) cumpre o propósito de auxiliar no enriquecimento semântico dos relacionamentos em um tesauro?, a análise dos resultados ofereceram as respostas, expostas a seguir. Sobre a primeira questão, a revisão de literatura apontou que a reengenharia de tesauros pode tanto priorizar somente os elementos lexicais (sobretudo com as relações de equivalência) quanto incluir também os elementos conceituais (campos semânticos e de significação) na construção da estrutura do tesauro. Nesse sentido, como bem mostrou essa revisão, trabalhando em quaisquer desses níveis, não há dúvidas de que uma maior expressividade semântica dos relacionamentos enriqueceu a estrutura do tesauro remodelado. Ao se desenvolver a nova estrutura semântica para o THESAGRO, também ficou evidente que o trabalho terminológico deve ser realizado em conjunto com diferentes especialistas, pois, caso contrário, corre-se o risco de se criar um produto que não atenda às expectativas de seus usuários. Ademais, outro importante elemento a ser considerado na construção de tesauros é o uso de normas e padrões internacionais, pois isso trará maior consistência à rede semântica criada. Quanto à segunda questão, muitos dos modelos de conversão de tesauros, apresentados na revisão, podem ser empregados no enriquecimento semântico de tesauros, dependendo do objetivo que se deseja alcançar. Assim, ficou demonstrado que os diversos modelos descritos oferecem opções de uma maior ou menor formalidade na construção de estruturas semânticas, servindo a diferentes propósitos e abordagens e podendo ser utilizados no enriquecimento semântico do instrumento. Por fim, a terceira questão pode ser respondida afirmativamente, uma vez que, com a aplicação desse modelo de reengenharia, considera-se que ficou evidenciado o enriquecimento semântico que a nova estrutura proporcionou, oferecendo ao usuário maior valor agregado às informações disponibilizadas. Portanto, os resultados evidenciaram que o 252 refinamento das relações entre os conceitos e termos, por meio da sua explicitação na estrutura do THESAGRO, auxiliou a organização do conhecimento do domínio modelado e a ampliação da visão acerca do conhecimento da área modelada, o que pode facilitar a sua compreensão e exploração pelo usuário, uma vez que tal refinamento os tornou mais claros e específicos. Outro esforço que também auxiliou no detalhamento da proposta de reformulação do THESAGRO foi a integração de procedimentos terminológicos, advindos do campo da Terminologia, na determinação dos conceitos e no estabelecimento de relações entre conceitos e termos. Esse campo trabalha com a descrição da origem e dos modos de constituição e funcionamento dos termos (unidades lexicais especializadas). Nesse sentido, os procedimentos adotados nesta pesquisa incorporaram a elaboração de mapa conceitual, Base Definicional e de definições (no sistema e-Termos) para a estruturação dos conceitos. Ademais, foram utilizados como orientação os princípios com enfoques descritivos da TCT, retirando da pauta o tratamento prescritivo na construção das terminologias dos tesauros. Ao longo do percurso desta pesquisa, alguns aspectos observados podem ser desenvolvidas em trabalhos futuros, tal como o refinamento das formalizações das definições do conjunto de relações do domínio da Agropecuária, trabalho esse que se espera concretizar ao longo dos próximos doze meses. Evidenciou-se, também, a necessidade do desenvolvimento de um guia em que conste uma compilação das diretrizes para orientar a construção de tesauros na EMBRAPA, sobretudo no estabelecimento da terminologia, uma vez que se almeja criar um modelo que possa ser replicado na modelagem do conhecimento das diversas subáreas temáticas. Outra possibilidade de estudo futuro é aproveitar o trabalho existente no tesauro AGROVOC, que já apresenta uma equivalência em português europeu para seus descritores, originalmente no idioma inglês, e adequar a equivalência desses descritores para o português brasileiro. Esse estudo pode ser iniciado a partir dos resultados obtidos nesta pesquisa. Com isso, pode ser possível construir uma versão do AGROVOC com terminologia e representação compatíveis com o contexto de uso nacional, ou seja, a agropecuária brasileira. Ademais, sugere-se, também, uma pesquisa sobre a criação de uma estrutura ainda mais semântica e interoperável, com a estruturação de listas auxiliares, tais como as existentes no sistema de classificação bibliográfico, Classificação Decimal Universal (CDU), compondo grupos (clusters) semânticos para classes mais genéricas como os nomes geográficos e propriedades, por exemplo, que podem funcionar como subvocabulários e serem utilizados em conjunto por diferentes tesauros. Ressalta-se que o conhecimento contemporâneo acerca dos fundamentos e dos requisitos das normas internacionais para a construção de tesauros, a exemplo da NISO Z39.19 (2005) e da ISO 25964 (20011; 2013), já permite criar estruturas com maior 253 complexidade, formalidade e enriquecimento semântico. Esse fato pode ser confirmado pelo exemplo da recente reformulação ocorrida na estrutura conceitual do tesauro AGROVOC. Analisando essa reformulação, verificou-se que ela foi concebida a partir da abordagem desenvolvida no método de Soergel e coautores (2004) e Lauser e coautores (2006), ou está alinhada à mesma, o que ressalta a importância da explicitação das relações entre conceitos e termos na construção de tesauros. Com essa abordagem, é possível combinar os princípios tradicionais da construção de tesauros com as novas e emergentes tecnologias da web semântica, uma vez que oferece um grau de formalização que torna a estrutura dos tesauros passível de ser representada em formatos tais como SKOS ou, até mesmo, RDFS ou OWL. Finalmente, destaca-se que nem todos os sistemas de recuperação de informação (SRI) requerem mecanismos sofisticados e complexos para organizar e filtrar as informações disponibilizadas. Porém é preciso avançar nas pesquisas e atentar-se à necessidade de métodos de construção de tesauros mais apropriados a diferentes contextos e formas de uso. Considera-se, também, que há sistemas que prescindem da estruturação do conhecimento de forma mais semanticamente enriquecida, tal como almeja a EMBRAPA em seus esforços para obter um modelo para a organização da informação que será disponibilizada. Nesse sentido, a contribuição desta pesquisa não se restringe à validação de um modelo que pode ser aplicado como solução de integração de dados nessa instituição. Aqui se apresentam, também, reflexões teóricas sobre o conceito e a sistematização e integração dos procedimentos de criação de uma terminologia de especialidade, trazendo os aportes do novo paradigma da terminologia como subsídios para área da BCI. Esses aportes têm a orientação descritiva da Teoria Comunicativa da Terminologia, colaborações que podem impactar positivamente na área da Organização e Uso da informação e fazer avançar as metodologias aplicadas na construção de tesauros. 254 REFERÊNCIAS AGROVOC Multilingual agricultural thesaurus. Disponível em: . Acesso em: 11 abr. 2013. AITCHISON, J.; CLARKE, S. D. The thesaurus: a historical viewpoint, with a look to the future. In: ROE, Sandra K.; THOMAS, Alan R. (Ed.). The thesaurus: review, renaissance and revision. Binghamton, NY: Haworth Information Press, 2004. AITCHISON, J.; GILCHRIST, A. Thesaurus construction: a practical manual. London: ASLIB, 1972. 95p. AITCHISON, J.; GILCHRIST, A. Manual para construção de tesauros. Rio de Janeiro: BNG, 1979. AITCHISON, J.; GOMERSALL, A.; IRELAND, R. Thesaurofacet: a thesaurus and faceted classification for engineering and related subjects. Whetstone, Leicester: The English Electric, 1969. ALMEIDA, G. M. B.; SOUZA, D. S. L.; PINO, D. H. P. A redação da definição terminológica para dicionários especializados. In: CONGRESSO INTERNACIONAL DA ASSOCIAÇÃO BRASILEIRA DE LINGUÍSTICA, 5., 2007, Belo Horizonte. Caderno de Resumos..., 2007. v. 1, p. 823-824. ALMEIDA, J. J. R. L. Kuhn, Wittgenstein e os paradigmas. Olhar, Florianópolis, v. 12, p. 261- 270, 2010. ALMEIDA, M. B. Um modelo baseado em ontologias para representação da memória organizacional. 2006. 316f. Tese (Doutorado em Ciência da Informação) – Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2006. ALMEIDA, M. B.; BAX, M. P. Uma visão geral sobre ontologias: pesquisa sobre definições, tipos, aplicações, métodos de avaliação e de construção. Ci. Inf., Brasília, v. 32, n. 3, p. 7- 20, set./dez. 2003. ALVARENGA, L.; DIAS, C. da C. Análise de domínio e gestão arquivística. DataGramaZero - Revista de Ciência da Informação, v. 13, n. 1, on-line, fev. 2012. Disponível em: . Acesso em: 12 jan. 2015. ALVES, J. E. D. A polêmica Malthus versus Condorcet reavaliada à luz da transição demográfica. Rio de Janeiro: Escola Nacional de Ciências Estatísticas/IBGE, 2002. (Texto para discussão da Escola Nacional de Ciências Estatísticas, n. 4). AMERICAN NATIONAL INFORMATION STANDARDS ORGANIZATION. NISO Z39.19: Guidelines for the construction, format and management of monolingual controlled vocabularies. New York: ANSI, 1974. AMERICAN NATIONAL INFORMATION STANDARDS ORGANIZATION. NISO Z39.19: Guidelines for the construction, format and management of monolingual controlled vocabularies. New York: ANSI, 1980. AMERICAN NATIONAL INFORMATION STANDARDS ORGANIZATION. NISO Z39.19: Guidelines for the construction, format and management of monolingual controlled vocabularies. Bethesda: NISO, 1993. 255 AMERICAN NATIONAL INFORMATION STANDARDS ORGANIZATION. NISO Z39.19: Guidelines for the construction, format and management of monolingual controlled vocabularies. Bethesda: NISO, 2003. AMERICAN NATIONAL INFORMATION STANDARDS ORGANIZATION. NISO Z39.19: Guidelines for the construction, format and management of monolingual controlled vocabularies. Bethesda: NISO, 2005. AMERICAN NATIONAL INFORMATION STANDARDS ORGANIZATION. NISO Z39.19: Guidelines for the construction, format and management of monolingual controlled vocabularies. Bethesda: NISO, 2006. ANDERSON, J. M. The grammar of case: towards a localist theory. London: CUP, 1971. ANDRADE, T. L. S. Polissemia e homonímia: uma análise comparativa à luz da lingüística moderna. In: CONGRESSO NACIONAL DE LINGUÍSTICA E FILOLOGIA, 4., 28 de agosto a 1 de setembro de 2000, Rio de Janeiro. Anais... Rio de Janeiro: Cadernos do CNLF, 2000. (Artes do Léxico, v. 4, n. 3). APPOLINÁRIO, F. Dicionário de metodologia científica: um guia para a produção do conhecimento científico. São Paulo: Atlas, 2004. ARANALDE, M. M. Reflexões sobre os sistemas categoriais de Aristóteles, Kant e Ranganathan. Ci. Inf., Brasília, v. 38, n. 1, p. 86-108, jan./abr. 2009. ARBOIT, A. E.; GUIMARÃES, J. A. C.; Conhecimento e linguagem na organização do conhecimento: aspectos dialógicos a partir da concepção de Bakhtin. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 14., de 29 de outubro a 1 de novembro, Florianópolis, 2013. Anais... Florianópolis, SC: ENANCIB, 2013. ASANEE, K. et al. Automatic term relationship cleaning and refinement for AGROVOC. In: CONFERENCE OF THE EUROPEAN FEDERATION FOR INFORMATION TECHNOLOGY IN AGRICULTURE, FOOD AND ENVIRONMENT, 5., July 25-28, 2005, Vila Real, Portugal, Proceedings… Vila Real, Portugal: Conference, 2005. p. 1-9. AUROUX, S. Filosofia da linguagem. Tradução de Marcos Marcionilo. São Paulo: Parábola, 2009. AUSTIN, D. Diretrizes para o estabelecimento e desenvolvimento de tesauros monolíngues. Brasília: IBICT/Senai, 1993. AUSTIN, D.; PETER, D. Guidelines for the establishment and development of monolingual thesauri for information retrieval. Paris: UNESCO, 22 dez. 1971. Disponível em: . Acesso em: 22 jul. 2013. BAKHTIN, M. Marxismo e filosofia da linguagem. 12. ed. São Paulo: Hucitec, 2006. BARBI, S. H. A teoria polifônica de Ducrot e a análise do discurso. Revista de Estudos da Linguagem, Belo Horizonte, v. 8, n. 1, p. 183-209, jan./jun. 1999. Disponível em: . Acesso em: 22 dez. 2014. BARNES, J. Aristoteles. São Paulo: Loyola, 2001. 256 BARROS, C. M. P. A semântica e o discurso. In: CONGRESSO NACIONAL DE LINGUÍSTICA E FILOLOGIA, 7., 25 a 29 de agosto de 2003, Rio de Janeiro. Anais... Rio de Janeiro: UERJ, Cadernos do CNLF, v. 7, n. 7, 2003. BARROS, J. P. P. et al. O conceito de “sentido” em Vygotsky: considerações epistemológicas e suas implicações para a investigação psicológica. Psicologia e Sociedade, São Paulo, v. 21, n. 2, p. 174-181, maio/ago. 2009. BARROS, L. A. Curso básico de Terminologia. São. Paulo: EdUSP, 2004. 296p. BARROS, L. A. Aspectos epistemológicos e perspectivas científicas da terminologia. Ciência e Cultura, São Paulo, v. 58, n. 2, abr./jun. 2006. Disponível em: . Acesso em: 22 dez. 2014. BAUER, M. W.; AARTS, B. A construção do corpus: um princípio para a coleta de dados qualitativos. In: BAUER, M.; GASKELL, G. (Org.). Pesquisa qualitativa com texto, imagem e som. Petrópolis: Vozes, 2002. p. 41-55. BENTO, A. Como fazer uma revisão da literatura: Considerações teóricas e práticas. Revista JA (Associação Académica da Universidade da Madeira), Madeira, ano 7, n. 65, p. 42-44, maio 2012. BERNERS-LEE, T.; FISCHETTI, M. Weaving the web: the original design and ultimate destiny of the World Wide Web by its inventor. Harper: San Francisco, 1999. BIDERMAN, M. T. Teoria lingüística: lingüística quantitativa e computacional. Rio de Janeiro: Livros Técnicos e Científicos, 1978. BLIKSTEIN, I. Kaspar Hauser ou a fabricação da realidade. São Paulo: Cultrix; EDUSP, 1983. BOCCATO, V. R. C.; BISCALCHIN, R. Las dimensiones culturales en el contexto de la construcción de vocabularios controlados multilingües. Revista Interamericana de Bibliotecología, v. 37, n. 3, p. 237-250, 2014. Disponível em: . Acesso em: 27 fev. 2015. BOCCATO, V. R. C.; RAMALHO, R. A. S.; FUJITA, M. S. L. A contribuição dos tesauros na construção de ontologias como instrumento de organização e recuperação da informação em ambientes digitais. Ibersid: Revista de Sistemas de Información y Documentación, Zaragoza, v. 2, p. 199-209, 2008. BONIATTI, E.; BIDARRA, J. O destino das palavras: a ambigüidade lexical na interpretação de texto. Ciênc. Cogn., v. 6, n.1, p. 2-10, nov. 2005. BORBA, F. S. Uma gramática de valências para o português. São Paulo: Ática, 1996. BOSERUP, E. The conditions of agricultural growth: the economics of agrarian change under population pressure. Chicago: Aldine, 1965. 128p. BOUTIN-QUESNEL, R. et al. Vocabulaire systématique de la terminologie. Cahiers de l'Office de la langue française. Québec: Publications du Québec, 1985 citado por BARROS, L. A. Curso básico de Terminologia. São. Paulo: EdUSP, 2004. 296p. BRAITH, B. (Org.). Bakhtin: conceitos-chave. São Paulo: Contexto, 2005. 224p. 257 BRANQUINHO, J.; MURCHO, D. (Ed.). Enciclopédia de termos Lógico-Filosóficos. Lisboa: Gradiva, 2001. 744p. BRÄSCHER, M. Tratamento automático de ambigüidades na recuperação da informação. 1999. 290 f. Tese (Doutorado em Ciência da Informação) – Universidade de Brasília, Brasília, 1999. BRÄSCHER, M.; CAFÉ, L. Organização da Informação ou Organização do Conhecimento?. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 9., 2008, São Paulo, Anais... São Paulo: ANCIB, 2008. Disponível em: . Acesso em: 31 jul. 2013. BRASIL. Ministério do Meio Ambiente. Disponível em: . Acesso em: 20 jul. 2013. BRÉAL, M. Ensaio de Semântica: ciência das significações. São Paulo: EDUC, 1992 [1897]. 223p. BRÉAL, M. Essai de Sémantique (science des significations). Paris: Hachette, 1897. BRITISH STANDARDS INSTITUTION. BS 5723: guidelines for the establishment and development of monolingual thesauri. London: The British Standards Institute, 1979. BRITISH STANDARDS INSTITUTION. BS 6723: guidelines for the establishment and development of multilingual thesauri. London: The British Standards Institute, 1985. BRITISH STANDARDS INSTITUTION. BS 5723: guidelines for the establishment and development of monolingual thesauri. London: The British Standards Institute, 1987. BRITISH STANDARDS INSTITUTION. BS 8723-1: structured vocabularies for information retrieval: guide, definitions, symbols and abbreviations. London: British Standards Institution, 2005. BRITISH STANDARDS INSTITUTION. BS 8723-2: structured vocabularies for information retrieval: guide, definitions, symbols and abbreviations. London: British Standards Institution, 2005. BRITISH STANDARDS INSTITUTION. BS 8723-3: structured vocabularies for information retrieval guide - interoperability between vocabularies. London: British Standards Institution, 2007. BRITISH STANDARDS INSTITUTION. BS 8723-4: structured vocabularies for information retrieval guide - interoperability between vocabularies. London: British Standards Institution, 2007. BRITISH STANDARDS INSTITUTION. BS 8723-5: structured vocabularies for information retrieval - guide interoperation between vocabularies and other components of information storage and retrieval systems. London: British Standards Institution, 2008. BUSH, V. As we may think. Atlantic Monthly, v. 176, n. 1, p. 101-108, 1945. Disponível em: . Acesso em: 1 out. 2014. CABRÉ, M. T. La terminología hoy: concepciones, tendências y aplicaciones. Ci. Inf., Brasília, v. 24, n. 3, 1995. 258 CABRÉ, M. T. La Terminologia: teoría, metodología, aplicaciones. Barcelona: Antartida/Empuries, 1993. 529p. CABRÉ, M. T. La terminología: representación y comunicación. Barcelona: Institut Universitari de Linguística Aplicada, Universitat Pompeu Fabra, 1999. 369p. CABRÉ, M. T. La terminologia, una disciplina em evolución: pasado, presente y algunos elementos de futuro. Revista Debate Terminológico – Riterm, n. 1-3, 2005. Disponível em: . Acesso em: 12 out. 2013. CAFÉ, L. M. M.; BRASCHER, M. B. M.; SUJII, M. K. Elaboração de tesauros utilizando-se o programa de elaboração de tesauros em microcomputador. Revista de Biblioteconomia, Brasília, v. 18, n. 2, p. 185-192, jun./dez. 1990, Disponível em: . Acesso em: 20 abr. 2014. CAMPOS, M. L. A. Linguagens documentárias: núcleo básico de conhecimento para seu estudo. R. Esc. Biblioteconomia UFMG, Belo Horizonte, v. 24, n. 1, p. 52-62, jan./jun. 1995. CAMPOS, M. L. A. Linguagem documentária: teorias que fundamentam sua elaboração. Rio de Janeiro: EUFF, 2001. CAMPOS, M. L. A. Modelização de domínios de conhecimento: uma investigação de princípios fundamentais. Ci. Inf., Brasília, v. 33, n. 1, p. 22-32, jan./abr. 2004. CAMPOS, M. L. A.; GOMES, H. E. Organização de domínios de conhecimento e os princípios ranganathianos. Perspect. Ci. Inf., Belo Horizonte, v. 8, n. 2, jul./dez. 2003. CAMPOS, M. L. A.; GOMES, H. E. Tesauro e normalização terminológica: o termo como base para intercâmbio de informações. DataGramaZero - Revista de Ciência da Informação, Rio de Janeiro, v. 5, n. 6, dez. 2004. Disponível em: . Acesso em: 8 maio 2014. CAMPOS, M. L. A.; GOMES, H. E. Metodologia de elaboração de tesauro conceitual: a categorização como princípio norteador. Perspect. Ci. Inf., Belo Horizonte, v. 11, n. 3, dez. 2006. Disponível em: . Acesso em: 4 dez. 2014. CAMPOS, M. L. A.; GOMES, H. E.; MOTTA, D. F. Manual de elaboração de tesauro. Rio de Janeiro: BITI, 2004. Disponível em: . Acesso em: 22 ago. 2013. CAMPOS, M. L. M. et al. O uso de tesauro como base terminológica para a elaboração de ontologias de domínio: uma experiência com o domínio do Folclore e Cultura Popular. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 9., 2008, São Paulo. Anais... São Paulo: USP, 2008. CAPURRO, R. What is Information Science for?: a philosophical reflection. In: VAKKARI, P.; CRONIN, B. (Ed.). Conceptions of Library and Information Science: historical, empirical and theoretical perspectives. London: Taylor Graham 1992. p. 82-98. CARDILLO, M. et al. Towards the reuse of standardized thesauri into ontologies. In: WORKSHOP ON ONTOLOGY AND SEMANTIC WEB, 5., october 19, 2014, Riva del Garda, Italy. Proceedings… Itália: WOSW, 2014. v. 1302. CARLAN, E. Sistemas de organização do conhecimento: uma reflexão no contexto da Ciência da Informação. 2010. 195f. Dissertação (Mestrado em Ciência da Informação) – 259 Faculdade de Economia, Administração, Contabilidade e Ciência da Informamação e Documentação, Universidade de Brasília, Brasília, 2010. CARVALHO, C. Para compreender Saussure. 12. ed. Petrópolis: Vozes, 2003. CARVALHO, M. J. Gaston Bachelard e a renovação da episteme no século XX. Ensaios Filosóficos, v. 2, out. 2010. CARVALHO, S. A. L. Terminologia e Documentação: um estudo terminográfico sobre performance musical. 2013. 188f. Dissertação (Mestrado em Ciência da Informação) – Escola de Ciência da Informação, Universidade Federal de Minas Gerais, 2013. Belo Horizonte: UFMG, 2013. CASTILHO, A. T. Nova gramática do português brasileiro. São Paulo: Contexto, 2010. CAVALCANTI, C. R. Indexação e tesauro: metodologia e técnicas. Brasília: ABDF, 1978. CEIA, C. E-Dicionário de termos literários. Versão eletrônica, 2005. Disponível em: . Acesso em: 12 dez. 2014. CESARINO, M. A. N.; PINTO, M. C. M. Cabeçalho de assunto como linguagem de indexação. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 7, n. 2, p. 268-288, set. 1978. CHAFE, W. L. Meaning and the structure of language. Chicago: University of Chicago, 1970. CHANTREE, F. Ambiguity management in natural language generation. The Open University and Dept. of Maths & Computing, 2004. CHRISMENT, C. et al. D’un thesaurus vers une ontologie de domaine pourl’exploration d un corpus. AMETIST, INIST, p. 59-92, 2006. CHUN, C.; LU, W. From agricultural thesaurus to ontology. In: AGRICULTURAL ONTOLOGY SERVICE (AOS) WORKSHOP, 5., 27-29 april, 2004, Beijing, China. Proceedings… Beijing, China: AOS, 2004. CINTRA, A. M. M. et al. Para entender as linguagens documentárias. São Paulo: Polis, 1994. CINTRA, A. M. M. et al. Para entender as linguagens documentárias. 2. ed. rev. ampl. São Paulo: Polis, 2002. COOK, W. A. S. J. Case grammar: development of the matrix model (1970-1978). Washington, D.C.: Georgetown University, 1979. COOK, W. A. S. J. Case grammar theory model. Washington, D.C.: Georgetown University, 1989. CORREIA, M. Homonímia e polissemia: contributos para a delimitação dos conceitos. Revista Palavras, Lisboa, n. 19, p. 57-75, 2000. COSTA, J. C. A relevância da pragmática na pragmática da relevância. Porto Alegre: EDIPUCRS, 2008. 135p. CULIOLI, A. Sur quelques contradictions en linguistique. Communications, Seuil, Paris, n. 20, p. 83-91, 1973. 260 CUNHA, M. B.; CAVALCANTI, C. R. O. Dicionário de Biblioteconomia e Arquivologia. Brasília: Briquet de Lemos, 2008, 451p. CURRÁS, E. Tesauros: linguagens terminológicas. Brasília: IBICT, 1995. CUTTER, C. A. Rules for a dictionary catalog. Washington, D.C.: UNT Libraries Digital Collections, 1876. 274p. DAHLBERG, I. Teoria do conceito. Tradução Astério Tavares Campos. Ci. Inf., Rio de Janeiro, v. 7, n. 2, p. 101-107, 1978a. DAHLBERG, I. A referent-oriented, analytical concept theory of Interconcept. International Classification, v. 5, n. 3, p. 122-151, 1978b. DAHLBERG, I. Fundamentos teórico-conceituais da classificação. Revista de Biblioteconomia de Brasília, Brasília, v. 6, n. 1, p. 9-21, jan./jun. 1978c. DAHLBERG, I. Teoria da classificação, ontem e hoje. Tradução de Henry B. Cox. In: CONFERÊNCIA BRASILEIRA DE CLASSIFICAÇÃO BIBLIOGRÁFICA, 12-17 de setembro de 1972, Rio de Janeiro. Anais... Brasília, IBICT/ABDF, v. 1, p. 352-370, 1979. Disponível em: . Acesso em: 17 jun. 2013. DAHLBERG, I. Knowledge organization and terminology; philosophical and linguistic bases. International Classification, v.19, n.2, p. 65-71, 1992. DAHLBERG, I. Knowledge organization: a new science? Knowledge Organization, Frankfurt, v. 33, n. 1, p. 11-19, 2006. DELEUZE, G.; GUATTARI, F. O que é a Filosofia. Tradução de Bento Prado Jr e Alberto Alonso Munoz. São Paulo: Ed. 34, 1997. Disponível em: . Acesso em: 22 nov. 2014. DELIISKA, B. Thesaurus and domain ontology of geoinformatics. Transactions in GIS, v. 11, n. 4, p. 637-651, 2007. DESMET, I. A análise do sentido em terminologia: teoria e prática da definição terminológica. TradTerm, v. 8, p. 169-188, 2002. DODEBEI, V. L. D. Tesauro: linguagem de representação da memória documentária. Niterói: Intertexto, 2002. DRAKE, M. A. (Ed.). Encyclopedia of Library and Information Science. 2nd ed. New York: Marcel Dekker, 2003. DUBOIS, J. et al. Dicionário de linguística. São Paulo, Cultrix, 1997. DUCROT, O. O dizer e o dito. Campinas: Pontes, 1987. ELIAS, N. Introdução à sociologia. Lisboa: Ed. 70, 1970. EMPRESA BRASILEIRA DE PESQUISA AGROPECUÁRIA – EMBRAPA. 2008. Disponível em: . Acesso em: 12 jul. 2013. 261 FARRADANE, J. Relational Indexing: part I e part ll. Journal of Information Science, n.1, p. 267-276; 313-324, 1980. Disponível em: . Acesso em: 21 jun. 2013. FAULSTICH, E. A socioterminologia na comunicação científica e técnica. Ciência e Cultura, v. 58, n. 2, p. 27-31, abr./jun. 2006. FELBER, H. Terminology manual. Paris: UNESCO/Infoterm, 1984. 426p. FERRATER-MORA, J. Dicionário de filosofia. 2. ed. São Paulo: Loyola, 2004. t.1-4. FERREIRA, A. B. H. Novo dicionário Aurélio da língua portuguesa. 4. ed. Curitiba: Positivo, 2009. FERREIRA, M. C. L. Da ambigüidade ao equívoco: da resistência da língua nos limites da sintaxe e do discurso. Porto Alegre: Editora da Universidade, 2000. FIGUEIREDO, N. Da importância dos artigos de revisão da literatura. Revista Brasileira de Biblioteconomia e Documentação, São Paulo, v. 23, n. 1-4, p. 131-135, jan./dez. 1990. FILLMORE, C. J. The case for case. In: BACH, E.; HARMS, R.T. (Org.) Universals in linguistic theory. New York: Rinehard and Winston, 1968. p. 1-88. FILLMORE, C. J. Types of lexical information. In: KIEFER, F. (Ed.). Studies in syntax and semantics. Dortrecht-Holland: D. Reidel, 1969. FILLMORE, C. J. A semântica na linguística moderna: o léxico. Tradução de Lúcia M. Lobato. Rio de Janeiro: Francisco Alves, 1977. FINATTO, M. J. B. Definição terminológica: fundamentos teórico-metodológicos para sua descrição e explicação. 2001. 395f. Tese (Doutorado em Estudos da Linguagem) – Instituto de Letras, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2001. FINATTO, M. J. B. O papel da definição de termos técnico-científicos. Revista da ABRALIN, v. 1, n. 1, p. 73-97, jul. 2002. FLICK, U. Introdução à pesquisa qualitativa. 3. ed. Tradução de J. E. Costa. São Paulo: Artmed, 2009. FONSECA, E. N. Ciência da Informação e prática bibliotecária. Ci. Inf., Brasília, v. 16, n. 2, p. 125-27, jul./dez. 1987. FOOD AND AGRICULTURE ORGANIZATION – FAO. The world agricultural production: relatório de 2004. Roma, Itália: FAO, 2004. Disponível em: . Acesso em: 18 jun. 2013. FOSKETT, A. C. A abordagem temática da informação. São Paulo: Polígono, 1973. FOUCAULT, M. A arqueologia do saber. Rio de Janeiro: Forense Universitária, 1969. FREUD, S. L ́interprétation des rêves. Paris: Presses Universitaries de France, 1967. FUCHS, C. Ambiguïté, parafhrase et langage en acte. Moléles Linguistiques, n. 19, p. 7-8, 1988. 262 FUGMANN, R. Subject analysis and indexing: theoretical foundation and practical advice. Frankfurt-am-Main: INDEKS Verlag, 1993. FURGERI, S. O papel das linguagens de marcação para a Ciência da Informação. TransInformação, Campinas, v. 18, n. 3, p. 225-239, set./dez., 2006. GARCÍA GUTIÉRREZ, A. Elementos de linguística em sistemas de información y documentación. Revista Latina de Comunicación Social, La Laguna (Tenerife), n. 7, jul. 1998. GARCIA, A. S. Uma tipologia semântica do verbo no português. Soletras, São Gonçalo (UERJ), ano 4, n. 8, p. 52-70, out./dez. 2004. GARDIN, J. C. Analyse et sélection documentaires sans les sciences humaines. In: LEROY, A. Enseignement préparatoire aux techniques de la documenation automatique. Bruxelles: Euratom, 1966a. p. 137-146. GARDIN, J. C. Eléments d'un modèle pour la description des lexiques documentaires. Bulletin des Biblioteques de France, n. 5, p.171-182, 1966b. GARDIN, J. C. Procédures d´analyse sémantique dans les sciences humaines. In: POUILLON, J.; MARANDA, P. (Org.). Échanges et communications: mélanges offerts à Claude Lévi-Strauss à l´ocasion de son 60ème anniversaire. [The Hague]: Mouton, 1970. p. 628-657. GARDIN, J. C. Document analysis and linguistic theory. Journal of Documentation, v. 29, n. 2, p. 137-68, jun. 1973. GARDIN, J. C. Analyse documentaire et théorie linguistique. In: ______. Les analyses de discours. Neuchatel: Delachaux et Niestlé, 1974. p. 120-168. (Zèthos). GARDIN, J. C. et al. La logique du plausible: essais d´épistemologie pratique. Paris: Maison des Sciences de l´Homme, 1981. GAUDIN, F. Pour une socioterminologie. Rouen: PublicationsUniversité de Rouen, 1993. GEMMA, S. F. B. Complexidade e agricultura: organização e análise ergonômica do trabalho na agricultura orgânica. 2008. 280f. Tese (Doutorado em Engenharia Agrícola) – Faculdade de Engenharia Agrícola, Universidade Estadual de Campinas, Campinas, 2008. GIL, A. C. Métodos e técnicas de pesquisa social. 4. ed. São Paulo: Atlas, 1994. GILCHRIST, A. The thesaurus in retrieval. London: Aslib, 1971. GIRARDI, E. P. A agricultura na ocupação do território brasileiro. In: ______. Atlas da Questão Agrária Brasileira. São Paulo: Unesp, 2008. Disponível em: . Acesso em: 22 jul. 2013. GNOLI, C. BC2 classes for phenomena: an application of the theory on integrative levels. The Bliss Classification Bulletin, n. 47, 2005. GOLDBECK, J. et al. The National Cancer Institute’s Thesaurus and Ontology. Journal of Web Semantics, v. 1, n. 1, dec. 2003. Disponível em: . Acesso em: 12 jan. 2013. GOMES, H. E. Diretrizes para elaboração de tesauros monolíngues. Brasília: IBICT, 1984. 263 GOMES, H. E. (Org.). Manual de elaboração de tesauros monolíngues. Brasília: Programa Nacional de Bibliotecas de Instituições de Ensino Superior, 1990. GONÇALVES, J. S.; SOUZA, S. A. M. Agricultura continental brasileira: reflexão sobre a diversidade de uma totalidade complexa. Revista Tecnologia & Inovação Agropecuária, v. 1, n. 2, dez. 2008. GRANGER, G. G. Filosofia do estilo. Tradução de Scarlett Zerbetto Marton. São Paulo: Perspectiva, 1974. 352p. GRANGER, G. G. Filosofia, linguagem, ciência. Tradução de Ivo Storniolo e José Luiz Cazarotto. São Paulo: Ideias & Letras, 2013. 416p. GREEN, R. Overview of relationship in knowledge organization. In: BEAN, C. A.; GREEN, R. (Ed.). Relationship in knowledge organization. Dordrecht: Kluwer, 2001. Chapter 1, p. 3-18. GREEN, R. Relantionships in knowledge organization. Knowledge Organization, v. 35, n. 2- 3, p. 150-159, 2008. GRITTI, L. L. Os campos semânticos e o processamento cognitivo. Cadernos de Letras da UFF – Dossiê: Letras e Cognição, Niterói, v. 41, p. 137-148, 2010. HAHN, U. Turning informal thesauri into formal ontologies: a feasibility study on biomedical knowledge re-use. Comparative Functional Genomics, v. 4, n. 1, p. 94-97, Feb. 2003. Disponível em: . Acesso em: 12 jan. 2013. HAHN, U.; SCHULZ, S. Towards a broad-coverage biomedical ontology based on description logics. Pac Symp Biocomput, p. 577-588, 2003. HENRIQUES, C. C. Léxico e semântica: estudos produtivos sobre palavra e significação. Rio de Janeiro: Campus/Elsevier, 2011. HEPP, M.; DE BRUIJN, J. GenTax: a generic methodology for deriving OWL and RDF-S ontologies from hierarchical classifications, thesauri, and inconsistent taxonomies. In: THE SEMANTIC WEB: EUROPEAN SEMANTIC WEB CONFERENCE, 4., springer, 2007, Innsbruck, Austria. Proceedings… Innsbruck, Austria: ESWC, 2007. v. 4519, p. 129-144. HJORLAND, B. Semantics and knowledge organization. Annual Review of Information Science and Technology, v. 41, p. 367-405, 2007. HJORLAND, B. Concept in knowledge organization (KO). The epistemological lifeboat, 2008a. Disponível em: . Acesso em: 12 dez. 2014. HJORLAND, B. What is Knowledge Organization (KO)?. Knowledge Organization, v. 35, n. 2-3, p. 86-101, 2008b. HJORLAND, B. Concept theory. Journal of the American Society for Information Science and Technology, v. 60, n. 8, p. 1519-1536, 2009. HJORLAND, B.; ALBRECHTSEN, H. Toward a New Horizon in Information Science: Domain-Analysis. Journal of the American Society for Information Science, v. 46, n. 6, p. 400-425, 1995. 264 HODGE, G. Systems of knowledge organization for digital libraries: beyond traditional authorities files. Washington, DC: Council on Library and Information Resources, 2000. Disponível em: . Acesso em: 24 jun. 2013. HOUAISS, A.; VILLAR, M. S. Dicionário Houaiss da língua portuguesa. Rio de Janeiro, Objetiva, 2001. HUTCHINS, W. J. Languages of indexing and classification: a linguistic study of structures and functions. Stevenage: Herts Peter Peregrinus, 1975. (Librarianship and information studies, 3). HYVÖNEN, E. et al. Building national semantic web ontology and ontology service infrastructure: the FinnONTO approach. In: EUROPEAN SEMANTIC WEB CONFERENCE, 5., 1 a 5 de junho de 2008, Tenerife, Espanha. Proceedings... Tenerife: ESWC, 2008. p. 95- 109. ILARI, R.; GERALDI, J. W. Semântica. São Paulo: Ática, 1985. ILIENKOV, E. V. A dialética do abstrato e do concreto em O Capital de Karl Marx. Tradução de Marcelo José de Souza e Silva. São Paulo: Loyola, 1960. t.1-4. INSTITUTO BRASILEIRO DE DOCUMENTAÇÃO CIENTÍFICA. Normalização da documentação no Brasil. Rio de Janeiro: IBBD, 1966. INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA – IBGE. 2012. Disponível em: . Acesso em: 12 jul. 2013. INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA – IBICT. Diretrizes para elaboração de tesauros monolíngues. Projeto coordenado por Hagar Espanha Gomes. Brasília: IBICT, 1984. 70p. [Publicação baseada na BS 5723: 1979]. INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA – IBICT. Tesauro de Ciência da Informação: versão preliminar. Brasília: IBICT, 1989. INTERNATIONAL STANDARD ORGANIZATION. ISO 2788: guidelines for the establishment and development of monolingual thesauri. Geneve: International Standard Organization, 1974. INTERNATIONAL STANDARD ORGANIZATION. ISO 5964: guidelines for the establishment and development of multilingual thesauri. Geneve: International Standard Organization, 1985. INTERNATIONAL STANDARD ORGANIZATION. ISO 2788: British Standard Guide to establishment and development of monolingual thesauri. Geneve: International Standard Organization, 1986. INTERNATIONAL STANDARD ORGANIZATION. ISO techical report, 14177: Classification of information in the construction industry. Geneve: International Standard Organization, 1994. INTERNATIONAL STANDARD ORGANIZATION. ISO 25964: thesauri and interoperability with other vocabularies. Part 1: thesauri for information retrieval. Geneve: International Standard Organization, 2011. 265 INTERNATIONAL STANDARD ORGANIZATION. ISO 25964: thesauri and interoperability with other vocabularies. Part 2: interoperability with other vocabularies. Geneve: International Standard Organization, 2013. ISQUERDO, A. N.; ALVES, I. M. (Org.). As ciências do léxico: lexicologia, lexicografia, terminologia. Rio Grande: UFMS, 2007. JACKENDOFF, R. Semantic interpretation in generative grammar. Massachusetts: MIT Press, Cambridge, 1972. KAMIKAWACHI, D. S. L. Aspectos semânticos da definição terminológica (DT): descrição linguística e proposta de sistematização. 2010. 161f. Dissertação (Mestrado em Linguística) – Centro de Educação e Ciências Humanas, Universidade Federal de São Carlos, 2010. KANT, Immanuel. Crítica da faculdade do juízo. Rio de Janeiro: Forense-Universitária, 1997. KATZ, J. J. O escopo da semântica. In: DASCAL, M. (Org.). Fundamentos metodológicos da linguística: semântica. Campinas: UNICAMP, 1982. v. 3, p. 43-61. KHOSRAVI, F.; VAZIFEDOOST, A. Creating a persian ontology through thesaurus reengineering for organizing the digital library of the National Library of Iran, In: INTERNATIONAL CONFERENCE ON LIBRARIES, INFORMATION AND SOCIETY, 26-27 june, 2007, Petaling Jaya, Malaysia. Proceedings… Petaling Jaya, Malaysia: ICOLIS, 2007. p. 41-53. KLESS, D. Quality ontology engineering based on thesaurus. In: 3rd INTERNATIONAL CONFERENCE ON BIOMEDICAL ONTOLOGY (ICBO 2012), 3., KR-MED Series, Graz, Austria, july 21-25, 2012. Proceedings… Graz, Austria: ICBO, 2012. KLESS, D. et al. A Method of re-engineering a thesaurus into an ontology. In: FORMAL ONTOLOGY IN INFORMATION SYSTEMS. INTERNATIONAL CONFERENCE – FOIS, 7., 2012, Amsterdam. Proceedings… Amsterdam: IOS Press, 2012. p.133-146. KLESS, D.; JANSEN, L.; MILTON, S. A content-focussed method for reengineering thesauri into semantically adequate ontologies. IOS Press Journal, 2014. Disponível em: . Acesso em: 12 jan. 2014. KOBASHI, N. Y. Fundamentos semânticos e pragmáticos da construção de instrumentos de representação de informação. DataGramaZero - Revista de Ciência da Informação, v. 8, n. 6, dez. 2007. Disponível em: . Acesso em: 12 maio 2013. KOBASHI, N. Y.; FRANCELIN, M. M. Conceitos, categorias e organização do conhecimento. Informação e Informação, Londrina, v. 16, n. 3, p. 1-24, jan./jun. 2011. KOBASHI, N. Y; TÁLAMO, M. F. G. M. Informação: fenômeno e objeto de estudo da sociedade contemporânea. Transinformação, v. 15, n. 3, p. 7-21, set./dez. 2003. KRIEGER, M. G.; FINATTO, M. J. B. Introdução à Terminologia: teoria e prática. São Paulo: Contexto, 2004. 223p. KRIEGER, M. G.; SANTIAGO, M. S.; CABRÉ, M. T. Terminologia em foco: uma entrevista. Calidoscópio, v. 11, n. 3, p. 328-332, set./dez. 2013. 266 KUHN, T S. A estrutura das revoluções científicas. Tradução de Beatriz Vianna Boeira e Nelson Boeira. São Paulo: Perspectiva, 1975. LAKOFF, G. Women, fire, and dangerous things: what categories reveal about the mind. Chicago: The University of Chicago Press, 1987. LAMBIN, E. F. Modeling deforestation processes a review. Luxemburgo: B. Research Report, 1994. 113p. (Trees series) LANCASTER, F. W. Vocabulary control for information retrieval. Washington, D. C.: Information Tesauro, 1972. 233p. LANCASTER, F. W. Vocabulary control for information retrieval. 2nd ed. Arlington: Information Resources, 1986. LANCASTER, F. W. Indexação e resumos: teoria e prática. 2. ed. Brasília: Briquet de Lemos, 2004. LANMAN, C. R. Reflected meanings: a point in semantics. In: TRANSACTIONS OF THE AMERICAN PHILOLOGICAL ASSOCIATION (1869-1896), Philadelphia, Pa., December, 1894. Proceedings of the Special Session… Philadelphia, Pa.: APA, 1895. v. 26, p. xi-xv. LARA, M. L. G. A representação documentária: em jogo a significação. 1993. 133f. Dissertação (Mestrado em Ciências da Comunicação) – Escola de Comunicações e Artes, Universidade de São Paulo, 1993. LARA, M. L. G. Representação e linguagens documentárias: bases teórico-metodológicas. 1999. 280f. Tese (Doutorado em Ciências da Comunicação) – Escola de Comunicação e Artes, Universidade de São Paulo, 1999. LARA, M. L. G. A terminologia como instrumento para construção de ferramentas semânticas. In: CONGRESSO BRASILEIRO DE BIBLIOTECONOMIA E CIÊNCIA DA INFORMAÇÃO, 20, jun. 2002. Fortaleza. Anais... Fortaleza: CBBD, 2002. LARA, M. L. G. Diferenças conceituais sobre termos e definições e implicações na organização da linguagem documentária. Ci. Inf., Brasília, v. 33, n. 2, p. 91-96, ago. 2004. Disponível em: . Acesso em: 30 jan. 2015. LARA, M. L. G. Novas relações entre Terminologia e Ciência da Informação na perspectiva de um conceito contemporâneo da informação. DataGramaZero - Revista de Ciência da Informação, v. 7, n. 4, ago. 2006. Disponível em: . Acesso em: 30 jan. 2015. LARA, M. L. G.; TÁLAMO, M. F. G. M. Uma experiência na interface Linguística Documentária e Terminologia. DataGramaZero - Revista de Ciência da Informação, v. 8, n. 5, out. 2007. Disponível em: . Acesso em: 3 jan. 2015. LAUSER, B. et al. From AGROVOC to the Agricultural Ontology Service: Concept Server an OWL model for creating ontologies in the agricultural domain. In: INTERNATIONAL CONFERENCE ON DUBLIN CORE AND METADATA APPLICATIONS, 2006, Colima, Mexico. Proceedings… México: DCMI, 2006. 267 LELE, U. J.; STONE, S. W. Population pressure, the environment, and agricultural intensification: variations on the Boserup hypothesis. Washington, DC: The World Bank, 1989. (MADIA Discussion, Paper n. 4) LIMA, G. A. B. O. A análise facetada na modelagem conceitual para organização hipertextual de documentos acadêmicos: sua aplicação no protótipo MHTX (mapa hipertextual). Informação e Sociedade: Estudos, João Pessoa, v. 17, n. 1, p. 31-41, jan./abr. 2007. LIMA, G. A. B. O. Modelos de categorização: apresentando o modelo clássico e o modelo de protótipos. Perspect. Ci. Inf., Belo Horizonte, v. 15, n. 2, p. 108-122, maio/ago. 2010. LIMA, M. A. M.; MARINELLI, M. A epistemologia de Gaston Bachelard: uma ruptura com as filosofias do imobilismo. Revista de Ciências Humanas, Florianópolis, v. 45, n. 2, p. 393-406, out. 2011. LORENZON, E. J. Análise de domínio para avaliação de tesauros: uma experiência com a cadeia produtiva do calçado no Brasil. 2011. 108f. Tese (Doutorado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2011. LUCAS, C. R. A metalinguagem como lugar da interpretação: terminologia e bases de dados informatizadas. DELTA, São Paulo, v. 15, n. 1, fev. 1999. Disponível em: . Acesso em: 11 mar. 2015. LYONS, J. Semântica estrutural. Tradução de António Pescada. Lisboa: Editorial Presença, 1963. MACEDO, A. C. P. S. Categorização semântica: uma retrospectiva de teorias e pesquisas. Revista Gelne, Teresina, PI, v. 4, n. 1, p. 1-7, 2002. MACHADO, J. G. C. F.; NANTES, J. F. D. Tecnologia de informação em organizações rurais: um estudo na pecuária de corte. Informações Econômicas, São Paulo, v. 38, n. 10, out. 2008. MACHADO, T. C. R. S. Classificação regencial dos verbos nocionais em dicionários de língua portuguesa. 2008. 117f. Dissertação (Mestrado em Linguística) - Universidade de Brasília, Instituto de Letras, Programa de Pós-Graduação em Linguística. Brasília: UnB, 2008. MACULAN, B. C. M. S. Taxonomia facetada e navegacional: um mecanismo de recuperação. Curitiba: Appris, 2014. 233p. MAIMONE, G. D.; TÁLAMO, M. F. G. M. Linguística e terminologia: contribuições para a elaboração de tesauros em ciência da informação. DataGramaZero - Revista de Ciência da Informação, v. 12, n. 2, abr. 2011. Disponível em: . Acesso em: 6 dez. 2014. MARCONDES, D. Filosofia, linguagem e comunicação. São Paulo: Cortez, 2000. 168p. MARCONI, M. A.; LAKATOS, E. M. Técnicas de Pesquisa. 2. ed. São Paulo: Atlas, 1990. MARCONI, M. A.; LAKATOS, E. M. Fundamentos de metodologia científica. 7. ed. São Paulo: Atlas, 2010. 268 MARRONI, G. N. B. Identificação e delimitação de relações associativas em tesauros: um estudo de caso na área do direito do trabalho. 2006. 142f. Dissertação (Mestrado em Ciência da Informação) – Faculdade de Economia, Administração, Contabilidade e Ciência da Informação e Documentação, Universidade de Brasília, 2006. MARTINS, A. F. C. Dicionário terminologico-digital do ciclo de produção do alumínio. Cadernos do CNLF, Rio de Janeiro, v. 15, n. 5, t. 2, p. 1597-1610, 2011. MEDIN, D. L. Concepts and conceptual structure. American Psychologist, v. 44, n. 12, p. 1469-1481, dec. 1989. MENEGHETTI, F. K. Pragmatismo e os pragmáticos nos estudos organizacionais. Cadernos EBAPE.br, Rio de Janeiro, v. 5, n. 1, mar. 2007. MEURER, J. L.; MOTTA-ROTH, D. (Org.). Parâmetros de textualização. Santa Maria: UFSM, 1997. MOREIRA, A. Tesauros e Ontologias: estudo de definições presentes na literatura das áreas das Ciências da Computação e da Informação, utilizando-se o método analítico-sintético. 2003. 150f. Dissertação (Mestrado em Ciência da Informação) – Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2003. MOREIRA, M. P.; MOURA, M. A. Construindo tesauros a partir de tesauros existentes: a experiência do TCI - Tesauro em Ciência da Informação. DataGramaZero - Revista de Ciência da Informação, v. 7, n. 4, ago. 2006. Disponível em: . Acesso em: 22 dez. 2014. MOREIRA, W.; LARA, M. L. G. Relações conceituais e categorias filosóficas: aportes das ontologias e da terminologia para a representação do conhecimento. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília, DF. Anais... Brasília: ENANCIB, 2011. MORRIS, C. W. Fundamentos da teoria dos signos. Tradução de António Fidalgo. Covilha: Universidade da Beira Interior, 1983. MORTIMORE, M. Population growth and land degradation. GeoJournal, Denmark, v. 31, n. 1, p.15-21, sept. 1993. MOTTA, D. F. da. Método relacional como nova abordagem para a construção de tesauros. 1987. 89f. Dissertação (Mestrado em Ciência da Informação) – Instituto Brasileiro de Informação em Ciência e Tecnologia, Rio de Janeiro, 1987. Disponível em: . Acesso em: 12 jun. 2013. MYAENG, S. H.; MCHALE, M. L. Toward a relation hierarchy for information retrieval. In: ASIS SIG/CR CLASSIFICATION RESEARCH WORKSHOP, 1992, Medford. Advances in classification research: proceedings. 2nd. Medford, NJ: Learned Information, 1992. p. 101- 113. NASCIMENTO, E. M. F. S. Saussure: o estruturalista antes do termo. Diálogos Pertinentes – Revista Científica de Letras, Franca/SP, v. 4, n. 4, p. 259-276, jan./dez. 2008. NASCIMENTO, M. S. O. et al. A ontologia na ciência da informação. Revista Digital de Biblioteconomia e Ciência da Informação, v. 5, n. 1, p. 13-39, jul./dez. 2007. Disponível em: . Acesso em: 22 dez. 2012. 269 NAVES, M. M. L.; KURAMOTO, H. (Org.). Organização da informação: princípios e tendências. Brasília, DF: Briquet de Lemos, 2006. NORONHA, D. P.; FERREIRA, S. M. S. P. Revisões de literatura. In: CAMPELLO, B. S.; CENDÓN, B. V.; KREMER, J. M. (Org.). Fontes de informação para pesquisadores e profissionais. Belo Horizonte: UFMG, 2000. OLIVEIRA, J. R. Sustentabilidade e intensificação produtiva da agricultura familiar: um estudo comparativo entre duas comunidades em Itapejara D’Oeste, Sudoeste do Paraná. Synergismus Scyentifica, Universidade Tecnológica Federal do Paraná, Pato Branco, v. 6, n. 1, 2011. OLIVEIRA, L. H. M. e-Termos: um ambiente colaborativo web de gestão terminológica. 2009. 258f. Tese (Doutorado em Ciências de Computação e Matemática Computacional) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2009. Disponível em: . Acesso em: 3 dez. 2014. OLIVEIRA, M. G. A. Predicações polissêmicas e metafóricas: uma abordagem semântico- pragmática. 1995. 175f. Tese (Doutorado em Linguística Teórica) – Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão, Florianópolis, 1995. OLIVEIRA, N. Edmund Husserl (1859-1938). In: PECORARO, R. (Org.). Clássicos da filosofia. Rio de Janeiro: PUC-Rio, 2008. p. 231-253. PAGOTTI, E. Definições pragmático-flexivas e oralidade. 2006. 371f. Tese (Doutorado em Filologia e Língua Portuguesa) – Faculdade de Filosofia, Letras e Ciências Humanas, Universidade de São Paulo, 2006. PAVEL, S.; NOLET, D. Manual de terminologia. Tradução de Enilde Faulstich. Canadá: Direção de Terminologia e Normalização Departamento de Tradução do Governo Canadense, 2002. 147p. PEDROSA, C. E. F. Recursos para uma desambiguização das “frases” veiculadas pelas revistas Veja e Isto É. In: CONGRESSO NACIONAL DE LINGUÍSTICA E FILOLOGIA, 5., 27 a 31 de agosto de 2001, Rio de Janeiro. Anais... Rio de Janeiro: UERJ, Cadernos do CNLF, v. 5, n. 11, 2001. Disponível em: . Acesso em: 13 jul. 2014. PEIXOTO, Marcus. A extensão privada e a privatização da extensão: uma análise da indústria de defensivos agrícolas. 2009. 332f. Tese (Doutorado em Ciências) – Universidade Federal Rural do Rio de Janeiro, 2009. PIEROZZI JR, I.; OLIVEIRA, L. H. M.; ALENCAR, M. C. F. Sistema de organização do conhecimento sobre Intensificação Agropecuária: agregando valor às redes de conhecimento da Embrapa. In: INTERNATIONAL SOCIETY FOR KNOWLEDGE ORGANIZATION - ISKO BRASIL, 2012, Marília. Anais... Marília, São Paulo: FUNDEPE, 2012. PIEROZZI JR, I.; OLIVEIRA, L. H. M.; SOUZA, K. X. S. Construindo ontologias de domínio: o (re)conhecimento da Intensificação Agropecuária no Brasil. In: SEMINÁRIO DE PESQUISA EM ONTOLOGIA NO BRASIL – ONTOBRAS, 3., 30 a 31 de agosto de 2010, Florianópolis. Anais... Florianópolis, 2010. 270 PING, L.; YONG, L. On transformation from the thesaurus into domain ontology. In: INTERNATIONAL CONFERENCE ON COMPUTER AND INFORMATION APPLICATION, 2., 8-9 december 2012, Taiyuan, China. Proceedings… Taiyuan, China: ICCIA 2012. PINGALI, P. L.; BIGOT, Y.; BINSWANGER, H. P. Agricultural mechanization and the evolution of farming systems in sub-Saharan Africa. Africa: World Bank Report, 1986. POTTIER, B. Sémantique générale. Paris: PUF, 1992. 237p. PUSTEJOVSKY, J. The generative lexicon. Cambridge, MA: MIT Press, 1995. QIN, J.; PALING, S. Converting a controlled vocabulary into an ontology: the case of GEM. Information Research, v. 6, n. 2, 2001. RANGANATHAN, S. R. Prolegomena to library classification. London: Asia Publishing House, 1957. RANGANTHAN, S. R. Prolegomena to library classification. Bombay: Asia Publishing House, 1967. REHFELDT, G. K. Polissemia e campo semântico: estudo aplicado aos verbos de movimento. Porto Alegre: EDURGS/FAPA/FAPCCA, 1980. RENDÓN ROJAS, M. A. Hacia um nuevo paradigma em bibliotecologia. Transinformação, Campinas, v. 8, n. 3, p. 17-31, set./dez. 1996. REY, A. La terminologie: noms et notions. Paris: Paris Universitaires de France, 1979. RINDFLESCH, T. C.; ARONSON, A. R. Ambiguity resolution while mapping free: text to the umls metathesaurus. In: ANNUAL SYMPOSIUM ON COMPUTER APPLICATIONS IN MEDICAL CARE, 1994. Proceedings… p. 240-244. Disponível em: . Acesso em: 7 mar. 2014. RIVIER, A. Construção de linguagens de indexação: aspectos teóricos. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 21, n. 1, p. 56-99, jan./jun. 1992. RODRIGUES, M. E. F. Os paradigmas da ciência e seus efeitos na composição dos campos científicos: a instituição da Ciência da Informação. DataGramaZero - Revista de Ciência da Informação, v. 11, n. 4, ago. 2010. Disponível em: . Acesso em: 22 dez. 2014. ROGET, P. M. Thesaurus of English Words and Phrases. London: Longman, Brown, Green, and Longmans, 1852. ROSSA, L. Indeterminação semântica: ambiguidade, vagueza e polissemia na teoria da relevância. 2001. 172f. Dissertação (Mestrado em Letras) – Faculdade de Letras Universidade Federal de Santa Catarina, Santa Catarina: UFSC, 2001. RUOTSALO, T. et al. Ontology-based approach for interoperability of digital collections. Signum, v. 5, p. 5-13, 2008. Disponível em: . Acesso em: 18 mar. 2013. SAARTI, J.; HYPÉN, K. From thesaurus to ontology: the development of the Kaunokki Finnish fiction thesaurus. The Indexer, v. 28, n. 2, p. 50-58, 2010. 271 SAGER, J. C. A practical course in teminology processing. Amsterdã: John Benjaimim B.V., 1990. SAGER, J. C. La terminología, puente entre vários mundos. In: CABRÉ, M. T. La terminologia: teoria, metodologia, aplicaciones. Barcelona: Antártida/Empúries, 1993. SALES, L. F.; CAMPOS, M. L. A.; GOMES, H. E. Ontologias de domínio: um estudo das relações conceituais. Perspect. Ci. Inf., v. 13, n. 2, p. 62-76, maio/ago. 2008. SALES, R. Suportes teóricos para pensar linguagens documentárias. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 5, n. 1, p. 95-114, jul./dez. 2007. Disponível em: . Acesso em: 10 jun. 2013. SANAA, M. et al. A methodological approach for converting thesaurus to domain ontology: application to tourism. International Journal of Engineering and Innovative Technology (IJEIT), v. 3, n. 5, nov. 2013. SANTOS, B. S. Um discurso sobre as ciências. 5. ed. São Paulo: Cortez, 2008. SANTOS, D.; CARDOSO, N. (Ed.). Reconhecimento de entidades mencionadas em português: documentação e actas do HAREM, a primeira avaliação conjunta na área. [S.l.]: Repositório Linguateca, 2007. cap. 4, p. 43-57. SANTOS, I.; NASCIMENTO, M. E. F. Bakhtin e Wittgenstein: teorias em diálogo. Theoria – Revista Eletrônica de Filosofia, Pouso Alegre, n. 3, p. 76-85, 2010. SCHLIEBEN-LANGE, B. História do falar e história da linguística. Campinas: UNICAMP, 1993. SCHULZ, S. et al. The pitfalls of thesaurus ontologization: the case of the NCI thesaurus. In: ANNUAL SYMPOSIUM, Nov. 17, 2010, Washington. Proceedings… Washington: AMIA, 2010. SCHWARZE, C. La sémantique do verbe. In: ______. Introduction à la sémantique lexicale. Tübingen: Narr, 2001. p. 89-113. SEIDE, M. S. A semântica de Michel Bréal: recontextualização, fortuna crítica e aplicação. 2006. 280f. Tese (Doutorado em Filosofia e Língua Portuguesa) – Faculdade de Filosofia, Letras e Ciências Humanas, Universidade de São Paulo, São Paulo, 2006. SILVA, F. G.; SANT´ANNA, S. A semântica lexical e as relações de sentido: sinonímia, antonímia, hiponímia e hiperonímia. Cadernos do CNLF, Livro dos Minicursos, v. 13, n. 3, 2009. SILVA, L. B. Ambigüidades da língua portuguesa: recorte classificatório para a elaboração de um modelo ontológico. 135f. 2006. Dissertação (Mestrado em Ciência da Informação) – Departamento de Ciência da Informação e Documentação, Universidade de Brasília, 2006. SILVEIRA, M. R. A. Produção de sentidos e construção de conceitos na relação ensino/aprendizagem da matemática. 2005. 176f. Tese (Doutorado em Educação) – Faculdade de Educação, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2005. SINCLAIR, J. How to use corpora in language teaching. Phildelphia/Amsterdam: John Benjamins, 2008. 272 SIQUEIRA, J. C. As noções de documento e informação. 2. ed. São Paulo: Ed. do Autor. 2013. 152p. SOERGEL, D. Indexing languages and thesauri: construction and maintenance. Los Angeles, CA: Wiley, 1974. SOERGEL, D. The rise of ontologies or the reinvention of classification. Journal of the American Society of Informationl Science, v. 50, n. 12, p. 1119-1120, 1999. SOERGEL, D. et al. Reengineering thesauri for new applications: the AGROVOC example. Journal of Digital Information, v.4, n.4, 2004. SOUALMIA, L. F.; GOLDBREICH, C.; DARMONI, S. J. Representing the mesh in owl: Towards a semi-automatic migration. In: INTERNATIONAL WORKSHOP ON FORMAL BIOMEDICAL KNOWLEDGE REPRESENTATION, 1., june 2004, Whistler, Canada. Proceedings… Whistler, Canada: KR-MED, 2004. p. 81-87. SOUZA, G. M. Taxonomias: associar termos relacionados. Webinsider, 17 nov. 2010. Disponível em: . Acesso em: 15 jan. 2013. SOUZA, R.; TUDHOPE, D; ALMEIDA, M. B. Towards a taxonomy of KOS: dimensions for classifying knowledge organization systems. Knowledge Organization, v. 39, n. 3, p. 179- 192, 2012. SOUZA, R. A.; HINTZE, A. C. J. Pragmatismo e linguística: interfaces e intersecções. Cognitio-Estudos: Revista Eletrônica de Filosofia, São Paulo, v. 7, n. 2, p. 108-120, jul./dez. 2010. SUTCLIFFE, J. Concept, class, and category in tradition of Aristotle. In: MECHELEN, I. et al. (Ed.). Categories and concepts: theoretical views an inductive data analysis. New York: Academic, 1993. p. 35-66. SVENONIUS, E. The intellectual foundations of information organization. Cambridge: The MIT Press, 2000. TARALLO, F. A Pesquisa Sociolinguística. São Paulo: Ática, 1986. TAUBE, M. Functional approach to bibliographic organization: a critique and a proposal. In: SHERA, J. H.; EGAN, M. E. (Ed.). Bibliographic organization: papers presented before the fifteenth annual conference of the Graduate Library School. Chicago: University of Chicago, 1951. p. 57-71. TEIXEIRA, J. R. Conversão de tesauros em ontologias [manuscrito]: um estudo exploratório. 2013. 122f. Dissertação (Mestrado em Ciência da Informação) – Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2013. TEMMERMAN, R. Towards new ways of terminology description: the sociocognitive approach. Amsterdam: John Benjamins, 2000. TESNIÈRE, L. Élements de syntaxe structurale. 2. ed. Paris: Klincksieck, 1966. THESAGRO. Thesaurus Agrícola Nacional. Brasília: MAPA/SE/BINAGRI, 2006. 273 THESAURUS OF ENGINEERING AND SCIENTIFIC TERMS – TEST. Washington, D.C.: Departament of Defence, 1967. Disponível em: . Acesso em: 22 dez. 2014. TORDAI, A.; OMELAYENKO, B.; SCHREIBER, G. Thesaurus and metadata alignment for a semantic e-culture application. In: INTERNATIONAL CONFERENCE ON KNOWLEDGE CAPTURE, 4., 2007. ACM New York, NY, USA. Proceeding… New York, NY, USA: K-CAP '07, 2007. p. 199-200. TRISTÃO, A. M. D.; FACHIN, G. R. B.; ALARCON, O. E. Sistema de classificação facetada e tesauros: instrumentos para organização do conhecimento. Ci. Inf., Brasília, v. 33, n. 2, p. 161-171, ago. 2004. ULLMANN, S. Semântica: uma introdução à ciência do significado. Tradução de J. A. Osório Mateus. Lisboa: Fundação Calouste Gulbenkian, 1964. UNITED NATIONS EDUCATIONAL, SCIENTIFIC AND CULTURAL ORGANIZATION – UNESCO. Guidelines for the establishment and development of monolingual thesauri for information retrieval. Paris: UNESCO, 22 dez. 1971. Disponível em: . Acesso em: 22 jul. 2013. UNITED NATIONS EDUCATIONAL, SCIENTIFIC AND CULTURAL ORGANIZATION – UNESCO. Diretrizes para o estabelecimento e desenvolvimento de tesauros monolíngües. Tradução de Bianca Amaro de Melo. Revisão de Lígia Maria Café de Miranda. Brasília: IBICT; SENAI, 1993. UNITED NATIONS INTERNATIONAL SCIENTIFIC INFORMATION SYSTEM – UNISIST. Guidelines for the Establishment and Development of Monolingual Thesauri. 2nd rev. ed. Paris: UNESCO, 1971. UNITED NATIONS INTERNATIONAL SCIENTIFIC INFORMATION SYSTEM – UNISIST. Principes directeurs pour l'établissement et le développement de thesaurus monolingues. Paris: UNESCO, 1973. [SC/WS/555]. UNITED NATIONS INTERNATIONAL SCIENTIFIC INFORMATION SYSTEM – UNISIST. Guidelines for the Establishment and Development of Monolingual Thesauri. 2nd rev. ed. Paris: UNESCO, 1981. VAN ASSEM, M. et al. A method for converting thesauri to RDF/OWL. In: INTERNATIONAL SEMANTIC WEB CONFERENCE, 3., november 7-11, 2004, Hiroshima, Japan. Proceeding… Hiroshima, Japan: ISWC2004, 2004. VAN ASSEM, M. et al. A method to convert thesauri to SKOS. In: EUROPEAN SEMANTIC WEB CONFERENCE, 3., 11-14 june, 2006, Budva, Montenegro. Proceedings… Budva, Montenegro: ESWC'06, 2006. v. 4011, p. 95-109. VAN DER LAAN, Regina Helena. Linguagens alfabéticas de indexação: metodologia de elaboração em uma interface com a Terminologia. Porto Alegre: UFRGS / FABICO / DCI, 2002. VARO, C. La antonimia léxica. Madrid: Arco Libros, 2007. VICKERY, B. C. Thesaurus: a new word in documentation. Journal of Documentation, v. 16, n. 4, dec. 1960. 274 VICKERY, B. C. A note on knowledge organization. [2007]. Site Lifeboat for Knowledge Organization. Disponível em: . Acesso em: 11 jun. 2013. VILELA, M. Gramática de valências: teoria e aplicação. Coimbra: Almedina, 1992. VILLAZÓN-TERRAZAS, B. M. Method for Reusing and Re-engineering Non-ontological Resources for Building Ontologies. 2011. 238f. Tese (Doutorado em Inteligência Artificial) – Facultad de Informática (UPM), Universidade Politécnica de Madrid, Madrid, 2011. VILLAZÓN-TERRAZAS, B. M.; PRIYATNA, F. Building Ontologies by using Re-engineering Patterns and R2RML Mappings. In: WORKSHOP ON ONTOLOGY PATTERNS, 3., november 12, 2012, Boston, USA. Procedings… Boston: WOP, 2012. VILLAZÓN-TERRAZAS, B. M.; SUÁREZ-FIGUEROA, M. C.; GÓMEZ-PÉREZ, A. Pattern for re-engineering a term-based thesaurus, which follows the record-based model, to a lightweight ontology. In: WORKSHOP ON ONTOLOGY PATTERNS, October 25, 2009, Washington, D.C. Proceedings… Washington, D.C.: WOP, 2009. VYGOTSKY, L. S. Pensamento e linguagem. 2. ed. São Paulo: Martins Fontes, 1998. WIELINGA, B. J. et al. From thesaurus to ontology. In: INTERNATIONAL CONFERENCE ON KNOWLEDGE CAPTURE, 1., 2001, Victoria, Canada. Proceedings…Victoria, Canada: ICKC, 2001. p. 194-201. Disponível em: . Acesso em: 22 fev. 2014. WITTGENSTEIN, L. Investigações Filosóficas. Tradução de M. G. Montagnoli. Petrópolis: Vozes, 1996. WORLD WIDE WEB CONSORTIUM – W3C. Simple knowledge organization system (SKOS). San Francisco: W3C, 2004. WORLD WIDE WEB CONSORTIUM – W3C. Simple knowledge organization system (SKOS). San Francisco: W3C, 2009. WORLD WIDE WEB CONSORTIUM – W3C. Simple knowledge organization system (SKOS). San Francisco: W3C, 2012. WORLD WIDE WEB CONSORTIUM – W3C. 2013. Disponível em: . Acesso em: 23 jul. 2013. WORLD WIDE WEB CONSORTIUM – W3C. 2014. Disponível em: . Acesso em: 23 jan. 2015. WÜSTER, E. Introducción a la teoría general de la terminología y a la lexicografía terminológica. Barcelona: IULA, 1998. YAMAGUCHI, L. C. T. Gestão informatizada de fazendas e cooperativas agropecuárias. In: WORKSHOP O AGRONEGÓCIO NA SOCIEDADE DA INFORMAÇÃO, 2002, Brasília. Anais... Brasília, DF: AGROSOFT, 2002. Disponível em: . Acesso em: 12 jul. 2013. YAO, L. et al. On Automatic construction of domain ontology. Institute of Computational Linguistics, v. 29, n. 11, p. 65-69, 2006. 275 ZENG, M. L. Knowledge organization systems (KOS). Knowledge Organization, Frankfurt, v. 35, n. 2-3, p. 160-182, 2008. 276 APÊNDICE A – Propostas de Sistematização de Relações em Tesauros, por data ANO AUTOR(ES) TIPOS DE RELACIONAMENTOS: TESAUROS 1960 VICKERY Relação de equivalência Relação hierárquica Relação associativa 1971 AUSTIN; PETER (norma UNESCO) Relação de equivalência Sinônimo Quase sinônimo Relação hierárquica Gênero-espécie Partitiva Exemplificação Poli-hierarquias Relação associativa Entre termos de mesma categoria Entre termos de categorias diferentes 1974 SOERGEL Relação de definição Sinônimo Quase sinônimo Relação hierárquica Gênero-espécie Partitiva Relação associativa Conceito similar Conceito próximo contextualmente Contiguidade baseada na definição Contiguidade baseada no conhecimento empírico Contiguidade e frequência de combinação 1978 CAVALCANTI Relação de equivalência Sinônimo Quase sinônimo Remissivas Relação hierárquica Gênero-espécie Partitiva Relação de associação Conceito oposto Genética Coordenação Causa e efeito Instrumental Material Similaridade 277 ANO AUTOR(ES) TIPOS DE RELACIONAMENTOS: TESAUROS 1978a, b e c. DAHLBERG Relação lógica Identidade Implicação Intersecção Disjunção Negação Relação semântica Relação hierárquica Gênero-espécie Espécie-indivíduo Relação partitiva Todo / partes Parte / parte Parte / subpartes Relação de oposição Contradição Privação/possessão Contrariedade Relativos a propriedades Relação funcional (associativa) Afirmação-proposição Processos e propriedade/entidade Atividades e propriedade/entidade Operações e propriedade/entidade 1979 AITCHISON; GILCHRIST Relação de equivalência Sinônimo verdadeiro Nomes comerciais Raízes diferentes Termos defasados Uso local/Transatlântico Uso popular Quase sinônimo Diferentes pontos de vista da mesma propriedade Termos que têm uma superposição significativa Conceitos específicos incluídos sob termos genéricos Estabilidade / Instabilidade, Nutrição / Desnutrição Termos que têm uma superposição significativa; Genética / Hereditariedade Acuidade / Precisão Relação hierárquica Gênero-espécie Coisa-tipo Todo-parte Poli-hierárquicas Relação não hierárquica Espécies de mesmo gênero Entre coisas Coisa / parte Coisa / propriedade Coisa / processo Coisa / coisa como atributo Coisa / aplicação Propriedades Propriedade-processo Propriedade-propriedade como tributo Entre processos Processo-coisa (agente) Processo-propriedade Entre quase sinônimos 278 ANO AUTOR(ES) TIPOS DE RELACIONAMENTOS: TESAUROS 1990 GOMES Relação lógica Gênero-espécie Analítica Oposição Relação ontológica Partitiva Sucessão ou contiguidade Entre material e produtos Relação de efeito Causalidade ou causa efeito Instrumentalidade Descendência 1990 CAFÉ; BRASCHER; SUJII Relação de equivalência Sinonímia Equivalentes em outro idioma Relação hierárquica Genérico-específicas Termo específico Relação associativa Termo relacionado Relação alternativa Entre um termo não-descritor e vários termos descritores 1993 FUGMANN Relação de equivalência Sinonímia Antonímia Especificação desnecessária Significado próximo Histórica: do termo obsoleto para o termo atual Acrônimo Ordem inversa Grafia diferente Relação hierárquica Gênero-espécie Partitiva Relação associativa Relações ad-hoc 279 ANO AUTOR(ES) TIPOS DE RELACIONAMENTOS: TESAUROS 1994 CINTRA et al. Relação de equivalência Sinonímia Quase sinonímia Dialetos diferentes (regionais, sociais, etários) Diferentes estilos ou registros Diferença emotiva ou valorativa Ocorrência limitada Significados próximos Relação hierárquica Genéricas Específicas Partitivas Relação não-hierárquica Atributiva Disciplina ou campo e objetos ou fenômenos Processo ou operação e seu agente ou instrumento Influência Matéria-prima e produto Coisa e aplicação Ação e resultado da ação Causalidade ou causa e consequência Efeito e causa Dependência causal Atividade e agente Atividade e propriedade Atividades complementares Opostos Ação e seu paciente Coisa ou atividades e suas propriedades ou agentes Coisa e seu contra-agente Atividade e seu produto Pessoa ou coisa e sua origem Associação implícita Expressão sincategoremática e substantivos nela incluídos Interfaceta 280 ANO AUTOR(ES) TIPOS DE RELACIONAMENTOS: TESAUROS 1995 CURRÁS Relação de equivalência Sinônimos Quase sinônimos Relação hierárquica Genérico-específicas Espécies de animais ou plantas Objetos e suas classes Ações e propriedades Conceitos abstratos e seus efeitos Profissões e suas classes Partitivas Sistema e órgãos do corpo Localidades geográficas Ciências e disciplinas Estruturas hierárquicas sociais Enumerativas Poli-hierárquicas Relação associativa Termos que pertencem à mesma categoria Termos que pertencem a categorias diferentes Todo com a parte. Disciplinas (campos, objetos ou fenômenos estudados) Operação ou processo e seu agente ou instrumento Ocupação e a pessoa que a exerce Ação e um produto dessa ação Ação e um sujeito paciente Conceitos relacionados com suas propriedades Conceitos relacionados com sua origem Conceitos unidos por dependência de causa Matéria prima e seu produto Ação e a propriedade associada a ela Conceito e seu oposto 2000 SVENONIUS Relação de equivalência Sinonímia Variação linguística Ortográfica Gráfica Sintática Relação hierárquica Gênero-espécie Partitiva Lugar e seu componente Tópico e subtópico Região geográfica e sub-região Elemento orgânico e suas partes Disciplina e seus estudos Por perspectiva (pontos de vista) Relação associativa Oposição Todas que não as de equivalência ou hierárquicas 281 ANO AUTOR(ES) TIPOS DE RELACIONAMENTOS: TESAUROS 2002 DODEBEI Relação de Equivalência (Identidade) Equivalência léxica Equivalência simbólica Equivalência sintática Relação Partitiva Entre conceitos que expressam objetos Relação Hierárquica (Implicação) Gênero- espécie Partitiva Relação de Oposição (Negação) Entre distintas propriedades Contradição Gradação Relação Funcional (Intersecção) Entre processos 2004 TRISTÃO; FACHIN; ALARCON Relação lógica Genérico-específicas Analíticas Oposição Contraditório (exclusão e implicação recíprocas) Contrária (posições opostas) Positivo/indiferente/negativo Relação Ontológica Partitiva Associativa Relação de Efeito Causalidade Instrumentalidade Descendência Genealógica Estágios da substância Antogênica 282 ANO AUTOR(ES) TIPOS DE RELACIONAMENTOS: TESAUROS 2004 CAMPOS; GOMES; MOTTA Relação entre conceitos Lógica Relação hierárquica Gênero/espécie Cadeia Renque Ontológica Partitiva Objeto integral / componente separável Membro / coleção (sem relação funcional) Objeto / matéria (elementos inseparáveis) Atividade / etapa (ou fase) da atividade Área ou região / lugar específico (inerente) Associativa No tempo Origem do objeto Consequência de um processo Continuidade de fenômeno No espaço Entre objetos em um dado contexto Material e produto Processo e operação Ação e resultado da ação Causa e efeito Processo e etapas de um processo Relação entre termos Equivalência Sinonímia Quase sinonímia Homonímia Metonímia Metáfora Termos sincategoremáticos Denominação (analogias) 283 ANO AUTOR(ES) TIPOS DE RELACIONAMENTOS: TESAUROS 2011 ISO 25964 Relação de equivalência Oposição Contraditório (exclusão e implicação de reciprocidade) Contrária (níveis intermediários de oposição) Conversa (oposições de inversão) Relações de parentesco Intercâmbios sociais (médico/paciente) Relações temporais Relação hierárquica Gênero-espécie Partitiva Órgãos e sistemas dos seres vivos Localizações geográficas Disciplinas e campos de discurso Estruturas sociais Instância Relação associativa Ação / Alvo ou Sujeito Passivo Ação / Produto Ação / Propriedade Artefato / Partes do Artefato Causa / Efeito Conceito ou Objeto / Contra-agente Conceito ou Objeto / Origem Conceito ou Objeto / Propriedade Conceito ou Objeto / Unidade ou Medida Disciplina ou Campo / Objeto ou Praticante Matéria-prima / Produto Frases sincategoremáticas / Conceito ou objeto Operação ou Processo / Agente ou Instrumento Organismo ou Substância / Produto Derivado Processo / Contra-agente Fonte: elaborado pela autora desta tese, com base na literatura estudada. 284 APÊNDICE B – Implantação Computacional do Modelo Adotado Para minimizar o esforço manual de inserção de informações, Soergel et al. (2004) recomendam implantar uma conversão semiautomática inteligente, usando a abordagem denominada Regras “as-you-go”. (1) Regras “as-you-go” Nesta abordagem, o software editor deve ser específico para ontologias, pois eles permitem assimilar os padrões que são recorrentes no domínio modelado. Com base nesses padrões, o software editor consegue formular regras que podem ser imediatamente aplicadas a todos os casos semelhantes subsequentes, promovendo a convergência de padrões, como exemplificado abaixo: a) no software editor foi possível, de forma automática, indentificar e determinar os seguintes relacionamentos: cow (vaca) NT cow milk (leite de vaca) NT horn (chifre) os relacionamentos foram explicitados assim: cow (temComponente) cow milk cow horn b) a partir disso, o software editor reconheceu um padrão geral: animal milk c) como consequência, o sistema pôde derivar, de forma automática, outros relacionamentos similares: goat (cabra) NT goat milk (leite de cabra) torna-se goat goat milk Observa-se que, no caso da letra (c), o sistema fez uma inferência de similaridade: “cabra” é um “animal” e “leite de cabra” é uma expressão similar a “leite de vaca”; assim, o sistema reconhece a similaridade como um tipo (ou espécie) de leite. Para automatizar ainda mais o processo, os autores sugerem a compilação de padrões de relacionamentos, a partir das características do domínio modelado. No caso do AGROVOC, os autores apresentam o exemplo: animal body part. Essa compilação de relações padrão pode ser reforçada por uma ontologia que especifica os tipos de animais (vaca, cabra, ovelha, cavalo, galinha) e os tipos de partes do corpo de animais (parte do esqueleto, fígado, osso, leite, ovos, chifre). A partir do momento em que o sistema inteligente, acoplado ao software editor de ontologias, detecta a aplicabilidade de 285 um padrão de relacionamento, ele o transforma em um padrão no software editor, acrescentando-o ao inventário de padrões. Todos os padrões de relacionamentos aprovados para uso em dado domínio podem ser utilizados como um tipo especial de restrição, auxiliando a aplicação deste modelo. É também possível formular outros tipos de restrições no software editor, de forma a limitar as opções apresentadas ao editor humano. O Quadro 15 mostra alguns exemplos de restrições baseadas em relacionamentos de tesauros. QUADRO 15 – Restrições com base em relacionamentos Relacionamentos no SOC Relacionamentos ontológicos possíveis NT / BT / / <éUm> / / entre outros RT / / / entre outros * Note-se que os relacionamentos do tipo RT frequentemente são transformados em relacionamentos não simétricos. Observe-se também, que, em um SOC bem construído, um relacionamento do tipo RT não deve se transformar em relacionamentos <éUm>. Contudo, a realidade mostra que o relacionamentodo tipo RT tem sido aplicado para expressar esse tipo de relacionamento. Essa pode ser mais uma prova da existência de fracas definições para os relacionamentos em muitos SOCs. Fonte: elaborado pela autora desta tese, traduzido de SOERGEL et al., 2004, p. 12. Como é possível perceber, os relacionamentos incluídos nos tesauros podem ser usados para a modelagem dos relacionamentos ontológicos e para criar um repositório de restrições. Esse repositório irá restringir as opções disponíveis na medida em que houver um refinamento manual nos relacionamentos do tesauro, tornando-os relacionamentos ontologicamente mais precisos. Um editor de ontologias pode atuar de maneira mais adequada nessa tarefa, pois um software desse tipo pode substituir tais restrições e, de forma concomitante, atualizar o repositório de relacionamentos. Isso acontece porque, sempre que um relacionamento é adicionado ou refinado, o relacionamento inverso é também adicionado ou refinado de forma automática. 286 (2) Possibilidade de extensão do modelo A extensão do modelo de Soergel et al. (2004) pode ser realizada a partir do uso de escopos. Os escopos podem ser definidos como uma base de conhecimento embutida no sistema e expressa em uma linguagem específica, na qual as ligações entre termos e notas, por exemplo, referem-se apenas às formas usadas por essa mesma linguagem. Dessa forma, os escopos funcionam como um tipo de restrição ou de contexto no qual se limita a abrangência de efetividade daquela linguagem específica, respeitando-se as suas especificidades. Outra maneira de extensão do modelo proposto por Soergel et al. (2004) é utilizar parte da estrutura conceitual de um tesauro, compondo o que os autores denominam de subvocabulário. Dessa forma, cada subvocabulário fornece uma visão específica da estrutura completa do tesauro do qual foram extraídos e possibilita sua utilização para um propósito particular. Segundo os autores, em sistemas on-line, tais subvocabulários podem ser criados de maneira dinâmica, de forma personalizável, ou definidos para serem visualizados por grupos específicos de usuários. Nessa perspectiva, eles também podem ser impressos ou exportados para qualquer outro ambiente computacional, auxiliando na recuperação de informações. Como exemplificação de diferentes conteúdos de um subvocabulário, os autores apontam: (a) um subconjunto selecionado para uma determinada aplicação; (b) todos os strings que são siglas ou acrônimos (para uma lista de siglas); (c) todos os nomes científicos; (d) todas as entradas que compõem uma taxonomia de entidades de seres vivos ou apenas entidades de um amplo taxon, como, por exemplo, o de “insetos”; (e) termos especializados para uma determinada comunidade. (3) Fontes externas de informação Segundo Soergel et al. (2004), existem fontes de informação externas, disponíveis no ambiente web, que podem também ser utilizadas para incrementar o repositório de termos e relacionamentos de um dado domínio. Um exemplo da área da agricultura oferecido pelos autores é o LanguaL93 (Langua aLimentaria), que é um tesauro internacional facetado e multilíngue, com escopo para descrição de alimentos. Esse tesauro foi iniciado no final de 1970, nos EUA, e, desde 1996, é administrado pelo Comitê Técnico Europeu LanguaL e tem como foco principal o consumo e a composição (nutrientes e contaminantes) dos alimentos. Nele, cada alimento é descrito por um conjunto de termos normalizados, controlados, escolhidos pela combinação de características, estruturadas em facetas hierárquicas. Nessa estrutura encontram-se informações sobre a qualidade 93 Todas as informações sobre este tesauro foram retiradas do site oficial do Comitê que gerencia o instrumento (disponível em: ). Acesso em: 21 jul. 2013. 287 nutricional e/ou higiene de um alimento, como, por exemplo, a origem biológica, os métodos de cozimento e de conservação, os tratamentos tecnológicos, entre outros. O LanguaL tem por base três pilares: (1) qualquer alimento (ou produto alimentar) pode ser descrito de maneira sistemática por uma combinação de características; (2) essas características podem ser categorizadas segundo critérios específicos ou pontos de vista e codificadas para processamento computacional; (3) os códigos resultantes dos pontos de vista/características podem ser utilizados para recuperar dados sobre alimentos a partir de bancos de dados externos. Outro exemplo que também se encontra disponível na web é o Unified Medical Language System (UMLS94). O UMLS é um conjunto de arquivos e softwares da área da saúde e biomédica e foi desenvolvido a partir de padronizações que permitem a interoperabilidade entre sistemas de computadores. Uma das mais importantes funções do UMLS é fazer a interligação de informações de saúde, termos médicos, nomes de medicamentos e códigos de faturamento entre diferentes sistemas computacionais, em situações tais como: (a) conectar os termos e códigos de um paciente com o médico, com a farmácia e com a seguradora de saúde; (b) coordenar os cuidados a um paciente entre os vários departamentos dentro de um hospital. Outras finalidades do UMLS é o aprimoramento de aplicações, tais como registros eletrônicos de prontuários médicos, ferramentas de classificação, dicionários e tradutores. O UMLS também pode ser utilizado para a recuperação de informação em motores de busca, mineração de dados, relatórios sobre estatísticas de saúde pública e pesquisa terminológica. Para operacionalizar o UMLS, existem três fontes de conhecimento: o Metathesaurus, composto por conceitos biomédicos oriundos de diversas fontes externas; o Semantic Network, composto por uma rede de 135 tipos de relações semânticas; e o SPECIALIST Lexicon, que contém informação lexical e programas para o processamento automático de linguagem. Essas fontes podem ser usadas juntas ou de forma individual, ou a partir de qualquer combinação, de acordo com as necessidades da situação e do objetivo desejado. Esse sistema pode ser instalado em um computador pessoal, mas, em alguns casos, pode exigir acordos adicionais com fornecedores individuais de terminologia. (4) Padrões e linguagens para a implantação do modelo O modelo proposto por Soergel et al. (2004) pode ser computacionalmente implantado utilizando-se linguagens e padrões compatíveis com a Web Semântica, tais 94 Todas as informações sobre o UMLS foram retiradas de seu site oficial. Disponível em: . Acesso em: 21 jul. 2013. 288 como a Resource Description Framework Schema (RDFS) ou a Extensible Markup Language (XML). Sobre o RDFS, Furgeri (2006) aponta que Com a RDFS é possível definir os termos (as triplas) que serão usados nas declarações dos documentos RDF95, [que é] uma maneira de criar um vocabulário controlado. Esse vocabulário permite estabelecer relações e restrições entre os recursos. Relações tais como: o autor pertence a uma classe chamada pessoa, um site pertence a uma classe chamada recurso, um artigo que pertence a uma classe publicações deve possuir um título, cujo conteúdo deve ser um texto, e assim por diante. São criadas regras e restrições que devem ser seguidas pelos documentos RDF (FURGERI, 2006, p. 237). Os autores acrescentam que o RDFS possui um modelo de representação simples e flexível, que utiliza conectivos lógicos, de negação, disjunção e conjunção, permitindo a interpretação semântica do conhecimento. Já a linguagem XML é utilizada para representar objetos com características complexas. Possui natureza autodescritiva, é bastante flexível, e sempre é adotada como padrão para representação de dados e troca de informações em distintas áreas do conhecimento. Usando essas linguagens e padrões, os relacionamentos podem ser armazenados em uma base de dados e ser utilizados em todos os níveis de entidades (conceitos, termos, strings e notas) propostas no modelo de Soergel (2004; 2006). Dessa forma, as características de cada entidade podem ser formalizadas, de maneira explícita, permitindo que as restrições de integridade sejam mantidas. Essa formalização pode ser facilitada quando cada entidade puder ser identificada por um Unique Resource Identifier (URI) ou qualquer outro código96 semelhante, que possa cumprir esse mesmo papel. O URI é um conjunto compacto de caracteres, que tem como principal objetivo permitir a identificação ou denominação de um recurso informacional na web, possibilitando a interação de suas representações através de protocolos específicos. O uso desses identificadores permite codificar cada entidade, evitando-se falsos relacionamentos entre eles. 95 Resource Description Framework é uma linguagem elaborada a partir da XML para codificar, trocar e reutilizar metadados na web, e tem como principal objetivo prover intercâmbio de informações entre aplicações, sem a perda do significado. 96 Dependendo da linguagem ou tecnologia utilizada, esse identificador poderá mudar: por exemplo, a linguagem Unified Medical Language System (UMLS) usa o Concept Unique Identifiers (CUI), e o Topic Map Standard usa Unique Subject Indentifiers (USI). 289 APÊNDICE C – Estrutura Semântica Inicial 1 INTENSIFICAÇÃO AGROPECUÁRIA EQ-EN AGRICULTURAL INTENSIFICATION TE AGRICULTURA EXTENSIVA TE AGRICULTURA INTENSIVA TE AGRONOMIA TE ESPAÇO E TEMPO TE INSTITUIÇÕES TE MATERIAL E MÉTODOS TE MEIO AMBIENTE TE SOCIOECONOMIA TE TERRITÓRIO E PAISAGEM 2 AGRICULTURA INTENSIVA EQ-EN INTENSIVE FARMING UP AGRICULTURA INDUSTRIAL UP EXPLORAÇÃO AGRÍCOLA INTENSIVA UP PRODUÇÃO INTENSIVA TG SISTEMA DE EXPLORAÇÃO AGRÍCOLA TE CRIAÇÃO INTENSIVA TE INTENSIFICAÇÃO RT (temObjetivoOuProcesso) UTILIZAÇÃO INTENSIVA DA TERRA 3 AGRICULTURA EXTENSIVA EQ-EN EXTENSIVE AGRICULTURE UP PRODUÇÃO EXTENSIVA TG FRONTEIRA AGRÍCOLA TG SISTEMA DE EXPLORAÇÃO AGRÍCOLA TE ATIVIDADE PASTORIL TE CRIAÇÃO EXTENSIVA TE EXTENSIFICAÇÃO TR estáIncluídoEm AGRICULTURA COM BAIXO INVESTIMENTO TR éPráticaPara GRANDE EXPLORAÇÃO AGRÍCOLA TR temComoObjetivoOuProcesso UTILIZAÇÃO EXTENSIVA DA TERRA TR inclui SISTEMA AGROPASTORIL MATERIAL E MÉTODOS 4 Cultura EQ-EN CROP UP VEGETAL PRODUCTION USE PRODUÇÃO VEGETAL UP PLANTAS CULTIVADAS UP PLANTAS ECONÔMICAS UP PLANTAS ÚTEIS TG AGRONOMIA TG OBSERVAÇÃO DE CAMPO TG PLANTAS TG PRODUÇÃO TG MATERIAL E MÉTODOS TE CÁRTAMO TE CULTURA ENERGETICA TE CULTURA PERENE TE CULTURAS ARÁVEIS TE CULTURAS AUTÓCTONES TE CULTURAS CABAÇAS TE CULTURAS CÍCLICAS TE CULTURAS CONSORCIADAS TE CULTURAS DE AÇÚCAR TE CULTURAS DE ALIMENTOS TE CULTURAS DE AMIDO TE CULTURAS DE BORRACHA TE CULTURAS DE CAMPO TE CULTURAS DE ESPECIARIAS TE CULTURAS DE FRUTAS TE CULTURAS DE GRÃOS TE CULTURAS DE INVERNO TE CULTURAS DE OLEAGINOSAS TE CULTURAS DE ÓLEOS ESSENCIAIS TE CULTURAS DE PESTICIDAS TE CULTURAS DE PORTA-ENXERTOS TE CULTURAS DE PRIMAVERA TE CULTURAS DE RAÍZES TE CULTURAS DE RENDIMENTO TE CULTURAS DE SEMENTES TE CULTURAS DE TERRAS ALTAS TE CULTURAS EM ESTUFA TE CULTURAS ESTIMULANTES TE CULTURAS ESTRUTURAIS TE CULTURAS FIBRA TE CULTURAS FORRAGEIRAS TE CULTURAS INDUSTRIAIS TE CULTURAS INTERCALARES TE CULTURAS NUT TE CULTURAS PARA ALIMENTAÇÃO ANIMAL TE CULTURAS PARA ARMADILHAS TE CULTURAS PARA BEBIDAS TE CULTURAS PARA COMBUSTÍVEIS TE CULTURAS PARA SALADA TE CULTURAS TROPICAIS TE ERVAS CULINÁRIAS TE HORTALIÇAS TE IMPLANTACAO DE CULTURA TE LAVOURA TE LAVOURAS TE PLANTAÇÕES DE ÁRVORES TE PLANTAS APÍCOLAS TE PLANTAS DE CERA TE PLANTAS DE COBERTURA TE PLANTAS DE CONTROLE DE EROSÃO TE PLANTAS DE DROGAS TE PLANTAS DE PROTECÇÃO TE PLANTAS DE RECUPERAÇÃO DE SOLO TE PLANTAS DE REVEGETAÇÃO TE PLANTAS DE SOMBRA TE PLANTAS GUM TE PLANTAS PARA RUMINANTES TE PLANTAS TAN TE PLANTAS TINTUREIRAS TE PLANTAS-MÃE TE PRODUCAO DE SEMENTES TE PROTEAGINOSAS TR CALENDARIO AGRICOLA TR MELHORAMENTO VEGETAL TR PERDA DA PRODUCAO TR PRATICA CULTURAL TR TAXA DE LOTACAO TR ébeneficiadoPor PLANTAS SELVAGENS TR ébeneficiadoPor ÁRVORES QUEBRA-VENTO TR temPrática DOMESTICAÇÃO 5 sensoriamento remoto EQ-EN REMOTE SENSING UP IMAGEM DE SATELITE TG TOPOGRAFIA TG MATERIAL E MÉTODOS TR fazUsoDe AEROFOTOGRAMETRIA 290 TR fazUsoDe AVHRR TR fazUsoDe IMAGEM LOCAL TR fazUsoDe IMAGENS TR fazUsoDe LEVANTAMENTOS AÉREOS TR fazUsoDe PROCESSAMENTO DE IMAGENS TR fazUsoDe RADAR TR fazUsoDe SENSORES REMOTOS TR fazUsoDe SATÉLITES TR fazUsoDe SATÉLITES DE OBSERVAÇÃO DA TERRA TR fazUsoDe SENSORES TR fazUsoDe SISTEMAS DE POSICIONAMENTO GLOBAL TR usaProcesso FOTOGRAMETRIA TR usaProcesso TELEMETRIA 6 sistema de informação geográfica EQ-EN GEOGRAPHICAL INFORMATION SYSTEM UP SIG TG MATERIAL E MÉTODOS TG SISTEMA DE INFORMAÇÃO TR fazUsoDe SISTEMA DE POSICIONAMENTO GLOBAL AMBIENTE 7 meio ambiente EQ-EN ENVIRONMENT UP ZONEAMENTO ECOLÓGICO UP ZONAS ECOLÓGICAS TG ENTIDADES TG AMBIENTE TE AMBIENTE AQUÁTICO TE AMBIENTE BIÓTICO TE AMBIENTE ECONÔMICO TE AMBIENTE FÍSICO TE AMBIENTE NATURAL TE AMBIENTE SOCIOCULTURAL TE AMBIENTE SOCIOECONÔMICO TE CONDICAO AMBIENTAL TE ECOSISTEMA TE RECURSOS NATURAIS TE VARIÁVEL AMBIENTAL TE ZONAS RIBEIRINHAS TR temComponente ECOSSISTEMAS TR temComponente FATORES AMBIENTAIS TR influencia AEROBIOSE TR influencia ANAEROBIOSE TR influencia AVALIAÇÃO DO IMPACTO AMBIENTAL TR influencia POLÍTICA AMBIENTAL TR influencia MICROCLIMA TR influencia AGRICULTURA SUSTENTÁVEL TR BIOSSEGURANÇA TR BIODEGRADAÇÃO TR CATASTROFE NATURAL TR EDUCACAO AMBIENTAL TR ECOLOGIA TR FOGO TR HABITAT TR INTERAÇÃO GENÉTICA TR IMPACTO AMBIENTAL TR POLUICAO AMBIENTAL TR TEMPERATURA TR VEGETAÇÃO TR ZONA URBANA TR ZONEAMENTO ECOLÓGICO 8 ambiente físico EQ-EN PHISICAL ENVIRONMENT TG MEIO AMBIENTE TG AMBIENTE TE BIOMAS TR influencia CLIMA E TEMPO TR influencia ÁGUA TR influencia SOLO TR influencia AR TR influencia PROCESSOS QUÍMICOS TR influencia SOCIOECONOMIA 9 solo EQ-EN SOIL TG COBERTURA DAS TERRAS TG AMBIENTE TG MEIO AMBIENTE TE RIZOSFERA TE SUBSOLO TE SOLO SUPERIOR TR temComponente AR DO SOLO TR temComposição MATÉRIA ORGÂNICA DO SOLO TR influencia LIXIVIADOS TR influencia PERDAS DE SOLO TR influencia RESTO DE CULTURA TR éCompostaDe MINERAIS TR éUtilizadoComo SUBSTRATO DE CULTURA TR usaProcesso MELHORAMENTO DO SOLO TR influencia manejo do solo AGRONOMIA 10 manejo da cultura NE Decisões sobre cultivo e colheita. EQ-EN CROP MANAGEMENT TG AGRONOMIA TG MANEJO TE PROGRAMAÇÃO DE IRRIGAÇÃO TE VIVEIRO DE ADUBOS TE CRIAÇÃO DE VIVEIROS TR temComponente ESCOLHA DE ESPÉCIES TR temComponente PADRÕES DE CULTIVO TR temComponente SISTEMAS DE CULTIVO TR temComponente CULTURA TR temComponente OPERAÇÃO DE PRÉ-COLHEITA TR temComponente TRATAMENTO PRÉ-COLHEITA TR inclui MÉTODOS CULTURAIS TR influencia FREQUÊNCIA DE COLHEITA TR fazUsoDe MÉTODOS DE PLANTIO TR fazUsoDe MÉTODOS DE SEMEADURA TR usandoValor CUSTO DE APLICAÇÃO TR usandoValor CALENDÁRIO DE COLHEITA TR usandoValor CUSTO DE IRRIGAÇÃO TR usandoValor PERÍODO DE PLANTIO TR usandoValor CUSTO DAS MUDAS TR usandoValor ÉPOCA DE SEMEADURA TR usandoValor PROFUNDIDADE DE SEMEADURA TR usandoValor DENSIDADES DE SEMEADURA TR usandoValor ESPAÇAMENTO ENTRE MUDAS TR usandoValor TEMPO DE REPLANTAR TR usandoValor PERÍODO DE TRATAMENTO 11 manejo do solo EQ-EN SOIL MANAGEMENT UF PREPARO DO SOLO TG PRÁTICAS DE MANEJO TG MANEJO DE RECURSOS NATURAIS 291 TG AGRONOMIA TE PERDA DE SOLO TE SOLO NU TE DRENAGEM TE CALAGEM TE CONTROLE DE SALINIDADE TE PREPARAÇÃO LOCAL TE CONSERVAÇÃO DO SOLO TE TRATAMENTO DO SOLO TR solo (recíproco) TR temObjetoDeAtividade EQUIPAMENTOS DE MANEJO DO SOLO TR temPrática TERRAPLANAGEM TR temPrática RECUPERAÇÃO TR temPrática ESCARIFICAÇÃO DO SOLO TR inclui POUSIO TR inclui MELHORIA DO SOLO TR inclui ESTERILIZAÇÃO TR influencia CULTIVO TR influencia APLICAÇÃO DE FERTILIZANTES TR influencia AQUECIMENTO DO SOLO TR influencia MANEJO DA ÁGUA TR fazUsoDe MÉTODOS ALTERNATIVOS TR fazUsoDe TERRAÇOS 12 pousio EQ-EN FALLOW UF CULTIVO POUSIO TG AGRONOMIA TG SISTEMA DE CULTIVO TG TERRA AGRÍCOLA TE PERÍODO DE POUSIO TE POUSIO INCULTO TE POUSIO VERDE RT influencia SISTEMA DE POUSIO RT estáIncluídoEm PREPARAÇÃO DO SOLO 13 período de pousio EQ-EN FALLOW PERIOD TG AGRONOMIA TG POUSIO TE POUSIO NU TE POUSIO LONGO TE POUSIO CURTO 14 pesticidas EQ-EM PESTICIDES TG AGRONOMIA TG SUBSTÂNCIAS TE ACARICIDAS TE AVICIDAS TE OS BIOPESTICIDAS TE FUNGICIDAS TE HERBICIDAS TE INSETICIDAS TE MOLUSCICIDAS TE NEMATICIDAS TE SINÉRGICOS DE PESTICIDAS TE RODENTICIDAS TE PESTICIDAS DE LIBERAÇÃO LENTA TR causa POLUIÇÃO TR seTransformaEm RESÍDUOS DE PESTICIDAS TR temComponente ADJUVANTES TR temComponente REPELENTES TR temComposição BÓRAX TR temComposição PRODUTOS QUÍMICOS TR temCaracterística INGESTÃO DIÁRIA ACEITÁVEL TR temCaracterística MODO DE AÇÃO TR temCaracterística PROPRIEDADES PESTICIDAS TR temCaracterística RESISTÊNCIA A PESTICIDAS TR temCaracterística ESTRUTURA RELAÇÃO DE ATIVIDADE TR temCaracterística AÇÃO SISTÊMICA TR éFeitaAPartirDe SUBSTÂNCIAS TÓXICAS TR éUtilizadoComo CONSERVANTES DE MADEIRA TR usaProcesso APLICAÇÃO FOLIAR TR usaProcesso TRATAMENTO DE SEMENTES 15 ciclo da cultura EQ-EN PLANT DEVELOPMENTAL STAGES UP CICLO DA PLANTA TG AGRONOMIA TG ESTÁGIOS DE DESENVOLVIMENTO TE APICAIS E AXILARES TE BROTAMENTO TE DIVISÃO CELULAR TE DORMÊNCIA TE ENCHIMENTO DE GRÃOS TE ENRAIZAMENTO TE EXPANSÃO CELULAR TE FERTILIZAÇÃO TE FLORAÇÃO TE FORMAÇÃO DE GEMAS ADVENTÍCIAS TE FORMAÇÃO DE RAÍZES TE FRUTIFICAÇÃO TE GERMINAÇÃO TE MORTE TE POLINIZAÇÃO TE RAMIFICAÇÃO TE SENESCÊNCIA TE TRANSIÇÃO DE MERISTEMAS TR influencia PERÍODO DE TRATAMENTO 16 cultura anual EQ-EN ANNUAL PLANT UP PLANTAS ANUAIS TG AGRONOMIA TG SISTEMA DE CULTIVO TG PLANTAS TE ERVAS DANINHAS ANUAIS TE ANUÁRIOS JARDIM TE PLANTAS ANUAIS ORNAMENTAIS TE CONCEITOS RELACIONADOS TR outrasRelações PORTE DA PLANTA TR temComponente PLANTAS HERBÁCEAS 17 pecuária EQ-EN LIVESTOCK UP ESTOQUE DE ANIMAIS UP ANIMAIS DE FAZENDA TG ANIMAIS DOMÉSTICOS TG PRODUCAO ANIMAL TG AGRONOMIA TE ANTÍLOPES-TIBETANOS TE BISONTE-INDIANO TE BÚFALOS DOMÉSTICOS TE BURROS TE CABRAS TE CAMELOS TE GADO TE OVELHA TE SUÍNO 292 TE ZEBU TR inclui REBANHOS TR inclui CAVALOS TR inclui RAÇAS DE GADO TR inclui ANIMAIS DE CARNE TR inclui ANIMAIS LEITEIROS TR inclui ANIMAIS DE TRABALHO TR INDUSTRIA PECUARIA TR PESQUISA PECUARIA 18 adubo verde EQ-EN GREEN MANURES TG ADUBO TG AGRONOMIA TG FERTILIZANTES ORGÂNICOS TR fazUsoDe VIGNA VEXILLATA TR GLIRICIDIA TR ADUBACAO VERDE 19 produtos agropecuários EQ-EN AGRICULTURAL PRODUCTS UP COMMODITIES AGRÍCOLAS UP MERCADORIAS UP PRODUTOS DA AGRICULTURA UP PRODUTO AGRICOLA TG AGRONOMIA TG PRODUTOS TE BIOPRODUTOS TE PRODUTOS FORA DA ÉPOCA TE PRODUTOS PERECÍVEIS TE PRODUTO DE ORIGEM ANIMAL TE PRODUTO DE ORIGEM VEGETAL TR temComponente PRODUTOS ANIMAIS TR temComponente SUBPRODUTOS TR temComponente PRODUTOS DE CELULOSE TR temComponente PRODUTOS DA PESCA TR temComponente PRODUTOS FLORESTAIS TR temComponente PRODUTOS FRESCOS TR temComponente PRODUTOS VEGETAIS TR temComponente PRODUTOS PROCESSADOS TR temComponente PRODUTOS ARMAZENADOS 20 biomassa EQ-EN BIOMASS UP FITOMASSA TG AGRONOMIA TG SUBSTÂNCIAS TE BIOMASSA AÉREA TR inclui MATÉRIA ORGÂNICA TR influencia BIOENERGIA TR influencia PRODUTIVIDADE PRIMÁRIA TR influencia ÍNDICE DE VEGETAÇÃO TERRITÓRIO E PAISAGEM 21 posse da terra EQ-EN LAND TENURE UP SISTEMA FUNDIÁRIO TG TERRITÓRIO E PAISAGEM TG POSSE TG PROPRIEDADE RURAL TE LATIFUNDIO TE MINIFUNDIO TE PARCERIA TR influencia USUCAPIÃO TR éInfluenciadoPor ARRENDAMENTO TR éInfluenciadoPor POSSEIRO TR éInfluenciadoPor DESAPROPRIAÇAO TR éInfluenciadoPor REFORMA AGRARIA TR estáIncluídoEm RENDA DA TERRA 22 escassez de terra EQ-EN LAND SCARCITY TG TERRITÓRIO E PAISAGEM TR influencia SEGURANÇA ALIMENTAR TR influencia CULTURAS DE ALIMENTOS 23 cobertura das terras EQ-EN LAND COVER TG CARACTERÍSTICAS FISIOGRÁFICAS TG TERRITÓRIO E PAISAGEM TE SOLO TE ÁGUA DE SUPERFÍCIE TE RELVADO TE VEGETAÇÃO TR temObjetoDeAtividade TERRA TR influencia PAISAGEM TR influencia USO DA TERRA 24 mudança de cobertura das terras EQ-EN LAND COVER CHANGE TG FENÔMENO NATURAL TG TERRITÓRIO E PAISAGEM SOCIOECONOMIA 25 densidade demográfica EQ-EN POPULATION DENSITY UP DENSIDADE POPULACIONAL TG POPULAÇÃO HUMANA TG MEDIÇÃO TG SOCIOECONOMIA TE SUPERPOPULAÇÃO TR influencia CAPACIDADE DE TRANSPORTE TR influencia PRESSÃO DEMOGRÁFICA 26 crescimento populacional EQ-EN POPULATION GROWTH UP EVOLUÇÃO DA POPULAÇÃO UP AUMENTO DA POPULAÇÃO TG DINÂMICA POPULACIONAL TG POPULAÇÃO HUMANA TG SOCIOECONOMIA TE EMIGRACAO TE MIGRACAO RURAL TE MIGRACAO RURAL URBANA TE PESSOA TR influencia PRESSÃO POPULACIONAL TR TAXA DE NATALIDADE 27 pressão populacional EQ-EM POPULATION PRESSURE UP PRESSÃO DEMOGRÁFICA TG SOCIECONOMIA TG ESTADO E CONDIÇÃO TR influencia DINÂMICA POPULACIONAL ESPAÇO E TEMPO 28 mudanças agrícolas EQ-EN AGRICULTURAL DEVELOPMENT UP DESENVOLVIMENTO AGRICOLA TG DESENVOLVIMENTO ECONÔMICO TG ESPAÇO E TEMPO TE DESENVOLVIMENTO DA PESCA TE DESENVOLVIMENTO FLORESTAL TE REVOLUÇÃO VERDE 293 TE MECANIZACAO TR influencia FOMENTO AGRICOLA TR influencia POLITICA DE DESENVOLVIMENTO 29 análise de séries temporais EQ-EN TIME SERIES ANALYSIS UP SÉRIE TEMPORAL TG ESPAÇO E TEMPO TG MÉTODOS ESTATÍSTICOS TG DADOS ESTATÍSTICOS INSTITUIÇÕES 30 Embrapa EQ-EN EMBRAPA UP Empresa Brasileira de Pesquisa Agropecuária TG INSTITUIÇÕES TG INSTITUIÇÕES DE PESQUISA TE UNIDADES CENTRAIS TE UNIDADES DESCENTRALIZADAS TE LABORATÓRIOS VIRTUAIS TE ESCRITÓRIOS INTERNACIONAIS TR influencia POLITICA DE DESENVOLVIMENTO TR influencia PESQUISA AGROPECUÁRIA TR temObjetoDeAtividade PESQUISA 294 APÊNDICE D – Lista de Tesauros e Fontes da Agricultura (1) BASE DE DADOS, DICIONÁRIOS E GLOSSÁRIOS AGROBASE Base referencial sobre literatura agropecuária no Brasil, incluindo, principalmente documentos como monografias, relatórios, documentos de congressos, teses, publicações seriadas e artigos de periódicos. Cobre assuntos na área de Ciências Agrárias e afins, tais como: produção animal e vegetal; defesa animal e vegetal; nutrição humana, animal e vegetal; pesca; solo; floresta; engenharia agrícola; poluição; economia e estatística agrícola. A Biblioteca Nacional de Agricultura (BINAGRI), órgão da Secretaria-Executiva do Ministério da Agricultura, Pecuária e Abastecimento (SE/MAPA), é a responsável pelo desenvolvimento e gerenciamento dessa ferramenta. BASE DE DADOS DA PESQUISA AGROPECUÁRIA – BDPA (EMBRAPA) A BDPA é uma base de dados gerenciada pela EMBRAPA que reúne os documentos que compõem o acervo das bibliotecas da EMBRAPA, abrangendo a literatura gerada e a literatura adquirida: livros, folhetos, teses, trabalhos apresentados em eventos técnico-científicos, documentos digitais, mapas, o Catálogo Coletivo de Periódicos da EMBRAPA com 7. 440 títulos e suas respectivas coleções e base de instituições do Sistema Nacional de Pesquisa Agropecuária, com endereços, serviços prestados e áreas de atuação de 177 instituições, reunidos em um CD-ROM. Contém ainda todo o acervo bibliográfico das 40 bibliotecas da empresa espalhadas pelo Brasil, além de toda produção de teses e papers científicos de autoria de seus 2.000 cientistas. O acervo está disponível na Rede Antares e no site da EMBRAPA, no endereço: www.cnptia.embrapa.br./bdpa. DICIONÁRIO AGRÍCOLA CERES – AGRONOMIA SÉCULO XXI Dicionário organizado por José Peres Romero, publicado em 2006 pela Editora Agronômica Ceres, após 52 anos de seu início. Inclui informações sobre vegetais, animais, minerais e tecnologias geradas pela pesquisa agronômica e comprovadas na prática da extensão agrícola. GLOSSÁRIO DE TERMOS USADOS EM ATIVIDADES AGROPECUÁRIAS, FLORESTAIS E CIÊNCIAS AMBIENTAIS Glossário compilado por José Geraldo Pacheco Ormond e publicado pelo BNDES em 2006. Reúne proximadamente 3.000l conceitos e explicações de verbetes, termos e expressões, inclusive alguns em língua estrangeira já incorporados ao vocabulário brasileiro de agricultura. GLOSSÁRIO DE TERMOS USADOS NA AGRICULTURA Glossário preparado por Schütz e Kanomata, em 2014, é um dicionário bilíngue português/inglês e inglês/português para a tradução de termos da área da agricultura. Disponível em: . GLOSSÁRIO ILUSTRADO DE MORFOLOGIA Glossário organizado por Doris Groth, com o apoio do Ministério da Agricultura, Pecuária e Abastecimento e da Secretaria de Defesa Agropecuária. O objetivo da elaboração do glossário foi suprir o analista de laboratório com informações sobre definições de termos utilizados na morfologia das espécies botânicas (plantas, frutos, sementes e plântulas). (2) TAXONOMIA TAXONOMIA DA INTENSIFICAÇÃO AGROPECUÁRIA Taxonomia desenvolvida na EMBRAPA, dentro do projeto denominado INTAGRO, com o objetivo de atualização terminológica sobre as atividades de Intensificação Agropecuária. Possui 639 conceitos da área. 295 (3) TESAUROS ACDC THESAURUS / AGCOM THESAURUS Tesauro da Universidade de Illinois, desenvolvido para indexação de documentos de sua biblioteca digital, na área da agricultura, com cerca de 1.300 descritores e sua última atualização ocorreu em 2007. Disponível em: . AGRIFOREST Tesauro multilíngue (finlandês e inglês) da Universidade de Helsinki, na Finlândia, com escopo em agricultura, alimentação e ciências ambientais, com cerca de 7.000 descritores. Agregado ao AGROVOC. AGROVOC THESAURUS Tesauro estruturado multilíngue que abarca todos os campos temáticos da agricultura, silvicultura, pesca e seguridade alimentária. IAMM TESAURO Microtesauro francês do Instituto Mediterrâneo de Montpellier, para armazenamento e recuperação de informação na base de dados do IAMM. Seus descritores são provenientes do AGROVOC. TESAURO DEL MEDIO AMBIENTE PARA AMÉRICA LATINA Y EL CARIBE Tesauro sobre o meio ambiente, elaborado pelas Nações Unidas e composto de duas partes: (1) cinco módulos: meio ambiente físico, meio ambiente construído, impacto ambiental, capacidade de resposta e ciências e disciplinas; e (2) lista de descritores em ordem alfabética, juntamente com a estrutura das relações semânticas. TESAURO AGRÍCOLA PARA USO ALTERNATIVO DE ANIMAIS Microtesauro, em inglês, com 354 descritores. Agregado ao NAL. TESAURO DA BIOCOMPLEXIDADE Fusão de microtesauros, em inglês, sobre ciências naturais e disciplinas afins. TESAURO DE BIOLOGIA ANIMAL Elaborado por Jesús Rey Rocha, para a base de dados do Centro de Informação e Documentação Científica (CINDOC), em idioma espanhol, com cerca de 4.000 descritores. TESAURO DE ENGENHARIA SANITÁRIA E AMBIENTAL / TESAURO DE AGRICULTURA URBANA Tesauro de Engenharia Sanitária e Ambiental, que compila cerca de 5.000 descritores, que foi revisado e atualizado tendo como referência principal a base de dados bibliográficos da Rede Pan- americana de Informação sobre Saúde Ambiental (REPIDISCA) e as diferentes fontes de informação da Biblioteca Virtual de Saúde Ambiental (BVSA). A terminologia técnica e especialmente os termos propostos pelos Centros Cooperantes da REPIDISCA foram levados em conta para incluir os descritores novos. TESAURO DE GEOLOGIA Desenvolvido pela universidade de Madri, pelo antigo CINDOC, criado por Gloria L. Blanco, com cerca de 2.100 descritores. TESAURO DE MEIO AMBIENTE E PATRIMÔNIO Tesauro desenvolvido pelo Governo Australiano, com cerca de 330 descritores sobre meio ambiente, águas, patrimônio e artes. TESAURO DE PARASITOLOGIA Desenvolvido pela Universidade de Ohio, EUA, com cerca de 1.100 descritores, criado por Jolene M. Miller. (Dispnível em: ). TESAURO SOBRE ECOLOGIA Desenvolvido pelo Governo da Flórida, com cerca de 4.500 descritores, abarcando temas sobre ecologia. 296 TESAURO IGME Desenvolvido na Espanha, com cerca de 15.000 descritores, agrupados em 41 áreas temáticas, em mineração, geografia, física, química, geologia e adafologia. TESAURO IRANDOC Tesauro do Instituto para Informação Científica e Documentação, em inglês e iraniano, englobando temas sobre a agricultura, biologia, química, engenharia, ciências da terra, física, promoção da saúde, sociologia e gestão de crises. TESAURO NACIONAL AGRICULTURAL LIBRARY (NAL) Tesauro da Biblioteca Nacional de Agricultura do EUA, para indexação e recuperação de informações, sendo um macrotesauro da área de Agricultura. TESAURO THESBIO Tesauro estruturado por disciplinas e conceitos correlatos às ciências da vida, especializado em biodiversidade brasileira, com mais de 5.000 termos. THESAGRO THESAURUS Único tesauro brasileiro especializado em literatura agrícola utilizado para a indexação e recuperação de documentos, criado segundo diretrizes da United Nations Information System – UNISIT. Desenvolvido pela Biblioteca Nacional de Agricultura (BINAGRI), órgão da Secretaria de Executiva do Ministério da Agricultura, Pecuária e Abastecimento, contendo 9.351 termos. 297 APÊNDICE E – Definições das Relações do Domínio da Agricultura DEFINIÇÕES DOS OBJETOS: RELACIONAMENTOS (1) atua sobre (AGENTIVO) Definição: X Y. X é um agente que exerce uma ação sobre Y. Por exemplo: gravidade matéria; gene operador gene repressor; citoesqueleto contração muscular. Nota: ver também os relacionamentos <é afetado por> e <é influenciado por ou depende de>. Explicação da diferenciação entre atuar, afetar e influenciar: (a) atuar: opera uma ação de X sobre Y, sendo que X participa do resultado em Y; (b) afetar: X causa uma mudança de estado ou de localização de Y; (c) influenciar: X influencia Y de tal maneira que induz Y a alterar sua condição ou funcionamento, podendo Y ser dependente de X como provocador de tal alteração. tem suprapropriedade: relação causal é inversa de: sofre atuação de tem equivalente em EN: acts upon (2) afeta (AGENTIVO) Definição: X Y. X é um agente que afeta Y de tal forma que Y muda de estado ou localização. Por exemplo: esterilização bactérias; controle de pragas praga; poluição da agricultura agricultura. Nota: ver também os relacionamentos <é afetado por> e <é influenciado por ou depende de>. Explicação da diferenciação entre atuar, afetar e influenciar: (a) atuar: opera uma ação de X sobre Y, sendo que X participa do resultado em Y; (b) afetar: X causa uma mudança de estado ou de localização de Y; (c) influenciar: X influencia Y de tal maneira que induz Y a alterar sua condição ou funcionamento, podendo Y ser dependente de X como provocador de tal alteração. tem suprapropriedade: relação causal é inversa de: é afetado por tem equivalente em EN: affects (3) aflige (AGENTIVO) Definição: X Y. X é uma doença que pode ter efeito adverso na saúde de um organismo Y. Exemplo: BSE vacas. Nota: BSE = doença da vaca louca. tem suprapropriedade: relação de efeito é inversa de: é afligido por tem equivalente em EN: afflicts (4) tem benefício de (AGENTIVO) Definição: Y X. Y recebe um resultado vantajoso, conseguido a partir do comportamento do agente X. Y pode ser uma consequência, atingida a partir de X. Por exemplo: controle biológico controle biológico artrópode; fitosanidade controle de pragas; tem suprapropriedade: relação causal é inversa de: é benéfico para tem equivalente em EN: benefits from (5) relacionamento de causalidade (AGENTIVO) Definição: X . X é cada uma das relações usadas para indicar uma causa ou o efeito de alguma coisa. Nota: é a expressão de um agente causando ou forçando um paciente no sentido de realizar uma ação (ou ficar em determinada condição ou situação), funcionando como um agente ou causa. Considera-se causa a ação ou omissão sem a qual o resultado não teria ocorrido. O nexo causal é o vínculo existente entre a conduta do agente e o resultado por ela produzido. Para verificar se existe causalidade é preciso determinar quais condutas, positivas ou negativas, deram causa ao resultado observado. Para afirmar que algo causou determinado fato, é necessário estabelecer a ligação entre a conduta e o resultado gerado; verificar se a ação ou omissão do agente causou o resultado no paciente. tem característica: simétrica tem suprapropriedade: relacional tem subpropriedades: atua, afeta, tem benefício de, causa, controla, tem processo de propagação, tem um tipo relacionado, tem agente de controle biológico, tem método de criação, tem método de controle, tem sistema de cultivo, tem processo de cultivo, tem a doença, tem distúrbio, tem parte infectada, tem inimigo natural, tem objeto de atividade, tem agente patogênico, tem praga, tem função fisiológica, tem prática, tem produto, tem propriedade, tem tema, é praga de, é um tipo relacionado, sofre atuação der, é afetado, é benéfico para, é agente de controle biológico de, é método de criação de, é causada por, é método de controle, é controlado pelo sistema , está surgindo de , é processo de cultivo de , é a doença para , é distúrbio de, é parte infectada do, é inimigo natural de, é objeto de atividade, é agente patogênico de, é realizado por, é função fisiológica de, é prática para, é impedida por, é produzido por, é processo de propagação de, é propriedade de, é tema de, executa, previne, produz, produto de. é inversa de: relação causal / relação causal tem equivalente em EN: causative relationship (6) causa (AGENTIVO) Definição: X Y. X é um agente (animado ou inanimado) causa um efeito ou resultado Y. Por exemplo: prião BSE; água erosão na rocha. tem suprapropriedade: relação causal é inversa de: é causada por tem equivalente em EN: causes (7) classe inclui ordem (FORMAL) Definição: X Y. Y é uma ordem, parte de um sistema taxonômico, no qual pertence à classe X. Por exemplo, para a girafa: mamíferos Artiodáctilos, Ungulados. tem suprapropriedade: relação taxonômica é inversa de: ordem tem classe tem equivalente em EN: class includes order (8) compõe (CONSTITUTIVO) Definição: Y X. Y é um composto de X, onde Y consiste no material ou substância de que X é feito. Nota: essa relação também inclui as relações e . Por exemplo: gás sanguíneo, lipídio sanguíneo, proteína sanguínea, glóbulos sanguíneos sangue; água, fermento cerveja. 298 tem suprapropriedade: é parte de é inversa de: é composto de tem equivalente em EN: compose (9) controla (AGENTIVO) Definição: X Y. X é um agente usado como mecanismo para controle de um paciente Y, sendo que X exerce poder sobre Y, com o objetivo de obter um resultado desejado. Por exemplo: Coordenação de Produtos Veterinários qualidade dos produtos veterinários; Plano Nacional de Controle de Resíduos e Contaminantes cadeias produtivas de alimentos (animal e vegetal); certificação qualidade dos produtos orgânicos. tem suprapropriedade: relação causal é inversa de: é controlado por tem equivalente em EN: controls (10) desenvolve a partir de (CONSTITUTIVO) Definição: Y X. A partir de X é possível que Y cresça e se amplie, ocasionando um aumento ou evolução na sua capacidade, fazendo-o prosperar, progredir ou criar outro elemento qualquer. Por exemplo: batata tubérculo-semente, tuberização, desenvolvimento vegetativo, raiz, rizomas, caules, folhas, flores e frutos; cirigueleira antese (abertura dos botões), formação da polpa e maturação. tem característica: transitiva tem suprapropriedade: relações temporais é inversa de: se desenvolve em também é definida como: propriedade de anotação tem equivalente em EN: develops from (11) se desenvolve em (CONSTITUTIVO) Definição: X Y. A partir de X é possível que Y cresça e se amplie, ocasionando um aumento ou evolução na sua capacidade, fazendo-o prosperar, progredir ou criar outro elemento qualquer. Por exemplo: tubérculo-semente, tuberização, desenvolvimento vegetativo, raiz, rizomas, caules, folhas, flores e frutos, colheita batata; antese (abertura dos botões), formação da polpa e maturação cirigueleira. tem característica: transitiva tem suprapropriedade: relação temporal é inversa de: desenvolve a partir de tem equivalente em EN: develops into (12) família tem ordem (FORMAL) Definição: X Y. Y é uma ordem, parte de um sistema taxonômico, no qual inclui a família X. Por exemplo, para a girafa: girafídeos Artiodáctilos, Ungulados. tem suprapropriedade: relação taxonômica é inversa de: ordem inclui família tem equivalente em EN: family has order (13) família inclui gênero (FORMAL) Definição: X Y. X é uma família, parte de um sistema taxonômico, no qual inclui o gênero Y. Por exemplo, para a girafa: girafídeos Giraffa. tem suprapropriedade: relação taxonômica é inversa de: gênero tem família tem equivalente em EN: family includes genus (14) sucede (FORMAL) Definição: X Y. X é um elemento sucessor de Y, assumindo, por direito de sucessão, nomeação, substituição ou eleição, as funções antes ocupadas por algo ou alguém. Nota: pode também indicar um termo que vem depois, que acontece sucessivamente (uma coisa em relação a outra), vindo posteriormente. Por exemplo: Departamento Nacional de Produção Mineral Serviço Geológico e Mineralógico. tem suprapropriedade: relação temporal é inversa de: precede também definido como: propriedade de anotação; propriedade de dados tem equivalente em EN: follows (15) anteriormente incluído em (CONSTITUTIVO) Definição: Y X. Y é algo (animado ou inanimado) que anteriormente estava incluído em X. Ou seja, uma situação que acontecia no passado, que agora não mais acontece ou foi descartada. Por exemplo: uso intensivo da força humana e animal cultivo agropecuário. tem suprapropriedade: incluído em é inversa de: incluía anteriormente tem equivalente em EN: formerly included in (16) incluía anteriormente (CONSTITUTIVO) Definição: X Y. X. Y é algo (animado ou inanimado) que anteriormente estava incluído em X. Ou seja, uma situação que acontecia no passado, que agora não mais acontece ou foi descartada. Por exemplo: cultivo agropecuário uso intensivo da força humana e animal. tem suprapropriedade: inclui é inversa de: anteriormente incluído em tem equivalente em EN: formerly includes (17) gênero tem família (FORMAL) Definição: Y X. X é uma família, parte de um sistema taxonômico, no qual inclui o gênero Y. Por exemplo, para a girafa: Giraffa girafídeos. tem suprapropriedade: relação taxonômica é inversa de: família inclui gênero tem equivalente em EN: genus has family (18) gênero inclui espécie (FORMAL) Definição: X Y. X é um gênero, parte de um sistema taxonômico, no qual inclui a espécie Y. Por exemplo: Ctenocephalides Ctenocephalides canis (pulga). tem suprapropriedade: relação taxonômica é inversa de: espécie tem gênero 299 tem equivalente em EN: genus includes species (19) grande grupo tem subordem (FORMAL) Definição: X Y. X é um grande grupo que está incluído na subordem Y. Por exemplo, para solo: eutrófico vermelho 2,5 YR ou 10R. tem suprapropriedade: relação taxonômica é inversa de: subordem inclui grande grupo tem equivalente em EN: great group has sub order (20) grande grupo inclui subgrupo (FORMAL) Definição: X Y. X representa um grande grupo que inclui o subgrupo Y. Por exemplo, para solo: eutrófico típico intermediário. tem suprapropriedade: relação taxonômica é inversa de: subgrupo tem grupo grande tem equivalente em EN: great group includes sub group (21) maior que (CONSTITUTIVO) Definição: X Y. X e Y estabelecem uma relação que expressa uma ordem quantitativa. Por exemplo: PIB Mato Grosso do Sul (2010) PIB Roraimaí (2010); PIB Piauí (2010) PIB Roraima (2010). tem suprapropriedade: relação quantitativa é inversa de: menor que tem equivalente em EN: greater than (22) cresce em (CONSTITUTIVA) Definição: X Y. Um táxon X cresce em um ambiente Y. Usar essa relação para indicar uma planta e seu domínio conexo (complementar). Por exemplo: arroz de jasmim região tailandesa; arroz solo úmido. tem suprapropriedade: relacional é inversa de: é ambiente de crescimento para tem equivalente em EN: grows in (23) tem tipo relacionado (FORMAL) Definição: X Y. Y tem tipologia relacionada com X, mas X não é um hiperônimo do hipônimo Y, ainda que X e Y mantenham algum tipo de relação não explicitamente especificada. tem suprapropriedade: relação causal é inversa de: é tipo relacionado a tem equivalente em EN: has a related type (24) tem abreviatura (FORMAL) Definição: Y X. X indica que um termo fez uso de letras, símbolos ou sinais como recurso convencional para representar, de forma reduzida, Y. Por exemplo: Engenheiro-Agrônomo Eng.-Agr.; voláteis orgânicos VO. tem suprapropriedade: relação de significação tem subpropriedade: tem acrônimo é inversa de: é abreviatura de também definido como: propriedade de anotação tem equivalente em EN: has abbreviation (25) tem acrônimo (FORMAL) Definição: Y X. X é o conjunto de uma ou mais letras iniciais de uma expressão, com mais de uma palavra, que foram utilizadas para compor uma nova palavra X, formando uma neologia. Por exemplo: Conselho Federal de Engenharia, Arquitetura e Agronomia CONFEA. tem suprapropriedade: tem abreviatura é inversa de: é acrônimo de tem equivalente em EN: has acronym (26) tem antônimo ou tem oposto (FORMAL) Definição: Y X. X indica relação de significado contrário, inverso ou oposto ao de Y, ou nega- lhe o significado. tem característica: simétrica tem suprapropriedade: relacional é inversa de: tem antônimo ou tem oposto / tem antônimo ou tem oposto tem equivalente em EN: has antonym or has opposite (27) tem agente de controle biológico (AGENTIVO) Definição: Y X. X é um agente que biologicamente controla os inimigos de Y. Y pode ser qualquer espécie de planta ou animal. Por exemplo: Cigarrinha da folha da cana-de-açúcar Fungo Metarhizium anisopliae; Broca dos citrus Fungo Metarhizium anisopliae. tem suprapropriedade: relação causal é inversa de: é agente de controle biológico de tem equivalente em EN: has biological control agent (28) tem método de reprodução (AGENTIVO) Definição: Y X. X é um método de reprodução para Y. Y é um ser vivo, animal ou vegetal, que pode dar origem a novos indivíduos de sua espécie. Por exemplo: musgo fecundação; planta germinação; Folha da Fortuna assexuado; esponjas assexuado; células da pele mitose. tem suprapropriedade: relação causal é inversa de: é método de reprodução de tem equivalente em EN: has breeding method (29) tem sinônimo mais amplo (FORMAL) Definição: X Y. X tem um sentido mais específico do que o sentido mais amplo de Y. Por exemplo: cadeira mobília. tem característica: simétrica tem suprapropriedade: tem sinônimo é inversa de: tem sinônimo mais específico também definido como: propriedade de anotação; propriedade de dados 300 tem equivalente em EN: has broader synonym (30) tem fórmula química (FORMAL) Definição: Y X. X é uma representação (letras, números e símbolos) de um composto químico Y, que pode indicar uma fórmula molecular, geométrica, eletrônica ou estrutural. Por exemplo: água H2O; ácido clorídrico HCl; cloreto de sódio NaCl; amônia NH3. tem suprapropriedade: relação de significação é inversa de: é fórmula química de tem equivalente em EN: has chemical formula (31) tem componente (CONSTITUTIVA) Definição: Y X. X é parte de um todo Y, sendo que X também tem existência independente de Y. Por exemplo: motor carburador; árvore folha; célula cromossomo. Nota: não usar para situações do tipo: sangue células sanguíneas, pois estas não existem independentes do sangue (nesse caso, verificar o uso da relação <é composto de>). tem suprapropriedade: tem parte de é inversa de: é componente de tem equivalente em EN: has component (32) tem composição (CONSTITUTIVA) Definição: Y X. X é parte de um todo Y, ou X decompõe Y de alguma maneira, seja no seu aspecto ou em sua forma, sendo que X não está inerentemente misturado em Y. Por exemplo: solo matéria orgânica, minerais. tem suprapropriedade: relacional é inversa de: é composição de tem equivalente em EN: has composition (33) tem método de controle (AGENTIVO) Definição: Y X. X é um método que controla Y, sendo que X emprega domínio, de alguma maneira (processo, uma medição, um controle biológico, econômico, etc.), sobre Y. Por exemplo: controle de pragas controle biológico de pragas; controle de raiva nos herbívoros vacinação dos herbívoros. tem suprapropriedade: relação causal é inversa de: é método de controle de tem equivalente em EN: has control method (34) tem sistema de cultivo (AGENTIVO) Definição: Y X. X é um sistema usado para cultivar Y. Por exemplo: hortaliça hidroponia; arroz pré-germinado. tem suprapropriedade: relação causal é inversa de: é sistema de cultivo de tem equivalente em EN: has cropping system (35) tem processo de cultivo (AGENTIVO) Definição: Y X. X é um processo usado no cultivo de Y. Por exemplo: decomposição natural da matéria orgânica de origem animal ou vegetal compostagem; rosa adubação. tem suprapropriedade: relação causal é inversa de: é processo de cultivo de tem equivalente em EN: has cultivation process (36) tem doença (AGENTIVO) Definição: Y X. X é uma doença que acomete Y, total ou parcialmente. Por exemplo: tomateiro cancro-bacteriano; tomateiro mancha-de-estenfílio; feijão podridão do colo. tem suprapropriedade: relação causal é inversa de: é doença de também definida como: propriedade de anotação tem equivalente em EN: has disease (37) tem distúrbio (AGENTIVO) Definição: Y X. X é um distúrbio que ataca Y, sendo que X é um problema, disfunção ou anomalia que pode advir de diferentes fatores (climáticos, etc.). Por exemplo: soja retenção foliar; soja abortamento de flores; cafeeiro descoloração pelo frio; cafeeiro escaldura pelo calor; cafeeiro canela de geada. tem suprapropriedade: relação causal é inversa de: é distúrbio de tem equivalente em EN: has disorder (38) tem objetivo ou processo (TÉLICO) Definição: X Y. Y é um objetivo ou processo utilizado por X. Por exemplo: Revolução Verde modernização agrícola; cultivo microbiótico fermentação. tem suprapropriedade: relacional tem subpropriedade: é processo para é inversa de: é alcançado por meio de tem equivalente em EN: has goal or process (39) hospeda ou é vetor de (AGENTIVO) Definição: X Y. X é um organismo que abriga ou transmite Y para outro organismo. Por exemplo: mosquito do gênero Culex Wuchereria bancrofti; mosquito Aedes aegypti dengue. tem suprapropriedade: relacional é inversa de: tem vetor ou é hospedado em tem equivalente em EN: has host or Is vector for (40) tem parte infectada (AGENTIVO) Definição: Y X. X é a parte infectada de Y. Por exemplo: soja folhas; lavoura semente; arroz panícula. tem suprapropriedade: relação causal 301 é inversa de: é parte infectada de tem equivalente em EN: has infection part (41) tem nome local (FORMAL) Definição: X Y. Y é uma variação ou variante local ou regional de X. Por exemplo: andiroba andiroba-vermelha; Manihot esculenta Crantz aipim. tem suprapropriedade: tem sinônimo é inversa de: é nome local de tem equivalente em EN: has local name (42) tem membro (CONSTITUTIVO) Definição: Y X. X é um membro ou um elemento que faz parte de Y, sendo que Y é uma entidade coletiva ou individual, social ou política. Por exemplo: rebanho vaca; África francófona Argélia, Benin, Burkina Faso, entre outros. tem suprapropriedade: relacional é inversa de: é membro de tem equivalente em EN: has member (43) tem sinônimo específico (FORMAL) Definição: Y X. X tem um sentido mais específico do que o sentido de Y, que é mais amplo. Por exemplo: mobília cadeira. tem suprapropriedade: tem sinônimo é inversa de: tem sinônimo mais amplo também definido como: propriedade de anotação; propriedade de dados tem equivalente em EN: has narrower synonym (44) tem inimigo natural (AGENTIVO) Definição: X Y. Y é um inimigo natural (predador, parasita, etc.) de X, sendo que Y pode ser utilizado como controlador de pragas ou doenças. Por exemplo: pulgões, moscas-brancas, lagartas pequenas tesourinha; pulgões, cochonilhas, ácaros, moscas-brancas joaninha; diversos insetos aranha. tem suprapropriedade: relação causal é inversa de: é inimigo natural de tem equivalente em EN: has natural enemy (45) tem sinonímia aproximada (FORMAL) Definição: Y X. Y tem um sentido diferente de X, mas ambos são próximos no significado, podendo ser representados como sinônimos em determinado contexto. Por exemplo: agricultura intensiva agricultura industrial; agricultura extensiva produção extensiva. tem característica: simétrica tem suprapropriedade: tem sinônimo é inversa de: tem sinonímia aproximada / tem sinonímia aproximada tem equivalente em EN: has near synonym (46) tem objeto de atividade (TÉLICO) Definição: X Y. X é uma atividade que usa o objeto Y para sua realização. Nota: em geral, essa relação é usada para conectar uma atividade X a um instrumento ou dispositivo Y. Por exemplo: carregar e descarregar mercadorias em paletes empilhadeira. tem suprapropriedade: relação causal é inversa de: é objeto de atividade de tem equivalente em EN: has object of activity (47) tem nome antigo (FORMAL) Definição: X Y. Y é um nome que foi descartado ou está em desuso, tendo sido substituído por X. Por exemplo: agricultor familiar camponês; camponês pequeno produtor. tem suprapropriedade: tem sinônimo é inversa de: é nome antigo tem equivalente em EN: has old name (48) tem ascendente (FORMAL) Definição: Y X. X é um antepassado ou ancestral de Y (animado ou inanimado). Nota: essa relação pode ser usada em cadeia, de forma progressiva. Por exemplo: piranha moderna megapiranha paranensis; gansos pelagornithid; tatu P. septentrionalis; aranhas e escorpiões Alalcomenaeus. tem suprapropriedade: relacional é inversa de: é ascendente de tem equivalente em EN: has parent (49) tem parte (CONSTITUTIVO) Definição: X Y. Y é uma parte do todo X. Nota: essa relação deve ser usada quando nenhuma das situações das relações hierárquicas partitivas puder se aplicada. Ver também os relacionamentos , , e . tem suprapropriedade: relacional tem subpropriedade: tem componente, é composto de, espacialmente inclui é inversa de: é parte de tem equivalente em EN: has part (50) tem agente patogênico (AGENTIVO) Definição: Y X. X é um agente patogênico capaz de produzir doenças infecciosas ou outras complicações em Y. Por exemplo: hanseníase bactéria Mycobacterium leprae. tem suprapropriedade: relação causal é inversa de: é agente patogênico de tem equivalente em EN: has pathogen (51) tem praga (AGENTIVO) Definição: Y X. X é uma praga que causa dano em Y. Por exemplo: Litchi chinensis Bactrocera dorsalis. 302 tem suprapropriedade: relação causal é inversa de: é praga de tem equivalente em EN: has pest (52) tem função fisiológica (AGENTIVO) Definição: X Y. Y é uma função fisiológica de X. Por exemplo: vitamina transporte de elétrons; ácido ascórbico síntese do colágeno. tem suprapropriedade: relação causal é inversa de: é função fisiológica de tem equivalente em EN: has physiological function (53) tem prática de pós-produção (TÉLICO) Definição: Y X. X é uma prática realizada após a produção do cultivo de X. Por exemplo: feijão batedor de terceiro; mangueira poda lateral e de topo. tem suprapropriedade: tem prática é inversa de: é prática de pós-produção para tem equivalente em EN: has physiological function (54) tem prática (TÉLICO) Definição: Y X. X é uma prática de Y. Por exemplo: pessegueiro poda, raleio (remoção do excesso de frutos); preparo do solo aração, gradagem (nivelação do solo). tem suprapropriedade: relação causal tem subpropriedade: tem prática de pós-produção é inversa de: é prática para tem equivalente em EN: has practice (55) tem produto (CONSTITUTIVO) Definição: Y X. X é produzido ou fabricado como resultado ou consequência de Y. Por exemplo: leite queijo, iogurte; porco salsicha, lombo defumado. tem suprapropriedade: relação causal é inversa de: produto de tem equivalente em EN: has product (56) tem material de propagação (AGENTIVO) Definição: X Y. Y é um material ou matéria-prima utilizada na reprodução e multiplicação de X. Por exemplo: muda semente. tem suprapropriedade: relacional é inversa de: é material de propagação de tem equivalente em EN: has propagation material (57) tem processo de propagação (AGENTIVO) Definição: X Y. Y é um conjunto de medidas tomadas para a reprodução e multiplicação de X. Por exemplo: plantas floríferas anuais estaquia. tem suprapropriedade: relação causal é inversa de: é processo de propagação de tem equivalente em EN: has propagation process (58) tem propriedade (CONSTITUTIVO) Definição: X Y. X tem uma propriedade Y, sendo que Y pode ser um adjetivo, característica ou qualidade, intrínseca ou extrínseca, de X. Por exemplo: massa de um sistema extensiva; pressão osmótica (solução ideal) coligativa. tem suprapropriedade: relação causal é inversa de: é propriedade de tem equivalente em EN: has property (59) tem nome científico (FORMAL) Definição: X Y. Y é a nomenclatura, determinada por convenção internacional, para X. Por exemplo: abelha Apis mellifera scutellata; avestruz Struthio camelus; cavalo Equus caballus. tem suprapropriedade: tem sinônimo é inversa de: é nome científico de tem equivalente em EN: has scientific name (60) tem variação ortográfica (FORMAL) Definição: X Y. Y é uma variação ortográfica de X, sendo que essa variação pode ser de grafia, plural/singular e preposicional (de, da, para, em, etc.). Por exemplo: taruíra X lagartixa; café bica. tem característica: simétrica tem suprapropriedade: relacional é inversa de: tem variação ortográfica tem equivalente em EN: has spelling variant (61) tem substituto (FORMAL) Definição: X Y. Y é um substituto para X, ainda que Y carregue ou não características essenciais de X. Nota: a substituição pode ter caráter de arbitrariedade e não ser, necessariamente, uma alteração no tempo, e, assim, Y pode ser usado em lugar de X. Por exemplo: o açúcar stevia; sal Iguapé. tem suprapropriedade: relacional é inversa de: é substituto de tem equivalente em EN: has substitute (62) tem símbolo (FORMAL) Definição: X Y. Y é um símbolo que representa X. Por exemplo: agricultura orgânica joaninha. tem suprapropriedade: relacional é inversa de: é símbolo de tem equivalente em EN: has symbol (63) tem sintoma (AGENTIVO) 303 Definição: X Y. X é uma doença que apresenta um sintoma Y, sendo que Y indica X. Por exemplo: BSE anorexia. tem suprapropriedade: relacional é inversa de: indica também definido como: propriedade de anotação tem equivalente em EN: has symptom (64) tem sinônimo (FORMAL) Definição: Y X. X é equivalente por sinonímia de Y, sendo que Y se refere ao mesmo conceito que X em um determinado contexto, pois X e Y podem ser intercambiados sem que se perca o sentido esperado. Por exemplo: agricultura intensiva exploração agrícola intensiva; agricultura intensiva produção intensiva. tem característica: simétrica tem suprapropriedade: relação de significação tem subpropriedade: tem sinônimo mais amplo, tem nome local, tem sinônimo específico, tem sinonímia aproximada, tem nome antigo, tem nome científico, tem nome comercial, é nome local, é nome comercial de, é nome antigo, é nome obsoleto para, nome científico de. é inversa de: tem sinônimo / tem sinônimo tem equivalente em EN: has synonym (65) tem nível taxonômico (FORMAL) Definição: X Y. Y identifica o nível taxonômico de X. Por exemplo: pulga, joaninha filo Artrópodos. tem suprapropriedade: relação taxonômica é inversa de: é nível taxonômico de tem equivalente em EN: has taxonomic level (66) tem tema (FORMAL) Definição: X Y. Y é um tema de X. Por exemplo: Agronomia bioestatística, entomologia econômica, tecnologia dos produtos agropecuários, olericultura, etc.; Biologia origem da vida, evolução biológica, citologia, divisão celular, etc. tem suprapropriedade: relação causal é inversa de: é tema de tem equivalente em EN: has theme (67) tem nome comercial (FORMAL) Definição: X Y. Y é o nome comercial adotado por X. Por exemplo: Sadia Brasil Foods; Perdigão Brasil Foods. tem suprapropriedade: tem sinônimo é inversa de: é nome comercial de tem equivalente em EN: has trade name, has commercial name (68) tem transliteração (FORMAL) Definição: X Y. Y é a representação dos caracteres da escrita do idioma X, sendo a operação reversível. Nota: isso faz com que X e Y, transliteradas, tenham o mesmo som (ou bastante parecido) com o do idioma de origem. Por exemplo: a palavra russa ПAПA papa (a tradução é pai); a palavra russa Москва Moskvá (a tradução é Moscou); o nome em russo Владимир Vladimir (a tradução também é Vladimir). tem suprapropriedade: relação de significação é inversa de: é transliteração de também definido como: propriedade de anotação tem equivalente em EN: has transliteration (69) tem tipo (FORMAL) Definição: X Y. X é um hiperônimo do hipônimo Y, sendo que essa hierarquia não implica em uma relação gênero- espécie, todo-parte e instanciação. Nota: ver também a relação “tem parte”. Por exemplo: atividade agrícola grupo grãos, grupo olerícolas, grupo leite. tem suprapropriedade: relacional é inversa de: tipo de tem equivalente em EN: has type (70) tem variedade (FORMAL) Definição: X Y. Y é a variedade de uma subespécie X. Nota: essa relação deve ser usada para determinar o surgimento natural e espontâneo de características em uma subespécie X. Por exemplo: Cupressus sempervirens horizontalis. tem característica: simétrica tem suprapropriedade: relacionamento taxonômico é inversa de: tem variedade / tem variedade tem equivalente em EN: has variety (71) tem vetor ou é hospedado em (AGENTIVO) Definição: Y X. X é um organismo que abriga Y ou transmite Y para outro organismo. Por exemplo: Wuchereria bancrofti mosquito do gênero Culex; dengue mosquito Aedes aegypti. tem suprapropriedade: relacional é inversa de: hospeda ou é vetor de tem equivalente em EN: has vector or is host for (72) tem erva daninha (AGENTIVO) Definição: Y X. Y é um cultivo que tem a erva daninha X, sendo que X compete com Y por luz, água e nutrientes do solo, reduzindo as safras e a qualidade de Y. Nota: as ervas daninhas podem, às vezes, ter papel positivo na redução da erosão do solo e servir de moradia para insetos úteis à vida silvestre, aumentando a biodiversidade. Por exemplo: hortaliça Picão-preto, guanxuma, azevém, beldroega, etc.; feijão braquiária, tiririca, capim-colchão, capim-colonião, etc. tem suprapropriedade: relacional é inversa de: é erva daninha de tem equivalente em EN: has weed 304 (73) incluído em (CONSTITUTIVO) Definição: Y X. Y é um elemento que está incluído em X. Por exemplo: fotoquímica foliar metabolismo fotossintético; síntese de ATP (armazenamento de energia) metabolismo fotossintético; atividade da Rubisco (enzima) metabolismo fotossintético. tem suprapropriedade: relacional tem subpropriedade: anteriormente incluído em, é subprocesso de é inversa de: inclui tem equivalente em EN: included in (74) inclui (CONSTITUTIVO) Definição: X Y. X é uma entidade que inclui o elemento Y. Por exemplo: metabolismo fotossintético fotoquímica foliar; metabolismo fotossintético síntese de ATP (armazenamento de energia); metabolismo fotossintético atividade da Rubisco (enzima). tem suprapropriedade: relacional tem subpropriedade: anteriormente incluía, inclui subprocesso é inversa de: incluído em tem equivalente em EN: includes (75) inclui subprocesso (CONSTITUTIVO) Definição: X Y. Y é um subprocesso incluído no processo X, sendo que Y é um subprocesso natural ou convencionalmente associado à realização de X. Por exemplo: produção de leite pasteurização. tem suprapropriedade: inclui é inversa de: é subprocesso de tem equivalente em EN: includes sub process (76) indica (CONSTITUTIVO) Definição: Y X. X é uma doença que apresenta um sintoma Y, sendo que Y indica X. Por exemplo: anorexia BSE. tem suprapropriedade: relacional é inversa de: tem sintoma tem equivalente em EN: indicates (77) influencia (AGENTIVO) Definição: X Y. X exerce ação de influxo sobre Y ou Y está sujeito ou é dependente de uma ação de X, que tem a capacidade de ocasionar um resultado qualquer sobre Y, alterando sua condição ou funcionamento. Nota: ver também os relacionamentos <é afetado por> e <é influenciado por ou depende de>. Explicação da diferenciação entre atuar, afetar e influenciar: (a) atuar: opera uma ação de X sobre Y, sendo que X participa do resultado em Y; (b) afetar: X causa uma mudança de estado ou de localização de Y; (c) influenciar: X influencia Y de tal maneira que induz Y a alterar sua condição ou funcionamento, podendo Y ser dependente de X como provocador de tal alteração. Por exemplo: genes de baixo e alto risco, etnia, idade, sexo, condições de nutrição processo de carcinogênese. tem suprapropriedade: relacional é inversa de: é influenciado por ou depende de tem equivalente em EN: influences (78) é ambiente de crescimento para (CONSTITUTIVO) Definição: Y <é um ambiente de crescimento para> X. X é um táxon que cresce em um ambiente Y. Nota: essa relação deve ser usada para indicar uma planta e seu domínio conexo (complementar). Por exemplo: região Isarn <é um ambiente de crescimento para> arroz de jasmim; solo úmido <é um ambiente de crescimento para> arroz. tem suprapropriedade: relacional é inversa de: cresce em tem equivalente em EN: is a growth environment for (79) é nome local (FORMAL) Definição: Y <é nome local> X. Y indica um termo que é a variação ou variante local ou regional de X. Por exemplo: andiroba <é nome local> andiroba-vermelha; aipim <é nome local> Manihot esculenta Crantz. tem suprapropriedade: tem sinônimo é inversa de: tem nome local tem equivalente em EN: is a local name (80) é praga de (AGENTIVO) Definição: X <é praga de> Y. X é uma praga que causa dano em Y. Por exemplo: Bactrocera dorsalis <é praga de> lichia (fruto). tem suprapropriedade: relação causal é inversa de: tem praga tem equivalente em EN: is a pest of (81) é tipo relacionado a (CONSTITUTIVO) Definição: Y <é um tipo relativo de> X. Y tem tipologia relacionada com X, mas X não é um hiperônimo do hipônimo Y, ainda que X e Y mantenham algum tipo de relação não explicitamente especificada. tem suprapropriedade: relação causal é inversa de: tem tipo relacionado tem equivalente em EN: is a related type of (82) é nome comercial de (FORMAL) Definição: Y <é nome comercial de> X. Y é o nome comercial adotado por X. Por exemplo: Brasil Foods <é nome comercial de> Sadia; Brasil Foods <é nome comercial de> Perdigão. tem suprapropriedade: tem sinônimo é inversa de: tem nome comercial tem equivalente em EN: is a trade name of (83) é transliteração de (FORMAL) Definição: Y <é transliteração de> X. Y é a representação dos caracteres da escrita do idioma X, sendo a operação reversível. Nota: isso faz com que X e Y, transliteradas, tenham o mesmo som (ou bastante parecido) com o do idioma de origem. Por exemplo: papa <é transliteração de> ПAПA (palavra russa); Moskvá <é transliteração de> Москва (palavra russa); Vladimir <é transliteração de> Владимир (nome russo). tem suprapropriedade: relação de significação 305 é inversa de: tem transliteração tem equivalente em EN: is a transliteration of (84) é abreviatura de (FORMAL) Definição: X <é abreviatura de> Y. X indica que um termo fez uso de letras, símbolos ou sinais como recurso convencional para representar, de forma reduzida, Y. Por exemplo: Eng.-Agr.<é abreviatura de> Engenheiro-Agrônomo; VO <é abreviatura de> voláteis orgânicos. tem suprapropriedade: relação de significação tem subpropriedade: é acrônimo de é inversa de: tem abreviatura também definido como: propriedade de anotação tem equivalente em EN: has abbreviation (85) é alcançado por meio de (CONSTITUTIVO) Definição: Y <é alcançado por meio de> X. Y é um objetivo ou processo utilizado por X, sem que Y seja, necessariamente, parte de X. Por exemplo: eliminação de microrganismos <é alcançado por meio de> pasteurização; eliminação de impurezas sólidas <é alcançado por meio de> decantação. tem suprapropriedade: relacionado tem subpropriedade: usa processo é inversa de: tem objetivo ou processo tem equivalente em EN: is achieved by means of (86) é acrônimo de (FORMAL) Definição: X <é acrônimo de> Y. X é o conjunto de uma ou mais letras iniciais de uma expressão, com mais de uma palavra, que foram utilizadas para compor uma nova palavra X, formando uma neologia. Por exemplo: CONFEA <é acrônimo de> Conselho Federal de Engenharia, Arquitetura e Agronomia. tem suprapropriedade: é abreviatura de é inversa de: tem acrônimo tem equivalente em EN: is acronym of (87) sofre atuação de (AGENTIVO) Definição: Y X. X é um agente que exerce uma ação sobre Y. Nota: ver também os relacionamentos <é afetado por> e <é influenciado por ou depende de>. Explicação da diferenciação entre atuar, afetar e influenciar: (a) atuar: opera uma ação de X sobre Y, sendo que X participa do resultado em Y; (b) afetar: X causa uma mudança de estado ou de localização de Y; (c) influenciar: X influencia Y de tal maneira que induz Y a alterar sua condição ou funcionamento, podendo Y ser dependente de X como provocador de tal alteração. Por exemplo: matéria gravidade; gene repressor gene operador; contração muscular citoesqueleto. tem suprapropriedade: relação causal é inversa de: atua sobre tem equivalente em EN: is acted upon by (88) é afetado por (AGENTIVO) Definição: Y <é afetado por> X. X é um agente que afeta Y de tal forma que Y muda de estado ou localização. Nota: ver também os relacionamentos <é afetado por> e <é influenciado por ou depende de>. Explicação da diferenciação entre atuar, afetar e influenciar: (a) atuar: opera uma ação de X sobre Y, sendo que X participa do resultado em Y; (b) afetar: X causa uma mudança de estado ou de localização de Y; (c) influenciar: X influencia Y de tal maneira que induz Y a alterar sua condição ou funcionamento, podendo Y ser dependente de X como provocador de tal alteração. Por exemplo: bactéria <é afetado por> esterilização; praga <é afetado por> controle de pragas; agricultura <é afetado por> poluição da agricultura. tem suprapropriedade: relação causal tem subpropriedade: é afligido por é inversa de: afeta tem equivalente em EN: is affected by (89) é afligido por (AGENTIVO) Definição: Y <é afligido por> X. X é uma doença que pode ter efeito adverso na saúde de um organismo Y. Por exemplo: vacas <é afligido por> BSE (doença da vaca louca). tem suprapropriedade: é afetado por é inversa de: aflige tem equivalente em EN: is afflicted by (90) é benéfico para (AGENTIVO) Definição: X <é benéfico para> Y. Y recebe um resultado vantajoso, conseguido a partir do comportamento do agente X, sendo que Y pode ser uma consequência, atingida a partir de X. Por exemplo: controle biológico artrópode <é benéfico para> controle biológico; controle de pragas <é benéfico para> fitosanidade; tem suprapropriedade: relação causal é inversa de: tem benefício de tem equivalente em EN: is beneficial for (91) é agente de controle biológico de (AGENTIVO) Definição: X <é agente de controle biológico de> Y. X é um agente que biologicamente controla os inimigos de Y, sendo que Y pode ser qualquer espécie de planta ou animal. Por exemplo: Fungo Metarhizium anisopliae <é agente de controle biológico de> cigarrinha da folha da cana-de-açúcar; Fungo Metarhizium anisopliae <é agente de controle biológico de> Broca dos citrus; Vírus Baculovírus anticarsia <é agente de controle biológico de> Lagarta da soja. tem suprapropriedade: relação causal é inversa de: tem agente de controle biológico tem equivalente em EN: is biological control agent of (92) é método de reprodução de (TÉLICO) Definição: X <é método de reproção de> Y. X é um método de reprodução para Y. Y é um ser vivo, animal ou vegetal, que pode dar origem a novos indivíduos de sua espécie. Por exemplo: fecundação <é método de reproção de> musgo; germinação <é método de reproção de> planta; assexuado <é método de reproção de> folha da fortuna; assexuado <é método de reproção de> esponjas; mitose <é método de reproção de> células da pele. tem suprapropriedade: relação causal é inversa de: tem método de reprodução tem equivalente em EN: is breeding method of 306 (93) é causada por (AGENTIVO) Definição: Y <é causada por> X. X é um agente (animado ou inanimado) causa um efeito ou resultado Y. Por exemplo: BSE <é causada por> prião; erosão por água <é causada por> água. tem suprapropriedade: relação causal é inversa de: causa tem equivalente em EN: is caused by (94) é fórmula química de (FORMAL) Definição: X <é fórmula química de> Y. X é uma representação (letras, números e símbolos) de um composto químico Y, que pode indicar uma fórmula molecular, geométrica, eletrônica ou estrutural. Por exemplo: H2O <é fórmula química de> água; HCl <é fórmula química de> ácido clorídrico; NaCl <é fórmula química de> cloreto de sódio; NH3<é fórmula química de> amônia. tem suprapropriedade: relação de significação é inversa de: tem fórmula química tem equivalente em EN: is chemical formula of (95) é componente de (CONSTITUTIVO) Definição: X <é componente de> Y. X é parte de um todo Y, sendo que X também tem existência independente de Y. Nota: não usar para situações do tipo: células sanguíneas <é componente de> sangue, pois as células sanguíneas não existem independentes do sangue (nesse caso, verificar o uso da relação <é composto de>). Por exemplo: carburador <é componente de> motor; folha <é componente de> árvore; cromossomo <é componente de> célula. tem suprapropriedade: é parte de é inversa de: tem componente tem equivalente em EN: is component of (96) é composto de (CONSTITUTIVO) Definição: X <é composto de> Y. Y é um composto de X, onde Y consiste no material ou substância de que X é feito. Nota 1: essa relação também inclui as relações e . Por exemplo: sangue <é composto de> glóbulo, gás de sangue, lipídios do sangue, proteína do sangue; cerveja <é composto de> água, fermento. Nota 2: neste último caso, cerveja recebe uma relação por herança: cerveja lúpulo. tem suprapropriedade: tem parte de é inversa de: compõe tem equivalente em EN: is composed of (97) é composição de (CONSTITUTIVO) Definição: Y <é composição de> X. X é parte de um todo Y, ou X decompõe Y de alguma maneira, seja no seu aspecto ou em sua forma, sendo que X não está inerentemente misturado em Y. Por exemplo: matéria orgânica, minerais <é composição de> solo. tem suprapropriedade: relacional é inversa de: tem composição tem equivalente em EN: is composition of (98) é método de controle de (TÉLICO) Definição: X <é método de controle de> Y. X é um método que controla Y, sendo que X emprega domínio, de alguma maneira (processo, uma medição, um controle biológico, econômico, etc.), sobre Y. Por exemplo: controle biológico de pragas <é método de controle de> controle de pragas; vacinação dos herbívoros <é método de controle de> controle de raiva nos herbívoros. tem suprapropriedade: relação causal é inversa de: tem método de controle tem equivalente em EN: is control method of (99) é controlado por (AGENTIVO) Definição: Y <é controlado por> X. X é um agente usado como mecanismo para controle de um paciente Y, sendo que X exerce poder sobre Y, com o objetivo de obter um resultado desejado. Por exemplo: qualidade dos produtos veterinários <é controlado por> Coordenação de Produtos Veterinários; cadeias produtivas de alimentos (animal e vegetal)<é controlado por> Plano Nacional de Controle de Resíduos e Contaminantes; qualidade dos produtos orgânicos <é controlado por> certificação. tem suprapropriedade: relação causal é inversa de: controla tem equivalente em EN: is controlled by (100) é sistema de cultivo de (TÉLICO) Definição: X <é sistema de cultivo de> Y. X é um sistema usado para cultivar Y. Por exemplo: hidroponia <é sistema de cultivo de> hortaliça; pré-germinado <é sistema de cultivo de> arroz. tem suprapropriedade: relação causal é inversa de: tem sistema de cultivo tem equivalente em EN: is cropping system of (101) é processo de cultivo de (TÉLICO) Definição: Y <é processo de cultivo de> X. X é um processo usado no cultivo de Y. Por exemplo: compostagem <é processo de cultivo de> decomposição natural da matéria orgânica de origem animal ou vegetal; adubação <é processo de cultivo de> rosa. tem suprapropriedade: relação causal é inversa de: tem processo de cultivo tem equivalente em EN: is cultivation process of (102) é derivado de (AGENTIVO) Definição: X <é derivado de> Y. X é uma substância ou produto que é obtido exclusivamente a partir de fonte Y, sem o uso substância ou produto adicional, de forma significativa. Nota: não usar para relações do tipo: cerveja <é derivado de> lúpulo, pois a cerveja possui outros ingredientes além de lúpulo. Neste caso, melhor usar: cerveja <é feita a partir de> lúpulo. Por exemplo: leite de vaca <é derivado de> vaca; óleo vegetal <é derivado de> planta; madeira de oliveira <é derivado de> oliveira; carne de frango <é derivado de> galinha. tem suprapropriedade: relacional é inversa de: é fonte de tem equivalente em EN: is derived from (103) é doença para (AGENTIVO) Definição: X <é doença para> Y. X é uma doença que acomete Y, total ou parcialmente. Por exemplo: cancro-bacteriano <é doença para> tomateiro; mancha-de-estenfílio <é doença para> tomateiro; podridão do colo <é doença para> feijão. 307 tem suprapropriedade: relação causal é inversa de: tem doença tem equivalente em EN: is disease for (104) é distúrbio de (AGENTIVO) Definição: X <é distúrbio de> Y. X é um distúrbio que ataca Y, sendo que X é um problema, disfunção ou anomalia que pode advir de diferentes fatores (climáticos, etc.). Por exemplo: retenção foliar <é distúrbio de> soja; abortamento de flores <é distúrbio de> soja; descoloração pelo frio <é distúrbio de> cafeeiro; escaldura pelo calor <é distúrbio de> cafeeiro; canela de geada <é distúrbio de> cafeeiro. tem suprapropriedade: relação causal é inversa de: tem distúrbio tem equivalente em EN: is disorder of (105) é parte infectada de (AGENTIVO) Definição: X <é parte infectada de> Y. X é a parte infectada de Y. Por exemplo: folhas <é parte infectada de> soja; semente <é parte infectada de> lavoura; panícula <é parte infectada de> arroz. tem suprapropriedade: relação causal é inversa de: tem parte infectada tem equivalente em EN: is infected part of (106) é influenciado por ou depende de (AGENTIVO) Definição: Y <é influenciado por ou depende de> X. X exerce ação de influxo sobre Y ou Y está sujeito ou é dependente de uma ação de X, que tem a capacidade de ocasionar um resultado qualquer sobre Y, alterando sua condição ou funcionamento. Nota: ver também os relacionamentos <é afetado por> e <é influenciado por ou depende de>. Explicação da diferenciação entre atuar, afetar e influenciar: (a) atuar: opera uma ação de X sobre Y, sendo que X participa do resultado em Y; (b) afetar: X causa uma mudança de estado ou de localização de Y; (c) influenciar: X influencia Y de tal maneira que induz Y a alterar sua condição ou funcionamento, podendo Y ser dependente de X como provocador de tal alteração. Por exemplo: processo de carcinogênese <é influenciado por ou depende de> genes de baixo e alto risco, etnia, idade, sexo, condições de nutrição, etc. tem suprapropriedade: relacional é inversa de: influencia tem equivalente em EN: is influenced by or depends on (107) é insumo para (AGENTIVO) Definição: X <é insumo para> Y. X é utilizado como insumo para produção de X, sendo que X compreende todos os produtos necessários à produção vegetal e animal: adubos, vacinas, tratores, sementes, entre outros. Por exemplo: sementes, fertilizantes, corretivos de solo, agroquímicos, herbicidas, inseticidas, fungicidas <é insumo para> produção de feijão irrigado. tem suprapropriedade: relacional é inversa de: tem insumo tem equivalente em EN: is input for (108) é feito a partir de (CONSTITUTIVO) Definição: X <é feito a partir de> Y. X é obtido, principalmente (em termos de importância), a partir de uma substância ou de um produto Y. Por exemplo: queijo cheddar <é feito a partir de> leite de vaca; cerveja <é feito a partir de> lúpulo. Antes de usar, veja também a relação <é composto de>. tem suprapropriedade: relacional é inversa de: é usado para fazer tem equivalente em EN: is made from (109) é meio para (TÉLICO) Definição: X <é meio para> Y. X é um objeto ou instrumento usado, principalmente, para executar Y. Nota 1: antes de aplicar esse relacionamento, veja também a relação <é usado como>. Por exemplo: arma <é meio para> assassinato; vara de pescar <é meio para> pesca; álcool <é meio para> limpeza; arado <é meio para> arar a terra. Nota 2: não usar para situações tais como: faca <é meio para> corte de árvore, pois faca não é usada principalmente para o corte de árvore. tem suprapropriedade: relacional é inversa de: é realizado por meio de tem equivalente em EN: is means for (110) é medido por (CONSTITUTIVO) Definição: X <é medido por> Y. Y é utilizado para medir uma propriedade quantitativa de X. Por exemplo: velocidade do ar <é medido por> anemômetro; quantidade de chuva <é medido por> pluviômetro. tem suprapropriedade: relações quantitativas é inversa de: mede tem equivalente em EN: is measured by (111) é membro de (CONSTITUTIVO) Definição: X <é membro de> Y. X é um membro ou um elemento que faz parte de Y, sendo que Y é uma entidade coletiva ou individual, social ou política. Por exemplo: vaca <é membro de> rebanho; Argélia, Benin, Burkina Faso <é membro de> África francófona. tem suprapropriedade: relacional é inversa de: tem membro tem equivalente em EN: is member of (112) é inimigo natural de (AGENTIVO) Definição: Y <é inimigo natural de> X. Y é um inimigo natural (predador, parasita, etc.) de X, sendo que Y pode ser utilizado como controlador de pragas ou doenças. Por exemplo: tesourinha <é inimigo natural de> pulgões, moscas-brancas, lagartas pequenas, etc.; joaninha <é inimigo natural de> pulgões, cochonilhas, ácaros, moscas-brancas, etc.; aranha <é inimigo natural de> diversos insetos. tem suprapropriedade: relação causal é inversa de: tem inimigo natural tem equivalente em EN: is natural enemy of (113) é objeto de atividade (TÉLICO) Definição: Y <é objeto de atividade> X. X é uma atividade que usa o objeto Y para sua realização. Nota: em geral, essa relação é usada para conectar uma atividade X a um instrumento ou dispositivo Y. Por exemplo: empilhadeira <é objeto de atividade> carregar e descarregar mercadorias em paletes. tem suprapropriedade: relação causal 308 é inversa de: tem objeto de atividade tem equivalente em EN: is object of activity (114) é nome antigo de (FORMAL) Definição: Y <é nome antigo de> X. Y é um nome que foi descartado ou está em desuso, tendo sido substituído por X. Por exemplo: camponês <é nome antigo de> agricultor familiar; pequeno produtor <é nome antigo de> camponês. tem suprapropriedade: tem sinônimo é inversa de: tem nome antigo tem equivalente em EN: is old name of, is a deprecated name for (115) tem insumo (AGENTIVO) Definição: Y X. X é utilizado como insumo para produção de X, sendo que X compreende todos os produtos necessários à produção vegetal e animal: adubos, vacinas, tratores, sementes, entre outros. Por exemplo: produção de feijão irrigado sementes, fertilizantes, corretivos de solo, agroquímicos, herbicidas, inseticidas, fungicidas. tem suprapropriedade: relacional é inversa de: é insumo para tem equivalente em EN: is output from (116) é ascendente de (FORMAL) Definição: X <é ascendente de> Y. X é um antepassado ou ancestral de Y (animado ou inanimado). Nota: essa relação pode ser usada em cadeia, de forma progressiva. Por exemplo: megapiranha paranensis <é ascendente de> piranha moderna; pelagornithid <é ascendente de> gansos; P. septentrionalis <é ascendente de> tatu; Alalcomenaeus <é ascendente de> aranhas e escorpiões. tem suprapropriedade: relacional é inversa de: tem ascendente tem equivalente em EN: is parent of (117) é parte de (CONSTITUTIVO) Definição: Y <é parte de> X. Y é uma parte do todo X. Nota: essa relação deve ser usada quando nenhuma das situações das relações hierárquicas partitivas puder ser aplicada. Ver também os relacionamentos <é componente de>, <é composto por>, <é membro> e <é subprocesso>. tem suprapropriedade: relacional tem subpropriedade: composto, componente de, espacialmente incluído em é inversa de: tem parte tem equivalente em EN: is part of (118) é agente patogênico de (AGENTIVO) Definição: X <é agente patogênico de> Y. X é um agente patogênico capaz de produzir doenças infecciosas ou outras complicações em Y. Por exemplo: bactéria Mycobacterium leprae <é agente patogênico de> hanseníase. tem suprapropriedade: relação causal é inversa de: tem agente patogênico tem equivalente em EN: is pathogen of (119) é realizado por (AGENTIVO) Definição: X <é realizado por> Y. Y é um elemento capaz de realizar uma ação em X, pois a execução de X é obtida a partir de Y. Por exemplo: divisão celular <é realizado por> meiose; divisão de cromossomos <é realizado por> mitose. tem suprapropriedade: relação causal é inversa de: executa tem equivalente em EN: is performed by (120) é realizado por meio de (AGENTIVO) Definição: Y <é realizado por meio de> X. X é um objeto ou instrumento usado, principalmente, para executar Y. Nota 1: antes de aplicar esse relacionamento, veja também a relação <é usado como>. Por exemplo: assassinato <é realizado por meio de> arma; pesca <é realizado por meio de> vara de pescar; limpeza <é realizado por meio de> álcool; arar a terra <é realizado por meio de> arado. Nota 2: não usar para situações tais como: corte de árvores <é realizado por meio de> facas, pois facas não são usadas principalmente para o corte de árvores. tem suprapropriedade: relacional é inversa de: é meio para tem equivalente em EN: is performed by (121) é função fisiológica de (AGENTIVO) Definição: Y <é função fisiológica de> X. Y é uma função fisiológica de X. Por exemplo: transporte de elétrons <é função fisiológica de> vitamina; síntese do colágeno <é função fisiológica de> ácido ascórbico. tem suprapropriedade: relação causal é inversa de: tem função fisiológica tem equivalente em EN: is physiological function of (122) é prática de pós-produção para (TÉLICO) Definição: X <é prática de pós-produção para> Y. X é uma prática realizada após a produção do cultivo X. Por exemplo: batedor de terceiro <é prática de pós-produção para> feijão; poda lateral e de topo <é prática de pós-produção para> mangueira. tem suprapropriedade: é prática para é inversa de: tem prática de pós-produção tem equivalente em EN: is post-production practice for (123) é prática para (TÉLICO) Definição: X <é prática para> Y. X é uma prática de Y. Por exemplo: poda, raleio (remoção do excesso de frutos) <é prática para> pessegueiro; aração, gradagem (nivelação do solo) <é prática para> preparo do solo. tem suprapropriedade: relação causal tem subpropriedade: é prática de pós-produção para é inversa de: tem prática tem equivalente em EN: is practice for (124) é prevenido através de (AGENTIVO) Definição: X <é prevenido através de> Y. Y é um elemento que evita algum mal ou dano X, sendo que X pode ser aplicado para prevenir, impedir ou interromper X. Por exemplo: asma <é prevenido através de> vacinas dessensibilizantes; asma <é prevenido através de> combate ao refluxo gastroesofágico. 309 tem suprapropriedade: relação causal é inversa de: previne tem equivalente em EN: is prevented by (125) é processo para (TÉLICO) Definição: X <é processo para> Y. X é um processo utilizado para obter Y. Por exemplo: modernização agrícola <é processo para> Revolução Verde; fermentação <é processo para> cultivo microbiótico; esterilização <é processo para> limpar frutas. tem suprapropriedade: tem objetivo ou processo é inversa de: usa processo tem equivalente em EN: is process for (126) é produzido por (CONSTITUTIVO) Definição: X <é produzido por> Y. X é um produto tipicamente produzido por Y, sendo que X é um resultado, natural ou não, intrinsecamente relacionado com a natureza de Y. Por exemplo: arroz <é produzido por> Tocantins; arroz irrigado <é produzido por> Rio Grande do Sul; café <é produzido por> Minas Gerais; milho <é produzido por> Jataí (GO); laranja <é produzido por> São Paulo. tem suprapropriedade: relação causal é inversa de: produz tem equivalente em EN: is produced by (127) é material de propagação de (TÉLICO) Definição: Y <é material de propagação de> X. Y é um material ou matéria-prima utilizada na reprodução e multiplicação de X. Por exemplo: semente <é material de propagação de> muda. tem suprapropriedade: relacional é inversa de: tem material de propagação tem equivalente em EN: is propagation material of (128) é processo de propagação de (TÉLICO) Definição: Y <é processo de propagação de> X. Y é um conjunto de medidas tomadas para a reprodução e multiplicação de X. Por exemplo: estaquia <é processo de propagação de> plantas floríferas anuais. tem suprapropriedade: relação causal é inversa de: tem processo de propagação tem equivalente em EN: is propagation process of (129) é propriedade de (CONSTITUTIVO) Definição: Y <é propriedade de> X. X tem uma propriedade Y, sendo que Y pode ser um adjetivo, característica ou qualidade, intrínseca ou extrínseca, de X. Por exemplo: extensiva <é propriedade de> massa de um sistema; coligativa <é propriedade de> pressão osmótica (solução ideal). tem suprapropriedade: relação causal é inversa de: tem propriedade tem equivalente em EN: is property of (130) é fonte de (AGENTIVO) Definição: Y <é fonte de> X. X é uma substância ou produto que é obtido exclusivamente a partir de fonte Y, sem o uso substância ou produto adicional, de forma significativa. Nota: não usar para relações do tipo: cerveja <é derivado de> lúpulo, pois a cerveja possui outros ingredientes além de lúpulo. Neste caso, melhor usar: cerveja <é feita a partir de> lúpulo. Por exemplo: vaca <é fonte de> leite de vaca; planta <é fonte de> óleo vegetal; oliveira <é fonte de> madeira de oliveira; galinha <é fonte de> carne de frango. tem suprapropriedade: relacional é inversa de: é derivado de tem equivalente em EN: is source of (131) é espacialmente incluído em (CONSTITUTIVO) Definição: Y <é espacialmente incluído em> X. Y é uma parte inerente ou inalienável de X, sendo que Y é aquilo que está intimamente unido a X, pois diz respeito ao próprio ser X. Ou seja, Y é uma parte de X (animado ou inanimado) e que é inseparável ou intrínseco de X por natureza. Por exemplo: Congo <é espacialmente incluído em> África; Sudeste da Ásia <é espacialmente incluído em> Ásia; mão <é espacialmente incluído em> braço. tem suprapropriedade: é parte de é inversa de: espacialmente inclui também definido como: propriedade de anotação tem equivalente em EN: is spatially included in (132) é estudado por (CONSTITUTIVO) Definição: Y <é estudado por> X. X é uma entidade (indivíduo, órgão ou disciplina) que estuda Y, buscando adquirir instrução ou conhecimentos sobre Y. Por exemplo: criação de animais <é estudado por> zootécnico; cuidado da saúde do rebanho <é estudado pelo> zootécnico; melhoramento genético de raças <é estudado por> zootécnico; manejo ambiental <é estudado por> engenheiro agrônomo; sistemas de irrigação <é estudado por> engenheiro agrônomo; administração de negócios <é estudado por> engenheiro agrônomo. tem suprapropriedade: relacional é inversa de: estuda tem equivalente em EN: is studied by (133) é subprocesso de (TÉLICO) Definição: Y <é subprocesso de> X. Y é um subprocesso incluído no processo X, sendo que Y é um subprocesso natural ou convencionalmente associado à realização de X. Por exemplo: pasteurização <é subprocesso de> produção de leite. tem suprapropriedade: incluído em é inversa de: inclui subprocesso tem equivalente em EN: is subprocess of (134) é substituto de (FORMAL) Definição: Y <é substituto de> X. Y é um substituto para X, ainda que Y carregue ou não características essenciais de X. Nota: a substituição pode ter caráter de arbitrariedade e não ser, necessariamente, uma alteração no tempo, e, assim, Y pode ser usado em lugar de X. Por exemplo: stevia <é substituto de> açúcar; Iguapé <é substituto de> sal. tem suprapropriedade: relacional é inversa de: tem substituto também definido como: propriedade de anotação 310 tem equivalente em EN: is substitute for (135) é símbolo de (FORMAL) Definição: Y <é símbolo de> X. Y é um símbolo que representa X. Por exemplo: joaninha <é símbolo de> agricultura orgânica. tem suprapropriedade: relacional é inversa de: tem símbolo tem equivalente em EN: is symbol for (136) é nível taxonômico de (FORMAL) Definição: Y <é nível taxonômico de> X. Y identifica o nível taxonômico de X. Por exemplo: filo Artrópodos <é nível taxonômico de> pulga, joaninha. tem suprapropriedade: relação taxonômica é inversa de: tem nível taxonômico tem equivalente em EN: is taxonomic level of (137) é tema de (CONSTITUTIVO) Definição: Y <é tema de> X. Y é um tema de X. Por exemplo: bioestatística, entomologia econômica, tecnologia dos produtos agropecuários, olericultura, etc. <é tema de> Agronomia; origem da vida, evolução biológica, citologia, divisão celular, etc. <é tema de> Biologia. tem suprapropriedade: relação causal é inversa de: tem tema tem equivalente em EN: is theme of (138) é uso de (TÉLICO) Definição: Y <é uso de> X. No domínio vegetal, usar da seguinte forma: Y <é uso de> [táxon] X, sendo que “táxon” é qualquer unidade taxonômica, usada essencialmente em um sistema de classificação da botânica (Reino, Divisão, Subdivisão, Classe, Subclasse, Ordem, Subordem, Famílias, Subfamília, Tribo, Subtribo, Gênero, Subgênero, Seção, Subseção, Série, Subsérie, Variedade e Forma). Para substâncias químicas, usar da seguinte forma: Y [uso] <é uso de> [substância química] X. Por exemplo: fruta <é uso de> maçã; limpeza <é uso de> álcool; pesticida <é uso de> DDT (diclorodifeniltricloroetano). tem suprapropriedade: relacional é inversa de: é usado como tem equivalente em EN: is use of (139) é usado como (TÉLICO) Definição: X <é usado como> Y. No domínio vegetal, usar da seguinte forma: X [táxon] <é usado como> Y, sendo que “táxon” é qualquer unidade taxonômica, usada essencialmente em um sistema de classificação da botânica (Reino, Divisão, Subdivisão, Classe, Subclasse, Ordem, Subordem, Famílias, Subfamília, Tribo, Subtribo, Gênero, Subgênero, Seção, Subseção, Série, Subsérie, Variedade e Forma). Para substâncias químicas, usar da seguinte forma: X [substância química] <é usado como> [uso] Y. Por exemplo: maçã <é usado como> fruta; álcool <é usado como> limpeza; DDT (diclorodifeniltricloroetano) <é usado como> pesticida. tem suprapropriedade: relacional é inversa de: é uso de tem equivalente em EN: is used as (140) é usado em (TÉLICO) Definição: X <é usado em> Y. X é usual ou habitualmente empregado em Y, sendo normal usar X na prática de Y. Por exemplo: insumos químicos <é usado em> agricultura tradicional; plantas leguminosas <é usado em> adubo verde; tecnologia digital <é usado em> agricultura de precisão. tem suprapropriedade: relacional é inversa de: faz uso de tem equivalente em EN: is used in (141) é usado para fazer (CONSTITUTIVA) Definição: Y <é usado para fazer> X. X é obtido, principalmente (em termos de importância), a partir de uma substância ou de um produto Y. Por exemplo: leite de vaca <é usado para fazer> queijo cheddar; lúpulo <é usado para fazer> cerveja. Antes de usar, veja também a relação <é composto de>. tem suprapropriedade: relacional é inversa de: é feito a partir de tem equivalente em EN: is used to make (142) é erva daninha de (AGENTIVO) Definição: X <é erva daninha de> Y. Y é uma planta que tem a erva daninha X, sendo que X compete com Y por luz, água e nutrientes do solo, reduzindo as safras e a qualidade de Y. Nota: as ervas daninhas podem, às vezes, ter papel positivo na redução da erosão do solo e servir de moradia para insetos úteis à vida silvestre, aumentando a biodiversidade. Por exemplo: picão-preto, guanxuma, azevém, beldroega, etc. <é erva daninha de> hortaliça; braquiária, tiririca, capim-colchão, capim- colonião, etc. <é erva daninha de> feijão. tem suprapropriedade: relacional é inversa de: tem erva daninha tem equivalente em EN: is weed of (143) faz uso de (TÉLICO) Definição: Y X. X é usual ou habitualmente empregado em Y, sendo normal usar X na prática de Y. Por exemplo: insumos químicos <é usado em> agricultura tradicional; plantas leguminosas <é usado em> adubo verde; tecnologia digital <é usado em> agricultura de precisão. tem suprapropriedade: relacional é inversa de: é usado em tem equivalente em EN: make use of (144) mede (CONSTITUTIVO) Definição: Y X. Y é utilizado para medir uma propriedade quantitativa de X. Por exemplo: anemômetro velocidade do ar; pluviômetro quantidade de chuva. tem suprapropriedade: relações quantitativas é inversa de: é medido por tem equivalente em EN: measures (145) ordem tem classe (FORMAL) 311 Definição: Y X. Y é uma ordem, parte de um sistema taxonômico, no qual pertence à classe X. Por exemplo, para a girafa: Artiodáctilos, Ungulados mamíferos. tem suprapropriedade: relação taxonômica é inversa de: classe inclui ordem tem equivalente em EN: order has class (146) ordem inclui família (FORMAL) Definição: Y X. Y é uma ordem, parte de um sistema taxonômico, no qual inclui a família X. Por exemplo, para a girafa: Artiodáctilos, Ungulados girafídeos. tem suprapropriedade: relação taxonômica é inversa de: família tem ordem tem equivalente em EN: order includes family (147) executa (AGENTIVO) Definição: Y X. Y é um elemento capaz de realizar uma ação em X, pois a execução de X é obtida a partir de Y. Por exemplo: meiose divisão celular; mitose divisão de cromossomos. tem suprapropriedade: relação causal é inversa de: é realizado por tem equivalente em EN: performs (148) precede (FORMAL) Definição: Y X. X é um elemento sucessor de Y, assumindo, por direito de sucessão, nomeação, substituição ou eleição, as funções antes ocupadas por algo ou alguém. Nota: pode também indicar um termo que vem depois, que acontece sucessivamente (uma coisa em relação a outra), vindo posteriormente. Por exemplo: Serviço Geológico e Mineralógico Departamento Nacional de Produção Mineral. tem suprapropriedade: relação temporal é inversa de: sucede tem equivalente em EN: precedes (149) previne (TÉLICO) Definição: Y X. Y é um elemento que evita algum mal ou dano X, sendo que X pode ser aplicado para prevenir, impedir ou interromper X. Por exemplo: vacinas dessensibilizantes asma; combate ao refluxo gastroesofágico asma. tem suprapropriedade: relação causal é inversa de: é prevenido através de tem equivalente em EN: prevents (150) produz (AGENTIVO) Definição: Y X. X é um produto tipicamente produzido por Y, sendo que X é um resultado, natural ou não, intrinsecamente relacionado com a natureza de Y. Por exemplo: Tocantins arroz; Rio Grande do Sul arroz irrigado; Minas Gerais café; Jataí (GO) milho; São Paulo laranja. tem suprapropriedade: relação causal é inversa de: é produzido por tem equivalente em EN: produces (151) produto de (AGENTIVO) Definição: X Y. X é produzido ou fabricado como resultado ou consequência de Y. Por exemplo: leite queijo, iogurte; porco salsicha; lombo defumado. tem suprapropriedade: relação causal é inversa de: tem produto tem equivalente em EN: product of (152) relação quantitativa (CONSTITUTIVO) Definição: X . X é cada uma das relações que envolvem quantidades ou medidas. tem característica: simétrica tem suprapropriedade: relacional tem subpropriedade: maior que, é medido por, mede, menor que, utiliza valor, valor utilizado em é inversa de: relação quantitativa / relação quantitativa tem equivalente em EN: quantitative relationship (153) é nome científico de (FORMAL) Definição: Y X. Y é a nomenclatura, determinada por convenção internacional, para X. Por exemplo: Apis mellifera scutellata abelha; Struthio camelus avestruz; Equus caballus cavalo. tem suprapropriedade: tem sinônimo é inversa de: tem nome científico tem equivalente em EN: scientific name of (154) menor que (CONSTITUTIVO) Definição: Y X. X e Y estabelecem uma relação que expressa uma ordem quantitativa. Por exemplo: PIB Roraima (2010) PIB Mato Grosso do Sul (2010); PIB Piauí (2010) PIB Roraima (2010); 1 are (100m2) 1 hectare (10.000m2). tem suprapropriedade: relação quantitativa é inversa de: maior que tem equivalente em EN: smaller than (155) relação espacial (CONSTITUTIVO) Definição: X . X é cada uma das relações que permitem a construção e a representação de um espaço, local, território ou região. Nota: as relações podem ser topográficas (ex.: lado, vizinho, dentro, etc.), projetivas (ex.: direita, esquerda, ao sul, etc.) e métricas (distâncias e coordenadas). tem característica: simétrica tem suprapropriedade: relacional tem subpropriedade: rodeado por / rodeia é inversa de: relação espacial / relação espacial tem equivalente em EN: spatial relations (156) espacialmente inclui (CONSTITUTIVO) 312 Definição: X Y. Y é uma parte inerente ou inalienável de X, sendo que Y é aquilo que está intimamente unido a X, pois diz respeito ao próprio ser X. Ou seja, Y é uma parte de X (animado ou inanimado) e que é inseparável ou intrínseco de X por natureza. Por exemplo: África Congo; Ásia Sudeste da Ásia; braço mão. tem suprapropriedade: é parte de é inversa de: está espacialmente incluído em também definido como: propriedade de anotação tem equivalente em EN: spatially includes (157) espécie tem gênero (FORMAL) Definição: Y X. > Y. X é um gênero, parte de um sistema taxonômico, no qual inclui a espécie Y. Por exemplo: Ctenocephalides canis (pulga) Ctenocephalides. tem suprapropriedade: relação taxonômica é inversa de: gênero inclui espécie tem equivalente em EN: species has genus (158) espécie inclui subespécie (FORMAL) Definição: X Y. X é uma espécie, parte de um sistema taxonômico, no qual inclui a subespécie Y. Nota: em um sistema classificatório taxonômico, uma espécie pode ser subdividida em subespécies ou raças, muitas vezes devido às maneiras distintas de evolução das espécies. Por exemplo: Pinus nigra (pinheiro negro) Pinus nigra caramanica (turco), Pinus nigra pallasiana (crimeia). Não usar para indicar variedade (ou infraespecífico) de uma espécie (por exemplo, não usar para a espécie Clematis alpina, que tem Ruby como variedade e não subespécie). tem suprapropriedade: relação taxonômica é inversa de: subespécie tem espécie tem equivalente em EN: species includes subspecies (159) estuda (CONSTITUTIVO) Definição: X Y. X é uma entidade (indivíduo, órgão ou disciplina) que estuda Y, buscando adquirir instrução ou conhecimentos sobre Y. Por exemplo: zootécnico criação de animais; zootécnico cuidado da saúde do rebanho; zootécnico melhoramento genético de raças; engenheiro agrônomo manejo ambiental; engenheiro agrônomo sistemas de irrigação; engenheiro agrônomo administração de negócios. tem suprapropriedade: relacional é inversa de: é estudado por também definido como: propriedade de anotação, propriedade de dados tem equivalente em EN: study (160) subgrupo tem grande grupo (FORMAL) Definição: Y X. X é um grande grupo que inclui o subgrupo Y. Por exemplo, para solo: típico intermediário eutrófico. tem suprapropriedade: relação taxonômica é inversa de: grande grupo inclui subgrupo tem equivalente em EN: sub group has Great Group (161) subordem inclui grande grupo (FORMAL) Definição: Y X. X é um grande grupo que está incluído na subordem Y. Por exemplo: vermelho 2,5 YR ou 10R eutrófico. tem suprapropriedade: relação taxonômica é inversa de: grande grupo tem subordem tem equivalente em EN: sub order includes Great Group (162) subespécie tem espécie (FORMAL) Definição: Y X. X é uma espécie que inclui a subespécie Y. Nota: em um sistema classificatório taxonômico, uma espécie pode ser subdividida em subespécies ou raças, muitas vezes devido às maneiras distintas de evolução das espécies. Por exemplo: Pinus nigra caramanica (turco), Pinus nigra pallasiana (crimeia) Pinus nigra (pinheiro negro). Não usar para indicar variedade (ou infraespecífico) de uma espécie (por exemplo, não usar para a espécie Clematis alpina, que tem Ruby como variedade e não subespécie). tem suprapropriedade: relação taxonômica é inversa de: espécie inclui subespécie tem equivalente em EN: subspecies has species (163) rodeado por (CONSTITUTIVO) Definição: X Y. X é um objeto que está fisicamente rodeado por Y. Por exemplo: ilha oceano; membrana celular plasma. Nota: essa relação deve ser usada somente em situações nas quais os dois conceitos estão física e imediatamente adjacentes um com o outro. tem suprapropriedade: relação espacial é inversa de: rodeia tem equivalente em EN: surrounded by (164) rodeia (CONSTITUTIVO) Definição: Y X. X é um objeto que está fisicamente rodeado por Y. Por exemplo: oceano ilha; plasma célula. Usar essa relação somente em situações nas quais os dois conceitos estão física e imediatamente adjacentes um com o outro. tem suprapropriedade: relação espacial é inversa de: rodeado por tem equivalente em EN: surrounds (165) relação taxonômica (FORMAL) Definição: X . X é cada uma das relações que vinculam táxons, taxonomicamente, em sentido científico. tem característica: simétrica tem suprapropriedade: relacional tem subpropriedade: classe inclui ordem, família tem ordem, família inclui gênero, gênero tem família, gênero inclui espécies, grande grupo tem subordem, grande grupo inclui subgrupo, tem nível taxonômico, tem variedade, é nível taxonômico de, ordem tem classe, ordem inclui família, espécie tem gênero, espécie inclui subespécies, sub grupo tem grande grupo, subordem inclui grande grupo, subespécie tem espécie. 313 é inversa de: relação taxonômica / relação taxonômica tem equivalente em EN: taxonomic relationship (166) relação temporal (AGENTIVO) Definição: X . X é cada uma das relações temporais, podendo levar em consideração os aspectos da ordem (linear, ramificado ou circular), variação e granularidade. tem característica: simétrica tem suprapropriedade: relacional tem subpropriedade: desenvolve a partir de, se desenvolve em, sucede, precede é inversa de: relação temporal / relação temporal tem equivalente em EN: temporal relations (167) tipo de (FORMAL) Definição: Y X. X é um hiperônimo do hipônimo Y, sendo que essa hierarquia não implica em uma relação gênero- espécie, todo-parte e instanciação. Nota: ver também relação “tem parte”. Por exemplo: grupo grãos, grupo olerícolas, grupo leite atividade agrícola. tem suprapropriedade: relacional é inversa de: tem tipo tem equivalente em EN: type of (168) usa processo (CONSTITUTIVA) Definição: Y X. X é um processo utilizado para obter Y. Por exemplo: limpar frutas esterilização. tem suprapropriedade: é alcançado por meio de é inversa de: é processo para tem equivalente em EN: is process for (169) utiliza valor (CONSTITUTIVA) Definição: X Y. Y é uma medida ou outro valor que expressa um número ou uma quantidade, determinada e certa, para X. Nota: X pode ser uma atividade, método particular ou qualquer outra prática que faz uso específico do valor Y. tem suprapropriedade: relação quantitativa é inversa de: valor utilizado em tem equivalente em EN: using value (170) valor utilizado em (CONSTITUTIVA) Definição: Y X. Y é uma medida ou outro valor que expressa um número ou uma quantidade, determinada e certa, para X. Nota: X pode ser uma atividade, método particular ou qualquer outra prática que faz uso específico do valor Y. tem suprapropriedade: relação quantitativa é inversa de: utiliza valor tem equivalente em EN: value used in OUTROS RELACIONAMENTOS (171) é nota de escopo (FORMAL) Definição: X <é nota de escopo> Y. X é uma nota de escopo que restringe ou expande o uso de Y dentro do escopo (âmbito) do tesauro. X pode distinguir descritores que possuem o mesmo significado na linguagem natural, mas que foram deliberadamente excluídos do vocabulário controlado, por exemplo. Nota: a nota de escopo não é uma parte do descritor, porém, pode ser fornecida para cada descritor e não-descritor. A nota de escopo X não é uma definição completa e pode ter a função de, no contexto do tesauro: (a) descrever, de forma simplificada, o significado de Y; (b) prover informações sobre a origem e os usos de Y; (c) indicar direção para o uso de outro termo melhor qualificado para um uso similar a Y; (d) guiar o uso do termo na indexação de documentos. Uma nota de escopo X pode abranger mais de uma dessas funções, conforme decisão política dos desenvolvedores do tesauro. tem suprapropriedade: relação definitória é inversa de: tem nota de escopo tem equivalente em EN: has scope note (172) tem nota de escopo (FORMAL) Definição: Y X. X é uma nota de escopo que restringe ou expande o uso de Y dentro do escopo (âmbito) do tesauro. X pode distinguir descritores que possuem o mesmo significado na linguagem natural, mas que foram deliberadamente excluídos do vocabulário controlado. Nota: a nota de escopo não é uma parte do descritor, porém, pode ser fornecida para cada descritor e não-descritor. A nota de escopo X não é uma definição completa e pode ter a função de, no contexto do tesauro: (a) descrever, de forma simplificada, o significado de Y; (b) prover informações sobre a origem e os usos de Y; (c) indicar direção para o uso de outro termo melhor qualificado para um uso similar a Y; (d) guiar o uso do termo na indexação de documentos. Uma nota de escopo X pode abranger mais de uma dessas funções, conforme decisão política dos desenvolvedores do tesauro. tem suprapropriedade: relação definitória é inversa de: é nota de escopo tem equivalente em EN: has scope note (173) nota de escopo referencia (FORMAL) Definição: X Y. X é uma nota de escopo cujo conteúdo explicativo faz referência a Y. Nota: essa relação deve ser usada entre X e Y de forma recíproca, sendo necessário produzir uma relação para cada descritor mencionado na nota de escopo X. tem suprapropriedade: relação definitória é inversa de: referenciado em nota de escopo tem equivalente em EN: scope note reference (174) referenciado em nota de escopo (FORMAL) Definição: Y X. X é uma nota de escopo cujo conteúdo explicativo faz referência a Y. Nota: essa relação deve ser usada entre X e Y de forma recíproca, sendo necessário produzir uma relação para cada descritor mencionado na nota de escopo X. tem suprapropriedade: relação definitória é inversa de: nota de escopo referencia tem equivalente em EN: referenced in scope note 314 (175) tem tradução em EN (inglês) (FORMAL) Definição: X Y. X está no idioma português e tem uma equivalência no idioma inglês Y. Por exemplo: agricultura intensiva intensive agriculture. tem suprapropriedade: relação de significação é inversa de: é tradução em EN para tem equivalente em EN: has translation in EN (176) é tradução em EN para (inglês) (FORMAL) Definição: Y <é tradução em EN para> X. X está no idioma português e tem uma equivalência no idioma inglês Y. Por exemplo: intensive agriculture <é tradução em EN para> agricultura intensiva. tem suprapropriedade: relação de significação é inversa de: tem tradução em EN tem equivalente em EN: is a translated in EN for (177) é nome institucional de (FORMAL) Definição: Y <é nome comercial de> X. Y é o nome institucional adotado por X. Por exemplo: Empresa Brasileira de Pesquisa Agropecuária <é nome institucional de> Embrapa. tem suprapropriedade: tem sinônimo é inversa de: tem nome institucional tem equivalente em EN: is a institutional name of (178) tem nome institucional (FORMAL) Definição: X Y. Y é o nome institucional adotado por X. Por exemplo: Empresa Brasileira de Pesquisa Agropecuária <é nome institucional de> Embrapa. tem suprapropriedade: tem sinônimo é inversa de: é nome institucional de tem equivalente em EN: has a institutional name (179) é específico de gênero (FORMAL) Definição: X <é específico de gênero> Y. Y é um conceito mais amplo (genérico) que a espécie X. é inversa de: tem específico de gênero tem equivalente em EN: is specific gender (180) tem específico de gênero (FORMAL) Definição: Y X. Y é um conceito mais amplo (genérico) que a espécie X. é inversa de: é específico de gênero tem equivalente em EN: has specific gender (181) é genérico de gênero (FORMAL) Definição: Y <é genérico de gênero> X. Y é um conceito mais amplo (genérico) que a espécie X. é inversa de: tem genérico de gênero tem equivalente em EN: is generic gender (182) tem genérico de gênero (FORMAL) Definição: X Y. Y é um conceito mais amplo (genérico) que a espécie X. é inversa de: é genérico de gênero tem equivalente em EN: has é genérico de gênero (183) tem equivalência com (FORMAL) Definição: X Y. X e Y mantêm uma relação de equivalência, seja de natureza ou função de sinonímia ou de string, sendo simétrica e transitiva. Nota: usar para inter-relacionar termos equivalentes entre si. é inversa de: tem equivalência com / tem equivalência com tem equivalente em EN: has is equivalent to 315 APÊNDICE F – Taxonomia das Relações do Domínio da Agricultura RELAÇÃO GÊNERO-ESPÉCIE ⁺ É ESPECÍFICO DE GÊNERO / TEM ESPECÍFICO DE GÊNERO ⁺ É GENÉRICO DE GÊNERO / TEM GENÉRICO DE GÊNERO ⁺ TAXONÔMICA ⁺⁺ classe inclui ordem / ordem tem classe ⁺⁺ classe inclui ordem / ordem tem classe ⁺⁺ é nível taxonômico de / tem nível taxonômico ⁺⁺ é nível taxonômico de / tem nível taxonômico ⁺⁺ espécie inclui subespécie / subespécie tem espécie ⁺⁺ família inclui gênero / gênero tem família ⁺⁺ gênero inclui espécie / espécie tem gênero ⁺⁺ grande grupo inclui subgrupo / subgrupo tem grande grupo ⁺⁺ ordem inclui família / família tem ordem ⁺⁺ relação taxonômica / relação taxonômica ⁺⁺ subordem inclui grande grupo / grande grupo tem subordem ⁺⁺ tem variedade / tem variedade RELAÇÃO PARTITIVA ⁺ É ESTUDADO POR / ESTUDA ⁺ É MEMBRO DE / TEM MEMBRO ⁺ É PARTE DE / TEM PARTE DE ⁺⁺ é composto de / compõe ⁺⁺ é componente de / tem componente ⁺⁺ é composição de / tem composição ⁺⁺ espacialmente inclui / está espacialmente incluído em RELAÇÃO DE INSTÂNCIA ⁺ TIPO DE / TEM TIPO ⁺ INSTÂNCIA DE / TEM INSTÂNCIA RELAÇÃO DE STRING ⁺ É ABREVIATURA DE / TEM ABREVIATURA ⁺⁺ é acrônimo de / tem acrônimo ⁺ É FÓRMULA QUÍMICA DE / TEM FÓRMULA QUÍMICA ⁺ É NOME LOCAL / TEM NOME LOCAL ⁺ É SÍMBOLO / TEM SÍMBOLO ⁺ É TRANSLITERAÇÃO DE / TEM TRANSLITERAÇÃO ⁺ TEM VARIAÇÃO ORTOGRÁFICA / TEM VARIAÇÃO ORTOGRÁFICA 316 RELAÇÃO DE EQUIVALÊNCIA ⁺ É TRADUÇÃO EM EN PARA / TEM TRADUÇÃO EM EN ⁺ TEM ANTÔNIMO OU TEM OPOSTO / TEM ANTÔNIMO OU TEM OPOSTO ⁺ TEM SINÔNIMO / TEM SINÔNIMO ⁺⁺ é nome antigo / tem nome antigo ⁺⁺ é nome científico de / tem nome científico ⁺⁺ é nome comercial / tem nome comercial ⁺⁺ é nome institucional / tem nome institucional ⁺⁺ tem sinonímia aproximada / tem sinonímia aproximada ⁺⁺ tem sinônimo mais amplo / tem sinônimo mais específico ⁺ USE / USE RELAÇÃO ASSOCIATIVA ⁺ É ALCANÇADO POR MEIO DE / TEM OBJETIVO OU PROCESSO ⁺⁺ é processo para / usa processo ⁺ É AMBIENTE DE CRESCIMENTO PARA / CRESCE EM ⁺ É ASCENDENTE DE / TEM ASCENDENTE ⁺ É ERVA DANINHA DE / TEM ERVA DANINHA ⁺ É FONTE DE / É DERIVADO DE ⁺ É INFLUENCIADO POR OU DEPENDE DE / INFLUENCIA ⁺ É INSUMO PARA / TEM INSUMO ⁺ É MATERIAL DE PROPAGAÇÃO / TEM MATERIAL DE PROPAGAÇÃO ⁺ É MEDIDO POR / MEDE ⁺ É MEIO PARA / É REALIZADO POR MEIO DE ⁺ É REALIZADO POR MEIO DE / É MEIO PARA ⁺ É SUBSTITUTO DE / TEM SUBSTITUTO ⁺ É USADO COMO / É USO DE ⁺ É USADO EM / FAZ USO DE ⁺ É USADO PARA FAZER / É FEITO A PARTIR DE ⁺ HOSPEDA OU É VETOR DE / TEM VETOR OU É HOSPEDADO EM ⁺ INCLUI / INCLUÍDO EM ⁺⁺ incluía anteriormente / anteriormente incluído em ⁺⁺ é subprocesso de / inclui subprocesso ⁺ INDICA / TEM SINTOMA ⁺ MAIOR QUE / MENOR QUE ⁺ RELAÇÃO CAUSAL / RELAÇÃO CAUSAL ⁺⁺ atua sobre / sofre atuação de ⁺⁺ é afetado por / afeta ⁺⁺⁺ Relação de efeito / Relação de efeito ⁺⁺⁺⁺ é afligido por / aflige ⁺⁺ é agente de controle biológico de / tem agente de controle biológico ⁺⁺ é agente patogênico de / tem agente patogênico ⁺⁺ é benéfico para / tem benefício de ⁺⁺ é causada por / causa 317 ⁺⁺ é controlado por / controla ⁺⁺ é distúrbio de / tem distúrbio ⁺⁺ é doença para / tem doença ⁺⁺ é função fisiológica de / tem função fisiológica ⁺⁺ é inimigo natural de / tem inimigo natural ⁺⁺ é método de controle de / tem método de controle ⁺⁺ é método de reprodução de / tem método de reprodução ⁺⁺ é objeto de atividade de / tem objeto de atividade ⁺⁺ é parte infectada de / tem parte infectada ⁺⁺ é praga de / tem praga ⁺⁺ é prática para / tem prática ⁺⁺⁺ é prática de pós-produção para / tem prática de pós-produção ⁺⁺ é prevenido através de / previne ⁺⁺ é processo de cultivo de / tem processo de cultivo ⁺⁺ é processo de propagação de / tem processo de propagação ⁺⁺ é produzido por / produz ⁺⁺ é propriedade de / tem propriedade ⁺⁺ é realizado por / executa ⁺⁺ é sistema de cultivo de / tem sistema de cultivo ⁺⁺ é tema de / tem tema ⁺⁺ é tipo relacionado a / tem tipo relacionado ⁺⁺ produto de / tem produto ⁺ RELAÇÃO TEMPORAL / RELAÇÃO TEMPORAL ⁺⁺ se desenvolve em / desenvolve a partir de ⁺⁺ sucede / precede ⁺ RODEADO POR / RODEIA ⁺ UTILIZA VALOR / VALOR UTILIZADO EM RELAÇÃO DEFINITÓRIA ⁺ É NOTA DE ESCOPO / TEM NOTA DE ESCOPO ⁺ NOTA DE ESCOPO REFERENCIA / REFERENCIADO EM NOTA DE ESCOPO 318 APÊNDICE G – Estrutura Semântica Final 1 INTENSIFICAÇÃO AGROPECUÁRIA temTraduçãoEN (EQ-EN) AGRICULTURAL INTENSIFICATION temParte (TEP) AGRONOMIA temParte (TEP) INSTITUIÇÕES temParte (TEP) SOCIOECONOMIA termoEspecíficoGênero (TEG) AGRICULTURA EXTENSIVA termoEspecíficoGênero (TEG) AGRICULTURA INTENSIVA termoEspecíficoGênero (TEG) ESPAÇO E TEMPO termoEspecíficoGênero (TEG) MATERIAL E MÉTODOS termoEspecíficoGênero (TEG) AMBIENTE termoEspecíficoGênero (TEG) TERRITÓRIO E PAISAGEM 2 AGRICULTURA EXTENSIVA temTraduçãoEN (EQ-EN) EXTENSIVE AGRICULTURE temSinonímiaAproximada (UP EQ-APR) FRONTEIRA AGRÍCOLA temSinônimo (UP EQ-SIN) PRODUÇÃO EXTENSIVA termoGenéricoGênero (TGG) SISTEMA DE EXPLORAÇÃO AGRÍCOLA termoEspecíficoGênero (TEG) ATIVIDADE PASTORIL termoEspecíficoGênero (TEG) CRIAÇÃO EXTENSIVA termoEspecíficoGênero (TEG) EXTENSIFICAÇÃO incluídoEm (TR) AGRICULTURA COM BAIXO INVESTIMENTO éPráticaPara (TR) GRANDE EXPLORAÇÃO AGRÍCOLA temObjetivoOuProcesso (TR) UTILIZAÇÃO EXTENSIVA DA TERRA inclui (TR) SISTEMA AGROPASTORIL influencia (TR) PRODUÇÃO 3 AGRICULTURA INTENSIVA temTraduçãoEN (EQ-EN) INTENSIVE FARMING temSinonímiaAproximada (UP EQ-APR) AGRICULTURA INDUSTRIAL temSinônimo (UP EQ-SIN) EXPLORAÇÃO AGRÍCOLA INTENSIVA temSinônimo (UP EQ-SIN) PRODUÇÃO INTENSIVA termoGenéricoGênero (TGG) INTENSIFICAÇÃO AGROPECUÁRIA termoGenéricoGênero (TGG) SISTEMA DE EXPLORAÇÃO AGRÍCOLA termoEspecíficoGênero (TEG) CULTIVO INTENSIVO termoEspecíficoGênero (TEG) PECUÁRIA INTENSIVA termoEspecíficoGênero (TEG) INTENSIFICAÇÃO SUSTENTÁVEL termoEspecíficoGênero (TEG) INTENSIFICAÇÃO temObjetivoOuProcesso (TR) UTILIZAÇÃO INTENSIVA DA TERRA influencia (TR) PRODUÇÃO MATERIAL E MÉTODOS 4 Cultura temNotaDeEscopo (NE) NE-1 Todas as plantas úteis, cultivadas ou não. temTraduçãoEN (EQ-EN) CROP UP VEGETAL PRODUCTION temSinonímiaAproximada (UP EQ-APR) PLANTAS ECONÔMICAS temSinônimo (UP EQ-SIN) PLANTA CULTIVADA temSinônimo (UP EQ-SIN) PLANTAS ÚTEIS temSinônimoEspecífico (UP EQ-TE) PRODUÇÃO VEGETAL éParteDe (TGP) AGRONOMIA termoGenéricoGênero (TGG) MATERIAL E MÉTODOS termoGenéricoGênero (TGG) PLANTAS termoEspecíficoGênero (TEG) CULTURA ARÁVEL termoEspecíficoGênero (TEG) CULTURA AUTÓCTONE termoEspecíficoGênero (TEG) CULTURA CÍCLICA termoEspecíficoGênero (TEG) CULTURA CONSORCIADA termoEspecíficoGênero (TEG) CULTURA DE AÇÚCAR termoEspecíficoGênero (TEG) CULTURA DE ALIMENTO termoEspecíficoGênero (TEG) CULTURA DE AMIDO termoEspecíficoGênero (TEG) CULTURA DE BORRACHA termoEspecíficoGênero (TEG) CULTURA DE CABAÇA termoEspecíficoGênero (TEG) CULTURA DE CAMPO termoEspecíficoGênero (TEG) CULTURA DE ESPECIARIA 319 termoEspecíficoGênero (TEG) CULTURA DE FRUTA termoEspecíficoGênero (TEG) CULTURA DE GRÃO termoEspecíficoGênero (TEG) CULTURA DE INVERNO termoEspecíficoGênero (TEG) CULTURA DE OLEAGINOSA termoEspecíficoGênero (TEG) CULTURA DE ÓLEOS ESSENCIAL termoEspecíficoGênero (TEG) CULTURA DE PESTICIDA termoEspecíficoGênero (TEG) CULTURA DE PORTA-ENXERTO termoEspecíficoGênero (TEG) CULTURA DE PRIMAVERA termoEspecíficoGênero (TEG) CULTURA DE RAÍZ termoEspecíficoGênero (TEG) CULTURA DE SEMENTE termoEspecíficoGênero (TEG) CULTURA DE TERRAS ALTAS termoEspecíficoGênero (TEG) CULTURA EM ESTUFA termoEspecíficoGênero (TEG) CULTURA ENERGETICA termoEspecíficoGênero (TEG) CULTURA ESTIMULANTE termoEspecíficoGênero (TEG) CULTURA ESTRUTURAL termoEspecíficoGênero (TEG) CULTURA FIBRA termoEspecíficoGênero (TEG) CULTURA FORRAGEIRA termoEspecíficoGênero (TEG) CULTURA INDUSTRIAL termoEspecíficoGênero (TEG) CULTURA INTERCALAR termoEspecíficoGênero (TEG) CULTURA NUT termoEspecíficoGênero (TEG) CULTURA PARA ALIMENTAÇÃO ANIMAL termoEspecíficoGênero (TEG) CULTURA PARA ARMADILHA termoEspecíficoGênero (TEG) CULTURA PARA BEBIDA termoEspecíficoGênero (TEG) CULTURA PARA COMBUSTÍVEL termoEspecíficoGênero (TEG) CULTURA PARA SALADA termoEspecíficoGênero (TEG) CULTURA PERENE termoEspecíficoGênero (TEG) CULTURA TROPICAL termoEspecíficoGênero (TEG) ERVA CULINÁRIA termoEspecíficoGênero (TEG) HORTALIÇA termoEspecíficoGênero (TEG) IMPLANTACAO DE CULTURA termoEspecíficoGênero (TEG) LAVOURA termoEspecíficoGênero (TEG) PLANTA APÍCOLA termoEspecíficoGênero (TEG) PLANTA DE CERA termoEspecíficoGênero (TEG) PLANTA DE COBERTURA termoEspecíficoGênero (TEG) PLANTA DE CONTROLE DE EROSÃO termoEspecíficoGênero (TEG) PLANTA DE DROGAS termoEspecíficoGênero (TEG) PLANTA DE PROTEÇÃO termoEspecíficoGênero (TEG) PLANTA DE RECUPERAÇÃO DE SOLO termoEspecíficoGênero (TEG) PLANTA DE REVEGETAÇÃO termoEspecíficoGênero (TEG) PLANTA DE SOMBRA termoEspecíficoGênero (TEG) PLANTA PARA RUMINANTE termoEspecíficoGênero (TEG) PLANTA TAN termoEspecíficoGênero (TEG) PLANTA TINTUREIRA termoEspecíficoGênero (TEG) PLANTAÇÃO DE ÁRVORE termoEspecíficoGênero (TEG) PLANTA-MÃE termoEspecíficoGênero (TEG) PROTEAGINOSA éInfluenciadaPorOuDependeDe (TR) CALENDÁRIO AGRÍCOLA éInfluenciadaPorOuDependeDe (TR) TAXA DE LOTAÇÃO éInfluenciadaPorOuDependeDe (TR) CICLO DA CULTURA temBenefícioAPartirDe (TR) ÁRVORE QUEBRA-VENTO temBenefícioAPartirDe (TR) MELHORAMENTO VEGETAL temBenefícioAPartirDe (TR) PLANTA SELVAGEM temPrática (TR) DOMESTICAÇÃO 5 sensoriamento remoto temTraduçãoEN (EQ-EN) REMOTE SENSING temSinonímiaAproximada (UP EQ-APR) IMAGEM DE SATELITE éParteDe (TGP) AGRIMENSURA éParteDe (TGP) GEOMETRIA GEOESPACIAL termoGenéricoGênero (TGG) MATERIAL E MÉTODOS fazUsoDe (TR) AEROFOTOGRAMETRIA fazUsoDe (TR) AVHRR fazUsoDe (TR) IMAGEM ESPECTRAL fazUsoDe (TR) IMAGEM LOCAL fazUsoDe (TR) IMAGEM DE SATÉLITE fazUsoDe (TR) LEVANTAMENTO AÉREO fazUsoDe (TR) MAPAS 320 fazUsoDe (TR) PROCESSAMENTO DE IMAGEM fazUsoDe (TR) RADAR fazUsoDe (TR) SATÉLITE fazUsoDe (TR) SATÉLITE DE OBSERVAÇÃO DA TERRA fazUsoDe (TR) SENSOR fazUsoDe (TR) SENSOR REMOTO fazUsoDe (TR) SISTEMA DE POSICIONAMENTO GLOBAL usaProcesso (TR) FOTOGRAMETRIA usaProcesso (TR) TELEMETRIA 6 sistema de informação geográfica temTraduçãoEN (EQ-EN) GEOGRAPHIC INFORMATION SYSTEM temAcrônimo (UP EQS-ACR) SIG temSinonímiaAproximada (UP EQ-APR) SISTEMA DE INFORMAÇÃO GEOESPACIAL termoGenéricoGênero (TGG) MATERIAL E MÉTODOS termoGenéricoGênero (TGG) SISTEMA DE INFORMAÇÃO termoGenéricoGênero (TGG) TECNOLOGIA GEOESPACIAL termoEspecíficoGênero (TEG) SISTEMA DE OBSERVAÇÃO DA TERRA éComponenteDe (TGP) SISTEMAS DE SUPORTE afeta (TR) AGRICULTURA DE PRECISÃO fazUsoDe (TR) CARTOGRAFIA fazUsoDe (TR) SISTEMA DE POSICIONAMENTO GLOBAL inclui (TR) DADO ESPACIAL AMBIENTE 7 meio ambiente temTraduçãoEN (EQ-EN) ENVIRONMENT temSinonímiaAproximada (UP EQ-APR) NATUREZA temSinonímiaAproximada (UP EQ-APR) ZONAS ECOLÓGICAS termoGenéricoGênero (TGG) AMBIENTE termoGenéricoGênero (TGG) ENTIDADES termoEspecíficoGênero (TEG) AMBIENTE AQUÁTICO termoEspecíficoGênero (TEG) AMBIENTE BIÓTICO termoEspecíficoGênero (TEG) AMBIENTE ECONÔMICO termoEspecíficoGênero (TEG) AMBIENTE FÍSICO termoEspecíficoGênero (TEG) AMBIENTE NATURAL termoEspecíficoGênero (TEG) ECOSISTEMA termoEspecíficoGênero (TEG) FATOR AMBIENTAL termoEspecíficoGênero (TEG) HABITAT termoEspecíficoGênero (TEG) RECURSO NATURAL termoEspecíficoGênero (TEG) ZONAS RIBEIRINHAS temComponente (TEP) ECOSSISTEMA temComponente (TEP) FATOR AMBIENTAL afeta (TR) AMBIENTE SOCIOCULTURAL afeta (TR) AMBIENTE SOCIOECONÔMICO afeta (TR) INTERAÇÃO GENÉTICA afeta (TR) SUSTENTABILIDADE afeta (TR) VEGETAÇÃO afeta (TR) ZONA URBANA afeta (TR) ZONEAMENTO ECOLÓGICO éAfetadoPor (TR) BIODEGRADAÇÃO éAfetadoPor (TR) CATÁSTROFE NATURAL éAfetadoPor (TR) EDUCAÇÃO AMBIENTAL éAfetadoPor (TR) FOGO éAfetadoPor (TR) FATOR CLIMÁTICO éAfetadoPor (TR) IMPACTO AMBIENTAL éAfetadoPor (TR) POLUIÇÃO AMBIENTAL éAfetadoPor (TR) SUBSTÂNCIA TÓXICA éAfetadoPor (TR) TEMPERATURA éInfluenciadoPor (TR) POLÍTICA AMBIENTAL éInfluenciadoPor (TR) AVALIAÇÃO DO IMPACTO AMBIENTAL éInfluenciadoPor (TR) AGRICULTURA SUSTENTÁVEL fazUsoDe (TR) ECOLOGIA influencia (TR) AEROBIOSE influencia (TR) AGRICULTURA SUSTENTÁVEL 321 influencia (TR) ANAEROBIOSE influencia (TR) AVALIAÇÃO DO IMPACTO AMBIENTAL influencia (TR) BIOSSEGURANÇA influencia (TR) MICROCLIMA influencia (TR) POLÍTICA AMBIENTAL usaProcesso (TR) ZONEAMENTO ECOLÓGICO 8 ambiente físico temNotaDeEscopo (NE) NE-2 Conjunto de recursos físicos e químicos, representado pelos fatores abióticos que compõem o meio ambiente. temTraduçãoEN (EQ-EN) PHISICAL ENVIRONMENT termoGenéricoGênero (TGG) MEIO AMBIENTE termoEspecíficoGênero (TEG) ÁGUA termoEspecíficoGênero (TEG) AR termoEspecíficoGênero (TEG) SOLO éInfluenciadoPor (TR) CAMPO MAGNÉTICO éInfluenciadoPor (TR) FATOR CLIMÁTICO éInfluenciadoPor (TR) SEDIMENTAÇÃO incluídoEm (TR) BIOMA influencia (TR) PROCESSO QUÍMICO afeta (TR) SOCIOECONOMIA 9 solo temNotaDeEscopo (NE) NE-3 Camada superior da terra, em que as plantas crescem; para os diferentes tipos de solo de uma região, país, etc., usar temTraduçãoEN (EQ-EN) SOIL éParteDe (TGP) CIÊNCIA DO SOLO termoGenéricoGênero (TGG) COBERTURA DA TERRA termoGenéricoGênero (TGG) AMBIENTE termoEspecíficoGênero (TEG) CONSERVAÇÃO DO SOLO termoEspecíficoGênero (TEG) FATOR MORFOLÓGICO DO SOLO termoEspecíficoGênero (TEG) FORMAÇÃO DO SOLO termoEspecíficoGênero (TEG) TIPOS DE SOLO éCompostoDe (TEP) MATÉRIA ORGÂNICA DO SOLO éCompostoDe (TEP) MINERAL DO SOLO temComponente (TEP) AR DO SOLO temComponente (TEP) ÁGUA DO SOLO temParte (TEP) RIZOSFERA temParte (TEP) SOLO SUPERIOR temParte (TEP) SUBSOLO éInfluenciadoPor (TR) BIOTA DO SOLO éUtilizadoComo (TR) SUBSTRATO DE CULTURA influencia (TR) LIXIVIADO influencia (TR) MANEJO DO SOLO influencia (TR) PERDA DE SOLO influencia (TR) RESTO DE CULTURA usaProcesso (TR) MELHORAMENTO DO SOLO usaProcesso (TR) MANEJO DE SOLO AGRONOMIA 10 manejo da cultura temNotaDeEscopo (NE) NE-4 Decisões sobre práticas culturais, do plantio à colheita. temTraduçãoEN (EQ-EN) CROP MANAGEMENT temVariaçãoOrtográfica (UP EQS-ORT) MANEJO DE CULTURA termoGenéricoGênero (TGG) MANEJO éParteDe (TGP) AGRONOMIA éParteDe (TGP) CIÊNCIA VEGETAL termoEspecíficoGênero (TEG) MANEJO DE PRAGA termoEspecíficoGênero (TEG) MANEJO DE RESÍDUO DE CULTURA termoEspecíficoGênero (TEG) MANEJO INTEGRADO DA CULTURA termoEspecíficoGênero (TEG) VIVEIROS temComponente (TEP) CULTURA temComponente (TEP) ESCOLHA DE ESPÉCIES temComponente (TEP) OPERAÇÃO DE PRÉ-COLHEITA temComponente (TEP) PADRÕES DE CULTIVO 322 temComponente (TEP) PROGRAMAÇÃO DE IRRIGAÇÃO temComponente (TEP) SISTEMAS DE CULTIVO temComponente (TEP) TRATAMENTO PRÉ-COLHEITA éInfluenciadoPor (TR) ESTÁGIO DA CULTURA fazUsoDe (TR) MANEJO DE FERTILIDADE fazUsoDe (TR) MÉTODO DE PLANTIO fazUsoDe (TR) MÉTODO DE SEMEADURA inclui (TR) MÉTODO DE CULTURA influencia (TR) FREQUÊNCIA DE COLHEITA utilizaValor (TR) CALENDÁRIO DE COLHEITA utilizaValor (TR) CUSTO DAS MUDAS utilizaValor (TR) CUSTO DE APLICAÇÃO utilizaValor (TR) CUSTO DE IRRIGAÇÃO utilizaValor (TR) DENSIDADES DE SEMEADURA utilizaValor (TR) ÉPOCA DE SEMEADURA utilizaValor (TR) ESPAÇAMENTO ENTRE MUDAS utilizaValor (TR) PERÍODO DE PLANTIO utilizaValor (TR) PERÍODO DE TRATAMENTO utilizaValor (TR) PROFUNDIDADE DE SEMEADURA utilizaValor (TR) TEMPO DE REPLANTAR éInfluenciado (TR) AMBIENTE FÍSICO 11 manejo do solo temTraduçãoEN (EQ-EN) SOIL MANAGEMENT temSinonímiaAproximada (UP EQ-APR) PREPARO DO SOLO termoGenéricoGênero (TGG) MANEJO DE RECURSOS NATURAIS termoGenéricoGênero (TGG) PRÁTICA DE MANEJO éParteDe (TGP) AGRONOMIA éParteDe (TGP) CIÊNCIA DO SOLO termoEspecíficoGênero (TEG) CALAGEM termoEspecíficoGênero (TEG) COBERTURAS termoEspecíficoGênero (TEG) CONSERVAÇÃO DO SOLO termoEspecíficoGênero (TEG) CONTROLE DE SALINIDADE termoEspecíficoGênero (TEG) DRENAGEM termoEspecíficoGênero (TEG) FERTILIZANTES termoEspecíficoGênero (TEG) FUMIGAÇÃO termoEspecíficoGênero (TEG) IRRIGAÇÃO termoEspecíficoGênero (TEG) PREPARAÇÃO LOCAL termoEspecíficoGênero (TEG) PROTEÇÃO DO SOLO termoEspecíficoGênero (TEG) TRATAMENTO DO SOLO afeta (TR) SUSTENTABILIDADE éProcessoPara (TR) SOLO fazUsoDe (TR) MÉTODO ALTERNATIVO fazUsoDe (TR) TERRAÇO inclui (TR) ESTERILIZAÇÃO inclui (TR) MELHORIA DO SOLO inclui (TR) POUSIO inclui (TR) PRÁTICA DE CULTURA VEGETAL influencia (TR) APLICAÇÃO DE FERTILIZANTES influencia (TR) AQUECIMENTO DO SOLO influencia (TR) CULTURA influencia (TR) MANEJO DA ÁGUA temObjetoDeAtividade (TR) EQUIPAMENTO DE MANEJO DO SOLO temPrática (TR) ESCARIFICAÇÃO DO SOLO temPrática (TR) RECUPERAÇÃO temPrática (TR) TERRAPLANAGEM 12 pousio temNotaDeEscopo (NE) NE-5 Período de tempo em que a terra permanece não cultivada, por exemplo, entre uma safra e outra, em ciclos culturais anuais. temTraduçãoEN (EQ-EN) FALLOW temSinônimo (UP EQ-SIN) CULTIVO POUSIO termoGenéricoGênero (TGG) PRÁTICA DE MANEJO termoGenéricoGênero (TGG) SISTEMAS DE CULTIVO éParteDe (TGP) AGRONOMIA termoEspecíficoGênro (TEG) PERÍODO DE POUSIO incluídoEm (TR) PREPARAÇÃO DO SOLO 323 influencia (TR) SISTEMAS DE POUSIO éAfetadoPor (TR) CICLO DA CULTURA éAfetadoPor (TR) CULTURA ANUAL 13 período de pousio temTraduçãoEN (EQ-EN) FALLOW PERIOD termoGenéricoGênero (TGG) POUSIO termoEspecíficoGênero (TEG) POUSIO NU termoEspecíficoGênero (TEG) POUSIO LONGO termoEspecíficoGênero (TEG) POUSIO CURTO afeta (TR) SUSTENTABILIDADE afeta (TR) SOCIOECONOMIA 14 pesticida temTraduçãoEN (EQ-EN) PESTICIDES temSinônimo (UP EQ-SIN) PRAGUICIDA éProdutoDe (TGG) INDÚSTRIA DE PESTICIDA termoGenéricoGênero (TGG) MANEJO DE PRAGA termoGenéricoGênero (TGG) SUBSTÂNCIA QUÍMICA termoEspecíficoGênero (TEG) ACARICIDA termoEspecíficoGênero (TEG) AVICIDA termoEspecíficoGênero (TEG) BIOPESTICIDA termoEspecíficoGênero (TEG) CARRAPATICIDA termoEspecíficoGênero (TEG) FUNGICIDA termoEspecíficoGênero (TEG) GERMICIDA termoEspecíficoGênero (TEG) HERBICIDA termoEspecíficoGênero (TEG) INSETICIDA termoEspecíficoGênero (TEG) MOLUSCICIDA termoEspecíficoGênero (TEG) NEMATICIDA termoEspecíficoGênero (TEG) OVICIDA termoEspecíficoGênero (TEG) PESTICIDA ORGANOESTÂNICO termoEspecíficoGênero (TEG) PESTICIDA SINÉRGICO termoEspecíficoGênero (TEG) PESTICIDAS DE LIBERAÇÃO LENTA termoEspecíficoGênero (TEG) PESTICIDAS ORGANOCLORADO termoEspecíficoGênero (TEG) RATICIDA termoEspecíficoGênero (TEG) REPELENTE termoEspecíficoGênero (TEG) RODENTICIDA temComponente (TEP) BÓRAX temComponente (TEP) ADJUVANTES temComponente (TEP) INGREDIENTE ATIVO temComponente (TEP) REPELENTES temComponente (TEP) PRODUTOS QUÍMICOS afeta (TR) CONTROLE DE PRAGA causa (TR) POLUIÇÃO éControladoPor (TR) SEGURANÇA NO USO DE PESTICIDA éFeitoAPartirDe (TR) ADJUVANTE PESTICIDA éFeitoAPartirDe (TR) SUBSTÂNCIA TÓXICA éUsadoComo (TR) CONSERVANTE DE MADEIRA éUtilizadoComo (TR) APLICAÇÃO DE PESTICIDA influencia (TR) ENCHARCAMENTO DO SOLO seDesenvolveEm (TR) RESÍDUOS DE PESTICIDAS temMétodoDeControle (TR) CONTROLE QUÍMICO temPropriedade (TR) AÇÃO SISTÊMICA temPropriedade (TR) ESTRUTURA RELAÇÃO DE ATIVIDADE temPropriedade (TR) INGESTÃO DIÁRIA ACEITÁVEL temPropriedade (TR) MODO DE AÇÃO temPropriedade (TR) PROPRIEDADES PESTICIDAS temPropriedade (TR) RESISTÊNCIA A PESTICIDAS temPropriedade (TR) RESISTENCIA QUIMICA usaProcesso (TR) APLICAÇÃO FOLIAR usaProcesso (TR) TRATAMENTO DE SEMENTES 15 ciclo da cultura temTraduçãoEN (EQ-TEN) CROP CYCLE temSinônimo (UP EQ-SIN) CICLO DA PLANTA éParteDe (TGP) AGRONOMIA termoEspecíficoGênero (TEG) ESTÁGIO DA CULTURA 324 afeta (TR) MANEJO DA CULTURA afeta (TR) MANEJO DO SOLO afeta (TR) POUSIO influencia (TR) CULTURA influencia (TR) PERÍODO DE TRATAMENTO 16 cultura anual temTraduçãoEN (EQ-EN) ANNUAL PLANT temSinonímiaAproximada (UP EQ-APR) CULTURA DE CICLO CURTO temSinônimo (UP EQ-SIN) PLANTA ANUAL termoGenéricoGênero (TGG) CULTURA CÍCLICA termoGenéricoGênero (TGG) SISTEMAS DE CULTIVO termoEspecíficoGênero (TEG) CULTURA DE CEREAL termoEspecíficoGênero (TEG) CULTURA DE GRÃO termoEspecíficoGênero (TEG) ERVA DANINHA ANUAL termoEspecíficoGênero (TEG) PLANTA ANUAL DE JARDIM termoEspecíficoGênero (TEG) PLANTA ANUAL ORNAMENTAL temComponente (TEP) PLANTA HERBÁCEA afeta (TR) POUSIO éTipoRelacionadoA (TR) PORTE DA PLANTA 17 pecuária temTraduçãoEN (EQ-EN) LIVESTOCK temSinonímiaAproximada (UP EQ-APR) ANIMAL DE FAZENDA temSinonímiaAproximada (UP EQ-APR) ESTOQUE DE ANIMAL temSinonímiaAproximada (UP EQ-APR) PECUÁRIA E AGRICULTURA termoGenéricoGênero (TGG) ANIMAL DOMÉSTICO termoGenéricoGênero (TGG) ANIMAL éParteDe (TGP) AGRONOMIA termoEspecíficoGênero (TEG) ANIMAIS MONOGÁSTRICOS termoEspecíficoGênero (TEG) AVES termoEspecíficoGênero (TEG) BOVINOS E BUBALINOS termoEspecíficoGênero (TEG) CAPRINOS E OVINOS termoEspecíficoGênero (TEG) EQUÍDEOS termoEspecíficoGênero (TEG) PECUÁRIA EXTENSIVA termoEspecíficoGênero (TEG) PECUÁRIA INTENSIVA termoEspecíficoGênero (TEG) PEIXES termoEspecíficoGênero (TEG) SUÍNOS temParte (TEP) CIRCUITO PECUÁRIO CENTRO-OESTE temParte (TEP) CIRCUITO PECUÁRIO LESTE temParte (TEP) CIRCUITO PECUÁRIO NORDESTE temParte (TEP) CIRCUITO PECUÁRIO NORTE temParte (TEP) CIRCUITO PECUÁRIO SUL afeta (TR) INDÚSTRIA PECUÁRIA éInfluenciadoPorOuDependeDe (TR) REPRODUÇÃO ANIMAL inclui (TR) ANIMAIS DE TRABALHO inclui (TR) PECUÁRIA DE CORTE inclui (TR) PECUÁRIA DE LÃ inclui (TR) PECUÁRIA DE LEITE influencia (TR) PRODUÇÃO ANIMAL utilizaValor PREÇO DO ANIMAL 18 adubo verde temNotaDeEscopo (NE) NE-6 Subprodutos de culturas ou restos culturais incorporados ao solo, enquanto ainda não apodrecidos, para melhorar a preparação do solo. temTraduçãoEN (EQ-EN) GREEN MANURES temSinônimo (UP EQ-SIN) ADUBO ORGÂNICO termoGenéricoGênero (TGG) ADUBO termoGenéricoGênero (TGG) FERTILIZANTE ORGÂNICO éUsadoComo (TR) ADUBAÇÃO VERDE éUsadoComo (TR) PLANTA DE COBERTURA éUsadoEm (TR) CULTURA fazUsoDe (TR) GLIRICIDIA fazUsoDe (TR) VIGNA VEXILLATA incluídoEm (TR) PRÁTICA DE CONSERVAÇÃO 325 19 produto agropecuário temNotaDeEscopo (NE) NE-7 Produtos em seu estado original ou processados, disponíveis para venda (marketing). temTraduçãoEN (EQ-EN) AGRICULTURAL PRODUCTS temSinonímiaAproximada (UP EQ-APR) COMMODITIE AGRÍCOLA temSinonímiaAproximada (UP EQ-APR) MERCADORIAS temSinônimo (UP EQ-SIN) PRODUTO AGRÍCOLA temSinônimo (UP EQ-SIN) PRODUTO DA AGRICULTURA termoGenéricoGênero (TGG) BENS POR ATACADO termoGenéricoGênero (TGG) PRODUTO termoEspecíficoGênero (TEG) BIOPRODUTO termoEspecíficoGênero (TEG) PRODUTO ALIMENTÍCIO termoEspecíficoGênero (TEG) PRODUTO DA PESCA termoEspecíficoGênero (TEG) PRODUTO DE CELULOSE termoEspecíficoGênero (TEG) PRODUTO DE ORIGEM ANIMAL termoEspecíficoGênero (TEG) PRODUTO DE ORIGEM VEGETAL termoEspecíficoGênero (TEG) PRODUTO FEITO DE INSETO termoEspecíficoGênero (TEG) PRODUTO FORA DA ÉPOCA termoEspecíficoGênero (TEG) PRODUTO PARA ALIMENTAÇÃO ANIMAL termoEspecíficoGênero (TEG) PRODUTO PERECÍVEL termoEspecíficoGênero (TEG) PRODUTO VEGETAL termoEspecíficoGênero (TEG) PRODUTO FLORESTAL temComponente (TEP) PRODUTO ARMAZENADO temComponente (TEP) PRODUTO FRESCO temComponente (TEP) PRODUTO PROCESSADO temComponente (TEP) SUBPRODUTO afeta (TR) ECONOMIA AGRÍCOLA éInsumoPara (TR) AGRONEGÓCIO influencia (TR) BOLSA DE MERCADORIA usaProcesso (TR) ROTULAGEM DE PRODUTO 20 biomassa temNotaDeEscopo (NE) NE-8 Quantidade total ou o peso de organismos disponíveis numa dada área. temTraduçãoEN (EQ-EN) BIOMASS temSinônimo (UP EQ-SIN) BIOMASSA DA CULTURA temSinônimo (UP EQ-SIN) BIOMASSA DA PLANTA termoGenéricoGênero (TGG) RECURSO BIOLÓGICO termoGenéricoGênero (TGG) SUBSTÂNCIAS éComponenteDe (TGP) CULTURA ENERGÉTICA éComponenteDe (TGP) RECURSO RENOVÁVEL éParteDe (TGP) AGRONOMIA termoEspecíficoGênero (TEG) BIOMASSA AÉREA termoEspecíficoGênero (TEG) BIOMASSA MICROBIANA termoEspecíficoGênero (TEG) BIOMASSA SUBTERRÂNEA termoEspecíficoGênero (TEG) FITOMASSA afeta (TR) ACUMULAÇÃO DE MATÉRIA SECA inclui (TR) BIOCARVÃO inclui (TR) MATÉRIA ORGÂNICA influencia (TR) BIOENERGIA influencia (TR) ÍNDICE DE VEGETAÇÃO influencia (TR) PRODUTIVIDADE PRIMÁRIA produtoDe (TR) PRODUÇÃO DE BIOMASSA usaProcesso (TR) BIOREFINAMENTO utilizaValor (TR) AREA utilizaValor (TR) MASSA utilizaValor (TR) PESO utilizaValor (TR) VOLUME TERRITÓRIO E PAISAGEM 21 posse da terra temTraduçãoEN (EQ-EN) LAND TENURE temSinonímiaAproximada (UP EQ-APR) SISTEMA FUNDIÁRIO temSinônimo (UP EQ-SIN) SISTEMA DE POSSE temVariaçãoOrtográfica (UP EQS-ORT) TERRA, POSSE DA termoGenéricoGênero (TGG) ECONOMIA DA TERRA 326 termoGenéricoGênero (TGG) POSSE termoGenéricoGênero (TGG) PROPRIEDADE RURAL termoGenéricoGênero (TGG) TERRITÓRIO E PAISAGEM termoEspecíficoGênero (TEG) LATIFUNDIO termoEspecíficoGênero (TEG) MINIFUNDIO éInfluenciadoPor (TR) ARRENDAMENTO éInfluenciadoPor (TR) DESAPROPRIAÇAO éInfluenciadoPor (TR) POSSEIRO éInfluenciadoPor (TR) REFORMA AGRÁRIA éInfluenciadoPor (TR) RENDA DA TERRA inclui (TR) LEASING influencia (TR) DIREITO À TERRA influencia (TR) DIREITO DE POSSE influencia (TR) MUDANÇA DE COBERTURA DAS TERRAS influencia (TR) USUCAPIÃO 22 escassez de terra temTraduçãoEN (EQ-EN) LAND SCARCITY termoGenéricoGênero (TGG) TERRITÓRIO E PAISAGEM éInfluenciadoPor (TR) BIODEGRADAÇÃO éInfluenciadoPor (TR) CRESCIMENTO POPULACIONAL éInfluenciadoPor (TR) FATORES CLIMÁTICOS éInfluenciadoPor (TR) ZONA URBANA influencia (TR) CULTURA DE ALIMENTO influencia (TR) LATIFÚNDIO influencia (TR) POLÍTICAS PÚBLICAS influencia (TR) REFORMA AGRÁRIA influencia (TR) SEGURANÇA ALIMENTAR 23 cobertura da terra temTraduçãoEN (EQ-EN) LAND COVER termoGenéricoGênero (TGG) CARACTERÍSTICAS FISIOGRÁFICAS termoGenéricoGênero (TGG) TERRITÓRIO E PAISAGEM termoEspecíficoGênero (TEG) ÁGUA DE SUPERFÍCIE termoEspecíficoGênero (TEG) MUDANÇA DE COBERTURA DAS TERRAS termoEspecíficoGênero (TEG) PLANTA DE COBERTURA termoEspecíficoGênero (TEG) SOLO termoEspecíficoGênero (TEG) TIPOS DE COBERTURA afeta (TR) ECOLOGIA inclui (TR) COBERTURA FÍSICA DA TERRA inclui (TR) ESTRUTURA GEOLÓGICA inclui (TR) HIDROGRAFIA influencia (TR) PAISAGEM influencia (TR) USO DA TERRA temObjetoDeAtividade (TR) TERRA 24 mudança de cobertura da terra temTraduçãoEN (EQ-EN) LAND COVER CHANGE termoGenéricoGênero (TGG) COBERTURA DA TERRA termoGenéricoGênero (TGG) FENÔMENO NATURAL termoGenéricoGênero (TGG) TERRITÓRIO E PAISAGEM éInfluenciadoPor (TR) AGRICULTURA COMERCIAL éInfluenciadoPor (TR) DENSIDADE DEMOGRÁFICA éInfluenciadoPor (TR) POSSE DA TERRA SOCIOECONOMIA 25 densidade demográfica temTraduçãoEN (EQ-EN) POPULATION DENSITY temSinônimo (UP EQ-SIN) DENSIDADE POPULACIONAL termoGenéricoGênero (TGG) CARACTERÍSTICAS POPULACIONAL termoGenéricoGênero (TGG) MEDIÇÃO termoGenéricoGênero (TGG) POPULAÇÃO éParteDe (TGP) SOCIOECONOMIA termoEspecíficoGênero (TEG) DENSIDADE VEGETAL termoEspecíficoGênero (TEG) POPULAÇÃO HUMANA 327 termoEspecíficoGênero (TEG) SUPERPOPULAÇÃO inclui (TR) NÚMERO DE HABITANTE influencia (TR) CAPACIDADE DE TRANSPORTE influencia (TR) PRESSÃO DEMOGRÁFICA influencia (TR) USO DA TERRA utilizaValor (TR) TAXA DE DISTRIBUIÇÃO DE SEMENTES utilizaValor (TR) TAXA DE FECUNDIDADE TOTAL utilizaValor (TR) TAXA DE MORTALIDADE INFANTIL utilizaValor (TR) TAXA DE URBANIZAÇÃO 26 crescimento populacional temTraduçãoEN (EQ-EN) POPULATION GROWTH temSinônimo (UP EQ-SIN) AUMENTO DA POPULAÇÃO temSinônimo (UP EQ-SIN) EVOLUÇÃO DA POPULAÇÃO termoGenéricoGênero (TGG) DINÂMICA POPULACIONAL termoGenéricoGênero (TGG) POPULAÇÃO HUMANA éParteDe (TGP) SOCIOECONOMIA termoEspecíficoGênero (TEG) EMIGRACAO RURAL E URBANA termoEspecíficoGênero (TEG) IMIGRAÇÃO RURAL E URBANA termoEspecíficoGênero (TEG) MIGRACAO RURAL E URBANA influencia (TR) PRESSÃO POPULACIONAL utilizaValor (TR) TAXA DE MORTALIDADE INFANTIL utilizaValor (TR) TAXA DE NATALIDADE 27 pressão populacional temTraduçãoEN (EQ-EN) POPULATION PRESSURE temSinônimo (UP EQ-SIN) PRESSÃO DEMOGRÁFICA termoGenéricoGênero (TGG) ESTADO E CONDIÇÃO éParteDe (TGP) SOCIECONOMIA afeta (TR) DESMATAMENTO atuaSobre (TR) DESMATAMENTO causa (TR) DESMATAMENTO influencia (TR) COBERTURA DA TERRA influencia (TR) CRESCIMENTO POPULACIONAL influencia (TR) DINÂMICA POPULACIONAL influencia (TR) USO DA TERRA ESPAÇO E TEMPO 28 mudança agrícola temTraduçãoEN (EQ-EN) AGRICULTURAL CHANGE temSinonímiaAproximada (UP EQ-APR) DESENVOLVIMENTO AGRÍCOLA termoGenéricoGênero (TGG) DESENVOLVIMENTO ECONÔMICO termoGenéricoGênero (TGG) ESPAÇO E TEMPO termoEspecíficoGênero (TEG) DESENVOLVIMENTO DA PESCA termoEspecíficoGênero (TEG) DESENVOLVIMENTO FLORESTAL termoEspecíficoGênero (TEG) MECANIZAÇÃO termoEspecíficoGênero (TEG) REVOLUÇÃO VERDE influencia (TR) COBERTURA DA TERRA influencia (TR) FOMENTO AGRÍCOLA influencia (TR) POLÍTICA DE DESENVOLVIMENTO influencia (TR) PRODUÇÃO influencia (TR) USO DA TERRA 29 análise de séries temporais temTraduçãoEN (EQ-EN) TIME SERIES ANALYSIS temSinonímiaAproximada (UP EQ-APR) ANÁLISE DE SÉRIES CRONOLÓGICAS termoGenéricoGênero (TGG) ESPAÇO E TEMPO termoGenéricoGênero (TGG) ANÁLISE DE DADOS termoGenéricoGênero (TGG) MÉTODOS ESTATÍSTICOS éInfluenciadoPorOuDependeDe (TR) ANÁLISE ESTATÍSTICA éInfluenciadoPorOuDependeDe (TR) ANÁLISE GEOESTATÍSTICA utilizaValor (TR) PADRÃO TEMPORAL utilizaValor (TR) SÉRIE TEMPORAL 328 INSTITUIÇÕES 30 Embrapa temTraduçãoEN (EQ-EN) EMBRAPA temNomeInstitucional (UP EQ-INS) Empresa Brasileira de Pesquisa Agropecuária éParteDe (TGP) INSTITUIÇÕES éParteDe (TGP) INSTITUIÇÕES DE PESQUISA temParte (TEP) UNIDADES CENTRAIS temParte (TEP) UNIDADES DESCENTRALIZADAS temParte (TEP) LABORATÓRIOS VIRTUAIS temParte (TEP) ESCRITÓRIOS INTERNACIONAIS influencia (TR) POLITICA DE DESENVOLVIMENTO influencia (TR) PESQUISA AGROPECUÁRIA temObjetivoOuProcesso (TR) PESQUISA 329 APÊNDICE H – Definições para os Conceitos da Amostra 1. INTENSIFICAÇÃO AGROPECUÁRIA Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Processo que visa o aumento da produtividade agropecuária, através de variadas práticas como, por exemplo, diminuição dos períodos de pousio, transição do uso das terras e fertilização. Definição Especialista: Processo de aumento da produção ou da produtividade agropecuária numa mesma área, observado em macroescalas espaço-temporais e decorrente do uso intensificado de insumos, como trabalho, capital e tecnologia. Definição Modelador: Processo agropecuário da produção ou da produtividade agropecuária em uma mesma área, decorrente do uso intensificado de insumos, como trabalho, capital e tecnologia, sem deixar de lado aspectos como a segurança alimentar, a sustentabilidade e a biodiversidade, sempre observado em relação às macroescalas espaço-temporais e socioeconômicas. 2. AGRICULTURA EXTENSIVA Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Agricultura caracterizada como tradicional na qual não há o uso de tecnologias, preparação do solo e seleção das sementes. Devido ao uso de técnicas rudimentares, possui baixo índice de produtividade. Definição Especialista: Sistema de produção agrícola onde praticamente não se utilizam insumos tecnológicos e, portanto, altamente dependente da incorporação de áreas naturais para exploração agrícola. Definição Modelador: Sistema de exploração agrícola onde praticamente não se utilizam insumos tecnológicos, altamente dependente da incorporação de áreas naturais para exploração agrícola e, em geral, com baixo investimento e baixa produtividade; favorece as atividades pastoris que têm nas pastagens sua principal fonte alimentar, e de outras criações extensivas (peixes, por exemplo) que utilizam instalações já existentes, sem preocupação com a técnica utilizada, e o aumento da extensificação (expansão da área cultivada). 3. AGRICULTURA INTENSIVA Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Tipo de agricultura, em larga escala, que pode causar grandes impactos negativos aos ecossistemas e capaz de aumentar a erosão, o despejamento de sedimentos e o escoamento de nutrientes e químicos agrícolas para os reservatórios de água subterrânea, nascentes e rios, sendo um dos responsáveis pelo excesso de fósforo e nitrogênio nas correntes de água. A expansão da agricultura intensiva, por aumentar a produtividade no mercado, em espaços reduzidos, quando associado ao trabalho mecanizado, pode colocar os preços agrícolas de outros tipos de produções em declínio. Nas terras em que ocorre a agricultura intensiva existe um aumento no cultivo e, por conta disso, um drástico uso de fertilizantes (nitratos) e pesticidas químicos que reduzem fertilidade e a capacidade produtiva dos solos, um grande uso de insumos e combustíveis, e uma alta demanda pela água que também pode por suas fontes em risco. Definição Especialista: Refere-se a sistemas agrícolas que envolvem intensificação de trabalho e/ou de insumos, o que resulta em maior produção ou produtividade agrícolas, podendo agregar, ainda, referências a atividades realizadas em espaços reduzidos para cultivo de plantas ou criação de animais. Definição Final: Sistema agrícola que envolve intensificação de trabalho e/ou de insumos, o que resulta em maior produção ou produtividade agrícolas, podendo agregar, ainda, referências a atividades realizadas em espaços reduzidos para cultivo de plantas ou criação de animais. Definição Modelador: Sistema de exploração agrícola que envolve o uso intensivo da terra, com a intensificação sustentável do trabalho e/ou de insumos de cultivo e pecuária, o que resulta em maior produção ou produtividade agrícolas, podendo agregar, ainda, referências a atividades realizadas em espaços reduzidos e com tecnologias de ponta para o cultivo de plantas ou criação de animais. MATERIAL E MÉTODOS 4. CULTURA Morfologia: Substantivo Feminino (s.f.) 330 Definição Inicial: Cultivo de diferentes tipos de plantações como cana de açúcar, café, soja, entre outras. Definição Especialista: Refere-se a qualquer planta, cultivada pelo homem ou não, cujos produtos foram, são ou serão colhidos em quaisquer de seus estágios de crescimento. Plantas que não foram cultivadas, mas cujos produtos são colhidos não são consideradas culturas; o mesmo se aplica para plantas que foram cultivadas, mas que nunca terão seus produtos colhidos. Definição Modelador: Plantas cultivadas pelo homem ou não, cujos produtos foram, são ou serão colhidos em quaisquer de seus estágios de crescimento; é influenciada pelo calendário agrícola e pelo ciclo do tipo de cultura; também denominada “produção vegetal” e “planta cultivada”. 5. SENSORIAMENTO REMOTO Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Tecnologia de obtenção de imagens e dados da superfície terrestre através da captação e registro da energia refletida/emitida da superfície estudada. Pode ajudar a mapear variáveis climáticas, meteorológicas, mudanças de vegetação e até a qualidade da água de grandes reservatórios. Essas mudanças podem ser monitoradas em diferentes espaços e escalas de tempo. A integração do sensoriamento remoto com os Sistemas de Informação Geográfica (SIG) é uma importante ferramenta para detectar a magnitude das mudanças geográficas e dos fenômenos agrícolas. Desta forma, esses resultados podem, em futuras aplicações, colaborar para perspectivas ambientais e agriculturais sustentáveis. Definição Especialista: Tecnologia de obtenção de imagens e dados da superfície terrestre através da captação e registro da energia refletida/emitida da superfície estudada. Definição Final: Tecnologia de obtenção de imagens e dados da superfície terrestre, através da captação e registro da energia refletida/emitida da superfície estudada. Definição Modelador: Tecnologia composta por instrumentos para a obtenção de imagens e dados da superfície terrestre, por meio da captação e registro da energia refletida/emitida da superfície estudada; parte de disciplinas tais como Agrimensura e Geometria Geoespacial; usa métodos, técnicas e ferramentas tais como mapa, radar, processamento de imagens, satélites de observação da terra, sensores, GPS, entre outros. 6. SISTEMAS DE INFORMAÇÃO GEOGRÁFICA Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Ferramentas computacionais que coletam, armazenam, transformam e exibem aspectos especiais a partir de uma abordagem de natureza cartográfica, altamente valorizada para documentação de processos de formação de paisagens agrícolas. Definição Especialista: Ferramentas computacionais que reúnem, armazenam, organizam, analisam e exibem dados de fontes variadas a partir de uma abordagem de natureza cartográfica, altamente valorizada para documentação de processos que se manifestam na superfície terrestre. Para esse processamento, a geometria e os atributos dos dados devem estar georreferenciados, isto é, localizados na superfície terrestre e representados numa projeção cartográfica. A instância prática de um Sistema de Informação Geográfica, ou a sigla SIG, combina o programa computacional com equipamentos, dados, usuários e procedimentos, auxiliando planejamento e tomada de decisões. Definição Modelador: Sistema de informação, de suporte e ferramenta de tecnologia geoespacial que reúne, armazena, organiza, analisa e exibe dados de fontes variadas a partir de uma abordagem de natureza cartográfica, altamente valorizada para a documentação de processos que se manifestam na superfície terrestre; usa GPS e dados espaciais; sigla SIG. AMBIENTE 7. MEIO AMBIENTE Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Conjunto de condições que envolvem e sustentam os seres vivos na biosfera, como um todo ou em parte desta, abrangendo elementos do clima, solo, água e de organismos. Definição Especialista: Dimensão real do planeta que reúne elementos e processos físicos, químicos, biológicos e antrópicos e toda gama de manifestações decorrentes da combinação ou inter-relação desses componentes. 331 Definição Modelador: Entidade do ambiente que reúne um conjunto de elementos e processos físicos, químicos, biológicos e antrópicos e toda gama de manifestações decorrentes da combinação ou inter- relação desses componentes; abriga e rege a vida em todas as suas formas, afetando, por exemplo, a população e a economia e sendo afetado por elementos tais como biodegradação, catástrofes naturais, queimadas e políticas ambientais 8. AMBIENTE FÍSICO Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Espaço composto por elementos naturais como rios, lagos, oceanos, vegetação, formações rochosas, clima, etc. Definição Especialista: Conjunto de elementos e componentes naturais do meio ambiente que envolvem unicamente os fenômenos e processos físicos e químicos, tais como rochas, solo, chuva, nuvens, corpos d´água, atmosfera, luz, etc. Definição Modelador: Elemento do meio ambiente que engloba e envolve unicamente os fenômenos e processos naturais, físicos e químicos, tais como rochas, solo, chuva, nuvens, corpos d’água, atmosfera e luz; é afetado por fatores climáticos e sedimentação, e pode afetar a economia. 9. SOLO Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Área que constitui a superfície sobre a qual são cultivados pastos, plantações ou estabelecidas edificações. Definição Especialista: Camada que recobre as superfícies não inundadas do planeta e que se forma naturalmente pelo desgaste das rochas que a originam, envolvendo processos naturais de longo prazo tais como intemperização e interação com a biota que se estabelece localmente nessa camada. Definição Modelador: Cobertura da terra e elemento do ambiente que recobre as superfícies não inundadas do planeta e que se forma naturalmente pelo desgaste das rochas que a originam, envolvendo vários componentes e processos naturais de longo prazo tais como intemperização e interação com a biota (seres vivos de um dado ambiente) que se estabelece localmente nessa superfície, assim como processos não naturais, de melhoramento e manejo de solo. AGRONOMIA 10. MANEJO DA CULTURA Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Prática que envolve a adoção de estratégias de controle para a promoção de um ambiente adequado para o desenvolvimento de uma cultura, de uma forma que seja impedido o crescimento de pragas e doenças. O desenvolvimento tecnológico nesta prática é capaz de aumentar a produtividade de uma área. A rotação de culturas é uma de suas principais alternativas de controle do manejo de cultura, visto que desta forma, as propriedades inerentes ao solo não podem ser alteradas. Definição Especialista: Conjunto de procedimentos aplicados nos cultivos agrícolas que visam promover as melhores condições de plantio, crescimento das plantas e colheita, considerando os aspectos edáficos, hídricos e fitossanitários que envolvem as culturas. Esses procedimentos referem- se à preparação do solo, fertilização, sistemas de cultivo, métodos de controle de pragas e doenças, entre outros aspectos, sendo que várias deles podem ser mecanizados ou automatizados. Definição Modelador: Manejo de plantas que envolve um conjunto de procedimentos tais como a preparação do solo, sistemas de cultivo, tratamentos de pré-colheita e métodos de controle de pragas e doenças, que podem ser mecanizados ou automatizados, que visam promover as melhores condições de plantio, crescimento das plantas e colheita, considerando os aspectos edáficos, hídricos e fitossanitários que envolvem as culturas; influencia o ambiente físico. 11. MANEJO DO SOLO Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Conjunto de práticas que se destinam ao tratamento do solo a fim de que a produtividade seja maior, como por exemplo, o plantio direto. Definição Especialista: Conjunto de práticas que se destinam à preparação, adequação ou tratamento do solo para garantia de sua sustentabilidade enquanto recurso natural, permitindo seu uso adequado a curto, médio e longo prazos para a agropecuária ou outros fins. 332 Definição Modelador: Prática de manejo que envolve métodos e procedimentos, mecanizados ou automatizados, empregados na preparação, adequação, recuperação e conservação do solo para garantia de sua sustentabilidade enquanto recurso natural; permite o uso adequado do solo a curto, médio e longo prazos. 12. POUSIO Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Período de descanso em que a terra agrícola deixa de ser cultivada, visando recuperar e aumentar a fertilidade do solo. Nessa fase, que pode variar de um a vários anos, recupera-se a diversidade no solo e, dependendo do tempo do pousio, restabelece-se também a diversidade de plantas e de animais nativos . Definição Especialista: Período de descanso em que a terra agrícola deixa de ser cultivada. Definição Modelador: Prática de manejo e sistema de cultivo que prevê a interrupção de atividades ou usos agrícolas, pecuários ou silviculturais do solo para descanso, por diferentes motivos (preparação, regeneração, fertilidade do solo), e por distintos períodos de tempo. 13. PERÍODO DE POUSIO Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Tempo em que a área agrícola repousa a fim de restaurar a fertilidade do solo e a vegetação nativa. Não há um limite de tempo fixo, a duração do período pode variar conforme a intenção do agricultor e deve ocorrer entre os períodos de uso da área. Definição Especialista: Tempo em que uma área agrícola permanece sem cultivos. Definição Modelador: Pousio (ou interrupção) do uso e das atividades agrárias no solo, por determinados e diferentes períodos de tempo, para repouso da terra, sem deixar de lado elementos tais como a sustentabilidade e a economia. 14. PESTICIDA Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Substância química usada na agricultura para a prevenção, eliminação e controle de pragas. Definição Especialista: Substância química usada na agricultura para a prevenção, eliminação e controle de pragas e doenças das plantas e dos animais. Definição Modelador: Substância química usada nas práticas de manejo para a prevenção, eliminação e controle de pragas e doenças das plantas e dos animais; o uso envolve métodos e procedimentos que pode causar poluição atmosférica e do solo, sendo necessário levar em conta a segurança alimentar. 15. CICLO DA CULTURA Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Ciclo que compreende as fases do desenvolvimento de uma cultura. Por exemplo, no cultivo do arroz há três grandes fases: a fase vegetativa, a fase reprodutiva e a fase de maturação. Definição Especialista: Ciclo que compreende as fases do desenvolvimento de uma cultura, do plantio à colheita. Definição Modelador: Parte da Agricultura que compreende as fases do desenvolvimento de uma cultura, do plantio à colheita, cujas características afetam as práticas de manejo. 16. CULTURA ANUAL Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Cultura que é caracterizada pela replantação anualmente, pois encerra seu ciclo produtivo em um ano ou menos. São exemplos desse tipo de cultura: a soja, o feijão, o trigo e a cevada. Definição Especialista: Cultura que é caracterizada pela replantação anualmente, pois encerra seu ciclo produtivo em um ano ou menos. São exemplos desse tipo de cultura: a soja, o feijão, o trigo e a cevada. Definição Modelador: Cultura cíclica e de sistema de cultivo anual, que tem uma única produção a cada período de um ano ou menos, e, após a colheita, é preciso novo plantio; afeta o período de pousio do solo. 333 17. PECUÁRIA Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Atividade relacionada à criação de gado com o objetivo de fornecer principalmente carne, leite, couro e lã. Pode ser dividida em: pecuária de corte, que destina a criação para o abate visando à obtenção de carne; e em pecuária leiteira que conduz a criação para a produção de leite. A pecuária de corte pode ser subdividida em intensiva, na qual o gado é criado em pequenos espaços e alimentado com ração específica produzindo carne macia e de boa qualidade; e em extensiva, na qual o gado é criado solto e se alimenta de grama o que produz uma carne dura, já que o gado desenvolve uma musculatura rígida. Definição Especialista: N/D Definição Modelador: Parte da Agricultura que envolve a criação de diversos tipos de animais domesticáveis, e inclui atividades de produção de carne, leite (e seus derivados), e de produtos tais como couro e lã, cujos resultados impactam a economia. 18. ADUBO VERDE Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Adubo composto por plantas como leguminosas, gramíneas, crucíferas, entre outras e que tem como objetivo proteger o solo. Após seu plantio em rotação, sucessão ou em consórcio com outras culturas, elas são fragmentadas e deixadas como cobertura até serem decompostas. Definição Especialista: Adubo composto por plantas como leguminosas, gramíneas, crucíferas, entre outras e que tem como objetivo proteger e enriquecer o solo. Após seu plantio em rotação, sucessão ou em consórcio com outras culturas, elas são fragmentadas e deixadas como cobertura até serem decompostas. Definição Modelador: Adubo e fertilizante orgânico que é resultado da fragmentação e da decomposição de plantas tais como leguminosas, gramíneas, crucíferas, que foram deixadas no solo como cobertura após seu plantio em rotação, sucessão ou em consórcio com outras culturas; tem como objetivo proteger e enriquecer o solo. 19. PRODUTO AGROPECUÁRIO Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Produto proveniente da agricultura e da pecuária, como por exemplo: flores, plantas, carne, leite e seus derivados. Definição Especialista: Produto proveniente da agricultura e da pecuária, como por exemplo: flores, plantas, carne, leite e seus derivados. Definição Modelador: Produto em estado natural ou processado, proveniente da agricultura e da pecuária, cuja produtividade impacta a economia. 20. BIOMASSA Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Matéria orgânica proveniente de organismos vivos de um determinado local e é quantificado segundo seu peso, volume ou área ocupada. Pode ser utilizada para a fertilização dos solos ou para a produção de energia. Definição Especialista: Matéria orgânica proveniente de organismos vivos de um determinado local, quantificada segundo seu peso, volume ou área ocupada. Pode ser utilizada para a fertilização dos solos ou para a produção de energia. Definição Modelador: Substância ou recurso biológico e orgânico renovável, proveniente de organismos vivos de um determinado local, quantificada segundo seu peso, massa, volume ou área ocupada, e utilizada para a fertilização dos solos ou para a produção de energia. TERRITÓRIO E PAISAGEM 21. POSSE DA TERRA Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Relação de propriedade entre o titular e a terra, ou seja, o proprietário detém os direitos sobre a área que lhe pertence, podendo atribuir a ela o uso que desejar. Definição Especialista: Relação de propriedade entre o proprietário e a terra que lhe pertence, detendo os direitos sobre ela e podendo atribuir a ela o uso que desejar. 334 Definição Modelador: Propriedade de extensão de terra cujos direitos foram adquiridos a partir de diferentes tipos de regimes de posse, e envolve fatores tais como arrendamento, desapropriação, usucapião e reforma agrária. 22. ESCASSEZ DE TERRA Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Redução da quantidade de terra em uma determinada área por motivos como desflorestamento, degradação de recursos naturais, mudança climática, expansão populacional, urbanização, industrialização, entre outros.Uma das consequências da escassez de terra é a diminuição de áreas agrícolas destinadas à cultura de gênero alimentício, a qual interfere na segurança alimentar da população. Definição Especialista: Redução da quantidade de terra disponível para posse e, portanto, para qualquer tipo de uso, incluindo para produção agrícola. Definição Modelador: Território reduzido em sua quantidade, tornando-a indisponível para a posse ou qualquer tipo de uso agropecuário, cujo fenômeno envolve fatores tais como crescimento populacional, zona urbana, políticas públicas, reforma agrária e cultura de alimentos. 23. COBERTURA DA TERRA Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Cobertura geológica, física e biológica do solo, como pastagens, culturas, entre outras. Definição Especialista: Cobertura hidrogeológica e biológica, natural ou antrópica, das superfícies terrestres do planeta. Definição Modelador: Elemento da superfície do território (ou da superfície terrestre) que corresponde à composição de uma cobertura hidrogeológica e biológica, natural ou antrópica; influencia a paisagem e o controle e uso da terra. 24. MUDANÇA DE COBERTURA DA TERRA Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Processo de modificação da cobertura do solo devido a fatores comerciais, demográficos ou referentes ao regime de propriedade do local. Definição Especialista: Idem à definição inicial. Definição Modelador: Processo de modificação da cobertura da terra, natural ou não, devido a fatores comerciais, demográficos ou referentes ao regime de propriedade do local. SOCIOECONOMIA 25. DENSIDADE DEMOGRÁFICA Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Média de indivíduos divididos pela superfície do território em que ocupam, ou seja, o número de pessoas ou outros seres vivos por espaço habitado. A densidade populacional rural é primordial para a explicação dos padrões de uso das terras, visto que a pressão populacional associada à produtividade agricultural é maior. Definição Especialista: Refere-se ao número de pessoas ou outros seres vivos por espaço habitado. Definição Modelador: População humana ou de outros seres vivos, medida em um dado espaço habitado, geralmente expressa por um indicador que determina o número de habitantes por quilômetro quadrado; as características dessa população impactam, por exemplo, o transporte, o uso da terra e a economia. 26. CRESCIMENTO POPULACIONAL Morfologia: Substantivo Masculino (s.m.) Definição Inicial: Aumento do número de habitantes em um determinado espaço. Variáveis como a taxa de crescimento populacional, taxas de mortalidade e natalidade são propriedades primordiais para a explicação do aumento ou diminuição do número de habitantes de um devido local. O crescimento populacional conduz a degradação por meio do aumento de áreas de cultivo e diminuição da rotatividade de culturas, acarretando no aumento da degradação. Porém, este não é um fator exclusivo de mudança da cobertura florestal. Definição Especialista: Aumento do número de indivíduos em um determinado espaço. 335 Definição Modelador: Dinâmica populacional humana e de outros seres vivos que corresponde ao aumento do número de indivíduos em um determinado espaço, medido por valores tais como taxa de mortalidade e natalidade, e que envolve fatores como os de emigração, imigração e migração urbana e rural. 27. PRESSÃO POPULACIONAL Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Processo resultado do envolvimento entre a população e o local ocupado que, dentre outras consequências, conduz ao desmatamento. Relaciona-se com a densidade populacional e o poder de compra da população local. O parcelamento urbano para fins de moradia e outras atividades reflete diretamente em uma contínua degradação das terras e da paisagem, assim afetando o a produtividade agrícola. Porém, o crescimento da população, ligado à pressão populacional encoraja a Intensificação Agropecuária e sistemas pecuários mistos. Definição Especialista: Processo resultante da tensão entre a dinâmicas populacionais e as dinâmicas de uso e cobertura das terras. Definição Modelador: Condição resultante de fatores demográficos e de um processo de tensão entre a dinâmicas populacionais, eventos naturais e as dinâmicas de uso e cobertura das terras, e pode contribuir para os danos ambientais tais como o desmatamento, poluição, esgotamento de recursos e perda de biodiversidade. ESPAÇO E TEMPO 28. MUDANÇA AGRÍCOLA Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Fator de mudanças não lineares associadas às práticas agrícolas. Representa as mudanças, ao longo do tempo e do espaço, no uso e na cobertura das terras, em função de sua exploração antrópica e, em consequência, pode acarretar diminuição ou aumento na produção agropecuária e nas áreas de cultivo, uma vez que seu processo pode ou não ser associado ao controle de desenvolvimento planejado em um ambiente de produção. Definição Especialista: Alterações espaço-temporais das atividades agrícolas decorrentes da dinâmica de uso e cobertura das terras em função de sua exploração antrópica. Definição Modelador: Desenvolvimento econômico das atividades agropecuárias que resulta das alterações espaço-temporais decorrentes da dinâmica de uso e cobertura das terras em função de sua exploração antrópica, que envolve fatores tais como a mecanização e as políticas de desenvolvimento rural. 29. ANÁLISE DE SÉRIES TEMPORAIS Morfologia: Substantivo Feminino (s.f.) Definição Inicial: Ferramenta estatística que auxilia nas previsões de padrões ou de séries ao longo de um período de tempo, a partir da identificação de componentes e de sua análise quantitativa. A identificação dos dados temporais e dos padrões de comportamento histórico possibilita não só a previsão de ocorrências futuras, como também a organização de ações preventivas em relação às suas consequências. Definição Especialista: Ferramenta estatística que auxilia nas previsões de padrões ou de séries ao longo de um período de tempo, a partir da identificação de componentes e de sua análise quantitativa. A identificação dos dados temporais e dos padrões de comportamento histórico possibilita não só a previsão de ocorrências futuras, como também a organização de ações preventivas em relação às suas consequências. Definição Modelador: Ferramenta de análise de informações estatísticas que tem por base padrões de dados temporais, e que auxilia nas previsões de padrões, de séries ao longo de um período de tempo e na determinação de ações estratégicas de prevenção às suas possíveis consequências. INSTITUIÇÕES 30. EMBRAPA Morfologia: Substantivo Feminino (s.f.). Equivalência em inglês: Embrapa Definição Inicial: Empresa de inovação tecnológica que tem por objetivo a geração de conhecimento e tecnologia para a agropecuária brasileira. A Empresa Brasileira de Pesquisa Agropecuária 336 (Embrapa) nasceu em 26 de abril de 1973, em meio à intensificação agropecuária no Brasil. O crescimento acelerado da população e da renda per capita e a abertura para o mercado externo mostravam que, sem investimentos em ciências agrárias, o país não conseguiria reduzir o diferencial entre o crescimento da demanda e o da oferta de alimentos e fibras. Vinculada ao Ministério da Agricultura, Pecuária e Abastecimento (Mapa), a Embrapa assumiu um desafio: desenvolver, em conjunto com os parceiros do Sistema Nacional de Pesquisa Agropecuária (SNPA), um modelo de agricultura e pecuária tropical genuinamente brasileiro, superando as barreiras que limitavam a produção de alimentos, fibras e energia. A empresa é responsável pela formulação de políticas agrícolas e por planejar, supervisionar, coordenar e controlar as atividades relacionadas à execução de pesquisa agropecuária no Brasil. A Embrapa conta hoje com 17 unidades centrais localizadas em Brasília; 46 Unidades Descentralizadas em todas as regiões do Brasil; quatro Laboratórios Virtuais no Exterior (Labex), localizados nos EUA, Europa, China e Coreia do Sul; e três Escritórios Internacionais, situados na América Latina e na África. Além de tirar o Brasil de uma condição de importador de alimentos básicos para a condição de um dos maiores produtores e exportadores mundiais, a Embrapa internacionalmente é uma das líderes na geração de conhecimento, tecnologia e inovação para a produção sustentável de alimentos, fibras e agroenergia. Definição Especialista: Idem à definição inicial. Definição Modelador: Instituição de pesquisa vinculada ao Ministério da Agricultura, Pecuária e Abastecimento (MAPA), criada em 26 de abril de 1973, formada por 17 unidades centrais localizadas em Brasília; 46 Unidades Descentralizadas em todas as regiões do Brasil; quatro Laboratórios Virtuais no Exterior (Labex), localizados nos EUA, Europa, China e Coreia do Sul; e três Escritórios Internacionais, situados na América Latina e na África; tem como objetivo a inovação tecnológica para a geração de conhecimento e tecnologia para a agropecuária brasileira, cujos resultados de pesquisa influenciam as políticas públicas. 337 ANEXO A – Estrutura Hierárquica da Taxonomia de Intensificação Agropecuária Visualização parcial em formato folder tree * agricultural intensification (Intensificação Agropecuária) o material and methods (material e métodos) + field observations (observações de campo) + remote sensing (sensoriamento remoto) + models and modeling (modelos e modelagem) + geographical information systems (sistemas de informação geográfica) + databases (bases de dados) + secondary data (dados secundários) + statistical analysis (análises estatísticas) o environment (meio ambiente) + physical environment (ambiente físico) # climate and weather (clima e tempo) # water (água) # soil (solo) # air (ar) # chemical elements/substances/processes + natural resources (recursos naturais) # biological resources (recursos biológicos) # natural resources management (manejo de recursos naturais) + biotic environment (ambiente biótico) # biodiversity (biodiversidade) + environmental conditions (condições ambientais) + environmental variables (variáveis ambientais) + ecosystem (ecossistema) # agricultural ecosystems (ecossistemas agrícolas) # ecosystem quality (qualidade dos ecossistemas) # community structure (estrutura da comunidade) # primary production (produção primária) # carbon sequestration (sequestro de carbono) # nutrient cycling (ciclagem de nutrientes) # organic matter (matéria orgânica) o agronomy (agronomia) + agricultural production (produção agrícola) + management practices (práticas de manejo) # forest management (manejo florestal) # crop management (manejo da cultura) # animal traction (tração animal) # Green Revolution (Revolução Verde) # weed control (controle de ervas daninhas) # pest management (manejo de pragas) # burning (queimadas) # grassland management (manejo de pastagens) # mixed farming (cultivo em consórcio) # technical assistance (assistência técnica) # traditional farming (agricultura tradicional) # soil management (manejo do solo) # conventional tillage (cultivo convencional) # fallow (pousio) # conventional farming (agricultura convencional) # integrated crop-livestock-forestry (integração lavoura-pecuára-floresta) + farming systems (sistemas de cultivo) # agroforestry systems (sistemas agroflorestais) # agri-environmental schemes (esquemas agroambientais) # alley cropping (cultivo em linhas/linear) # ASB (alternativas para o sistema corte-queima) # continuous cultivation (cultivo contínuo) # conventional systems (sistemas convencionais) # crop-livestock integration (integração lavoura-pecuária) # cropping frequency (frequência de cultivo) 338 # double cropping (cultivo duplo) # nurse crop (planta abrigo) # row crops (culturas em linhas/lineares) # direct seeding (plantio direto) # sustainable agriculture (agricultura sustentável) # annual cropping (cultura/cultivo anual) # arable farming (agricultura/plantação arável) # cropping season (estação de cultivo) + pests and diseases (pragas e doenças) # pest management (manejo de pragas) # pests and deseases (fitossanidade) # pest and diseases (sanidade animal) + crops (cultura) # arable crops (culturas aráveis) # perennial crop (cultura perene) # cyclic crops (culturas cíclicas) + arable crops (culturas aráveis) + livestock (pecuária) # animal production (produção animal) # animal feed (alimentação animal) # animal products (produtos animais) # cattle ranching (pecuária) # cattle raising (pecuária) # grazing land (terra de pastejo) # livestock systems (sistemas pecuários) # animal husbandry (criação de animais) # manure (adubo) + agricultural products (produtos agropecuários) + biomass (biomassa) # plant biomass (biomassa vegetal) # aboveground biomass (biomassa aérea) + extension services (serviços de extensão) # technical assistance (assistência técnica) o territory and landscape (território e paisagem) + total land (terra total) # land tenure (posse da terra) # land management (manejo das terras) # land use (uso das terras) # land cover (cobertua das terras) # agricultural frontier (fronteira agrícola) + study areas (áreas de estudo) # Americas (Américas) # Europa # Middle East (Oriente Médio) # Oceania # ecoregions (ecorregiões) # Africa (África) # Asia (Ásia) # tropical areas (áreas tropicais) + geomorphology (geomorfologia) # steep slopes (encostas íngremes) # bank sediments (banco de sedimentos) # hill country (região montanhosa) # lowland areas (áreas de várzea) # micro watershed (microbacia) # river basin (bacia hidrográfica/fluvial) # sloping land (terreno em declive) # upland areas (platô) # valley bottoms (fundos de vales) o socioeconomics (socioeconomia) + population dynamics (dinâmica populacional) # population density (densidade demográfica/populacional) # population growth (crescimento populacional) # population pressure (pressão populacional) # population size + goods and services (bens e serviços) # forest products (produtos florestais) 339 # ecosystem services (serviços do ecossistema) # employment opportunities (oportunidades de emprego) # human capital (capital humano) # indigenous knowledge (conhecimento indígena) # landesque capital (capital landesque) # public goods (bem público) + human population (população humana) # rural population (população rural) # local community (comunidade local) # ethnic groups (grupos étnicos/etnias) # urban centers (centros urbanos) + agricultural sector (setor agrícola) # farm household (agricultura familiar) # agricultural development (desenvolvimento agrícola) # cash crops (culturas comerciais) # agricultural policy (política agrícola) # farm firm (empresa agrícola/empreendimento rural) # production systems (sistemas de produção) + development (desenvolvimento) # development projects (projetos de desenvolvimento) # developed countries (países desenvolvidos) # developing countries (países em desenvolvimento) + economic benefits (benefícios econômicos) # financial support (suporte/auxílio financeiro, financiamento) + Work/Job (trabalho/emprego) # wage labor (trabalho assalariado) # hired labor (trabalho contratado) # labour market (mercado de trabalho) + household income (renda familiar) + political economy (economia política) + private sector (setor privado) + public sector (setor público) + transaction costs (custos de transação) # transport costs (custos de transportes) o space and time (espaço e tempo) + agricultural change (mudanças agrícolas) + space (espaço) # spatial scales (escalas espaciais) + time (tempo) # time series [analysis] (análise de séries temporais) # temporal variability (variabilidade temporal) # twentieth century (século XX / século vinte / século 20) # study period (período de estudo) o institutions (instituições) + EMBRAPA + United Nations (Nações Unidas) # ONU # United Nations Organization (Organização das Nações Unidas)