Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/ECID-92AP35
Type: Tese de Doutorado
Title: Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
Authors: Eduardo de Mattos Pinto Coelho
First Advisor: Marcello Peixoto Bax
First Co-advisor: Wagner Meira Junior
First Referee: Alberto Henrique Frade Laender
Second Referee: Mauricio Barcellos Almeida
Third Referee: Renata Maria Abrantes Baracho Porto
metadata.dc.contributor.referee4: Fernando Silva Parreiras
metadata.dc.contributor.referee5: Frederico Luiz Gonçalves de Freitas
Abstract: Este projeto de pesquisa tem como objetivo o aprimoramento de tecnologia de suporte à detecção, análise e combate a fraudes fiscais no Imposto Sobre Serviços de Qualquer Natureza ISSQN a partir da recuperação e processamento de grande volume de dados. A hipótese que lançamos é que a associação de metodologias e técnicas de ontologias e sistemas difusos pode auxiliar e mesmo viabilizar o sucesso da mineração de dados na recuperação destes grandes volumes de dados. Esta hipótese fundamenta-se em três premissas. A primeira premissa é que a solução passa pela necessidade da captura, tratamento, modelagem, representação formal e incorporação do conhecimentode domínio, em especial, o constituído pelo conhecimento coletivo de especialistas. A segunda premissa é que ontologias adequam-se perfeitamente à tarefa dessa incorporação de conhecimento. Essa adequação se faz em vista das características das ontologias em explicitar, formalizar, verificar, e consolidar conhecimentos, tornando-os compartilháveis, reutilizáveis e interoperáveis. Além disso, o conhecimento representado e incorporado é naturalmente utilizado para fins de classificação, a partir dos mecanismos de inferências inerentes às ferramentas de desenvolvimento de ontologias, e aos mecanismos de inferências que podem ser agregados a elas. A terceira premissa é que, considerando-se que esse conhecimento coletivo de especialistas é de natureza vaga e subjetiva, as metodologias e técnicas da área de sistemas difusos são adequadas para capturar, tratar e modelar esse conhecimento. Com isto, desenvolvemos uma solução para o pré e pós-processamento de dados na mineração, focada na modelagem de conhecimento especialista de natureza vaga e subjetiva. Este conhecimento vago e subjetivo é modelado em atributos com técnicas de sistemas difusos, guiando o processo demineração de dados, e gerando uma medida subjetiva que suporta a análise e interpretação de resultados, que de outro modo, seria mais laboriosa, difícil oumesmo impossível de ser realizada. Desse modo, apresentamos uma solução efetiva para o aumento da arrecadação tributária, através da identificação deevidências de fraudes e evasão tributária em serviços importados por empresas de Belo Horizonte. Com base nesta abordagem, nos testes e simulações realizados, pudemos reduzir o número de regras de interesse geradas pela mineração de dadosem 42%. Comparando-se o número de registros detectados na mineração de dados por esta abordagem, com o número de registros conhecidos envolvendo fraudes comprovadas, obtivemos uma taxa de sucesso global de 95,88%. Esta solução tem o potencial para ser aplicada em outras situações, e em amplas áreas de aplicaçãona esfera pública e privada. O projeto explora a convergência das habilidades desenvolvidas por três diferentes instituições: a Escola de Ciência da Informação da UFMG, o Departamento de Ciência da Computação da UFMG e a Secretaria Municipal de Finanças da Prefeitura de Belo Horizonte.
Abstract: This research project aims at the improvement of technology support for detecting, analyzing and fighting tax evasion in Service of Any Kind Tax- ISSQN - from recovery and processing large volumes of data. The hypothesis is that the association of methodologies and techniques of ontologies and fuzzy systems, can even help facilitate the success of data mining in the recovery of these large volumes of data. This hypothesis is based on three premises. The first premise is that the solution uses the capture, processing, modeling, representation and formal incorporation of domain knowledge, in particular, constituted by thecollective knowledge of experts. The second premise is that ontologies are perfectlysuited to the task of knowledge incorporation. This adequacy is obtained in view ofthe characteristics of ontologies in explicit, formalize, verify and consolidate the knowledge, making them sharable, reusable and interoperable. In addition, the knowledge represented and incorporated is naturally used for classification, from the inherent inference mechanisms of development tools ontologies, and the mechanisms ofinferences that can be added to them. The third premise is that, considering that the collective knowledge of experts is vague and subjective in nature, methodologies and techniques in the area of fuzzy systems are adequate to capture, treat andmodel this knowledge. Then, we have developed a solution for the pre-and post-processing of data mining, focused on modeling expert knowledge of nature vague and subjective. This vague and subjective knowledge is modeled to attributes with fuzzy systems techniques, guiding the process of data mining, and generating a subjective measure that supports the analysis and interpretation of results that otherwise would be more laborious, difficult or even impossible to be performed. Thus, we present an effective solution for increasing tax revenue through the identification of evidence of fraud and tax evasion on imported services for companies of Belo Horizonte. Based on this approach, tests and simulations conducted, we can reduce the numberof rules of interest generated by data mining by 42%. Comparing the number of records in data mining detected by this approach, with the number of known records involving fraud proven, we obtained an overall success rate of 95.88%. This solution has the potential to be applied in other situations, and in wide areas of application in the public and private sphere. The project explores the convergence of skills developed by three different institutions: the School of Information Science at UFMG, the Department of Computer Science at UFMG and the Finance City Office of BeloHorizonte.
Subject: Ciência da informação
Representação do conhecimento (Teoria da informação)
Ontologias (Recuperação da informação)
Mineração de dados (Computação)
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/ECID-92AP35
Issue Date: 5-Nov-2012
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
teseeci_2012_eduardodemattospintocoelho.pdf7.07 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.