Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/BUBD-9VDJH7
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Marcos Oliveira Pratespt_BR
dc.contributor.advisor-co1Erica Castilho Rodriguespt_BR
dc.contributor.referee1Erica Castilho Rodriguespt_BR
dc.contributor.referee2Renato Martins Assuncaopt_BR
dc.contributor.referee3Rafael Izbickipt_BR
dc.creatorLarissa Sayuri Futino Castro dos Santospt_BR
dc.date.accessioned2019-08-14T17:04:27Z-
dc.date.available2019-08-14T17:04:27Z-
dc.date.issued2015-02-11pt_BR
dc.identifier.urihttp://hdl.handle.net/1843/BUBD-9VDJH7-
dc.description.abstractTo understand crime dynamics is essential for the development of public politics to control many types os crimes. In this study, we aim to map the crime occurrences at the state of São Paulo by collecting posts from the Twitter Social Web. Using the coollected data and machine learning techniques this study aim to classify, in an automatic way, the occurrences of crimes in the cited area. This way, we are able to dinamically visualize space time aspects of the crime distribution due to the possibility of real time collection of data. In this work, we present how to collect tweets and the machine learning methodology for the tweet classification. At first, we present and use three text classification techniques, known as, Naive-Bayes, Decision Trees and Support Vector Machines (SVM). Next, a cross validation study is performed for each technique and they are compared by classification eficiency and computational time.pt_BR
dc.description.resumoEntender a dinâmica criminal é essencial para criação de políticas públicas mais adequadas para o controle dos diversos tipos de crimes. Neste estudo, procura-se mapear a ocorrência de crimes no estado de São Paulo através da coleta de postagens na rede social Twitter. A partir da informação dos dados coletados e através de métodos de aprendizado de máquina, o trabalho tem como objetivo classificar, de forma inteiramente automatizada, a ocorrência ou não de um evento de crime na região citada. Assim, pode-se visualizar aspectos espaço tempo da distribuição dos diversos tipos de crimes de maneira dinâmica, pois as coletas podem ser realizadas em tempo real. Nesse trabalho, apresentamos a forma empregada para coleta de tweets e os métodos de aprendizado de máquina para classificação dos tweets. Inicialmente, são utilizadas e apresentadas três técnicas de classificação de textos conhecidas como: Naive-Bayes, Árvore de Decisão e Máquinas de Vetores de Suporte (SVM). Um estudo de validação cruzada é realizado em cada uma das técnicas e essas são comparadas sob o ponto de vista da eficiência de classificação e tempo computacional.pt_BR
dc.languagePortuguêspt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectÁrvore de decisãopt_BR
dc.subjectTwitterpt_BR
dc.subjectMineração de textopt_BR
dc.subjectSVMpt_BR
dc.subjectNaive-Bayespt_BR
dc.subject.otherEstatísticapt_BR
dc.subject.otherEstatística criminalpt_BR
dc.subject.otherTwitterpt_BR
dc.subject.otherMineração de dados (Computação)pt_BR
dc.subject.otherProbabilidadespt_BR
dc.titleEstudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitterpt_BR
dc.typeDissertação de Mestradopt_BR
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
dissertacao_larissasayurifutino.pdf4.19 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.