TÍTULO: Uso de Dados Provenientes de Rede Social e Técnica de Mineração de Dados para Classificar Crimes em Belém-PA
TITLE: Use of Social Network Data and Data Mining Technique to Classify Crimes in Belém-PA
autor/author(s): Furtado, L.S. & Souza, A.M.F.
RESUMO: A Grande Belém enfrenta o desafio de reduzir a taxa de criminalidade na capital e nos municípios. O ano de 2017 foi o mais violento da história: a recordista marca de 4.416 mortes violentas foi registrada no referido estado, com a média diária de 12 mortes. Inserido neste contexto, este trabalho tem como objetivo identificar e classificar crimes realizados em determinados bairros de Belém utilizando a técnica de mineração de dados. Na primeira etapa foi realizada a extração e seleção dos dados usando a ferramenta computacional python e armazenando-os em uma planilha eletrônica (Excel). Na segunda etapa, aconteceu o préprocessamento, a organização dos dados, ou seja, realizamos a limpeza, integração, transformação e redução do conjunto de dados. No penúltimo momento, foi utilizado o algoritmo chamado Árvore de Classificação e Regressão nos dados coletados utilizando a biblioteca SciKit-Learning. A última etapa do processo foi a avaliação dos dados das quatro métricas de desempenho estabelecidas: acurácia, taxa de erro, sensibilidade e especificidade. Através da Utilização da seleção dos dados foi possível sumarizá-los, assim como, dos testes e experimentos realizados com a técnica de mineração de dados, foi possível identificar padrões escondidos nas postagens em redes sociais, facilitando a identificação das ocorrências criminosas em Belém-PA. Dessa forma, a sociedade tomará conhecimento da situação que se encontra os crimes na cidade nos seus respectivos meses, dias da semana, períodos do dia e bairros no intuito de se proteger ou ficar em alerta ao andar por determinados locais onde a incidência de crimes é grande.
ABSTRACT: Greater Belém faces the challenge of reducing the crime rate in the capital and in the municipalities. The year 2017 was the most violent in history: the record-breaking 4,416 violent deaths were recorded in that state, with a daily average of 12 deaths. Inserted in this context, this work aims to identify and classify crimes carried out in certain neighborhoods of Belem using the data mining technique. In the first step the data was extracted and selected using the python computational tool and stored in an electronic spreadsheet (Excel). In the second stage, preprocessing, the organization of the data, took place, i.e., we cleaned, integrated, transformed, and reduced the data set. In the penultimate step, the algorithm called Classification and Regression Tree was used on the collected data using the SciKit-Learning library. The last step of the process was the evaluation of the data for the four established performance metrics: accuracy, error rate, sensitivity, and specificity. Through the use of data selection it was possible to summarize the data, as well as, through the tests and experiments performed with the data mining technique, it was possible to identify hidden patterns in social network posts, facilitating the identification of criminal occurrences in Belém-PA. In this way, society will become aware of the situation of crimes in the city in their respective months, days of the week, periods of the day and neighborhoods in order to protect themselves or be alert when walking through certain places where the incidence of crime is high.
PALAVRAS-CHAVE: Mineração de Dados, Árvore de Decisão, Crimes em Belém do Pará.
KEYWORDS: Data Mining, Decision Tree, Crime in Belém do Pará.
CITAÇÃO / CITATION: Furtado, L. S. & Souza A. M. F. Uso de Dados Provenientes de Rede Social e Técnica de Mineração de Dados para Classificar Crimes em Belém-PA. The Academic Society Journal, 3(2) 121-134, 2019. DOI: doi.org/10.32640/tasj.2019.2.121.