Um Survey sobre a utilização de técnicas de Data Mining e Data Analytics por agências de investigação criminal do Brasil

  • Rafael Santos Universidade Federal do Sergipe
  • Fábio Nunes Universidade Federal do Sergipe
  • Manoela Oliveira Universidade Federal do Sergipe
  • Methanias Júnior Universidade Federal do Sergipe

Resumo


Em investigações criminais complexas, os envolvidos lidam com uma quantidade enorme e complexa de dados que necessitam de recursos computacionais especializados na extração de informações e correlações relevantes para o processo investigativo. Neste cenário, é necessário que haja apoio computacional, desde a etapa de armazenamento e integração entre diferentes bases de dados, até a etapa de análise estatística e descoberta de padrões. Este artigo discute os resultados de um Survey aplicado aos principais órgãos de combate ao crime organizado, tais como as agências de Inteligência de Segurança Pública – ISP, os Laboratórios de Tecnologia de Combate à Lavagem de Dinheiro – LABLDs e os Grupos de Atuação Especial de Repressão ao Crime Organizado – GAECO. O objetivo principal foi o de conhecer o cenário atual da utilização de ferramentas de análise de dados nessas agências, projetando as necessidades de pesquisa e investimentos nesta área. Entre os resultados encontrados, observou-se que 40% dos pesquisados não conhecem e 15% não utilizam soluções de ETL (Extract, Transform and Load), apesar de todos (100%) declararem possuir pelo menos uma ferramenta de Data Mining no seu local de trabalho, bem como também declararem (100%) possuir pelo menos uma ferramenta de OLAP/BI (Online Analytical Processing/Business Intelligence). Por fim e com proeminente destaque, apenas 2,77% dos pesquisados utilizam diretamente algum algoritmo de Mineração de Dados para extração de conhecimento. Este cenário evidencia, inicialmente, que a maior parte dos órgãos especializados em investigação do Brasil ainda não aplica efetivamente as técnicas de Data Mining e de Data Analytics em suas atividades.

Palavras-chave: Inteligência de Segurança Pública (ISP), Investigação, Segurança Pública, Data Mining, Data Analytics

Referências

Apache lucene. https://lucene.apache.org/. (Accessed: 01-2017), 2017.

M. M. d. Andrade et al. Introdução à metodologia do trabalho científico, 1999.

Y. BAEZA and B. Ribeiro-Neto. Modern information retrieval-the concepts and technology behind search, 2011.

N. G. Barnes. 2013 fortune 500-umass dartmouth. http://www.umassd.edu/cmr/socialmediaresearch/ 2013fortune500/. (Accessed: 09-03-2017).

R.-C. Chen, D. Spina, W. B. Croft, M. Sanderson, and F. Scholer. Harnessing semantics for answer sentence retrieval. In Proceedings of the Eighth Workshop on Exploiting Semantic Annotations in Information Retrieval, pages 21–27. ACM, 2015.

L. P. Claudino, M. B. Nunes, and F. d. Silva. Finanças pessoais: um estudo de caso com servidores públicos. Anais do SEMEAD-Seminários em Administração, São Paulo, SP, Brasil, 12, 2009.

M. T. V. Coelho. Comunicação terapêutica em Enfermagem: utilização pelos enfermeiros. PhD thesis, Instituto de Ciências Biomédicas Abel Salazar, 2015.

M. C. de Souza Minayo. Pesquisa social: teoria, método e criatividade. Editora Vozes Limitada, 2011.

A. Grappy, B. Grau, M.-H. Falco, A.-L. Ligozat, I. Robba, and A. Vilnat. Selecting answers to questions from web documents by a robust validation process. In Web Intelligence and Intelligent Agent Technology (WI-IAT), 2011 IEEE/WIC/ACM International Conference on, volume 1, pages 55–62. IEEE, 2011.

E. H. Hovy, L. Gerber, U. Hermjakob, M. Junk, and C.-Y. Lin. Question answering in webclopedia. In TREC, volume 52, pages 53–56, 2000.

S.-m. Kim and Y.-g. Ha. Automated discovery of small business domain knowledge using web crawling and data mining. In Big Data and Smart Computing (BigComp), 2016 International Conference on, pages 481–484. IEEE, 2016.

S. N. Kim, L. Cavedon, and T. Baldwin. Classifying dialogue acts in one-on-one live chats. In Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing, pages 862–871. Association for Computational Linguistics, 2010.

N. N. Knupfer and H. McLellan. 41. descriptive research methodologies. 1996.

C. R. Kothari. Research methodology: Methods and techniques. New Age International, 2004.

E. M. Lakatos and M. d. A. Marconi. Fundamentos da metodologia científica. In Fundamentos da metodologia científica. Altas, 2010.

S. L. Lo, R. Chiong, and D. Cornforth. Ranking of high-value social audiences on twitter. Decision Support Systems, 85:34–48, 2016.

P. Molino and L. M. Aiello. Distributed representations for semantic matching in non-factoid question answering. In SMIR@ SIGIR, pages 38–45, 2014.

C. F. Picard. Graphs and questionnaires, volume 32. Elsevier, 1980.

B. Pôssas, N. Ziviani, W. Meira Jr, and B. Ribeiro-Neto. Set-based vector model: An ecient approach for correlation-based ranking. ACM Transactions on Information Systems (TOIS), 23(4):397–429, 2005.

P. B. Sheatsley, P. H. Rossi, J. D. Wright, and A. B. Anderson. Questionnaire construction and item writing. Handbook of survey research, pages 195–230, 1983.

W. Song, M. Feng, N. Gu, and L. Wenyin. Question similarity calculation for faq answering. In Semantics, Knowledge and Grid, Third International Conference on, pages 298–301. IEEE, 2007.

I. Srba and M. Bielikova. A comprehensive survey and classification of approaches for community question answering. ACM Trans. Web, 10(3):18:1–18:63, Aug. 2016.

S. Vieira. Como elaborar questionários. Atlas, 2009.

L. M. Villar, A. J. d. Almeida, M. C. A. d. Lima, J. L. V. d. Almeida, L. F. B. d. Souza, and V. S. d. Paula. A percepção ambiental entre os habitantes da região noroeste do estado do rio de janeiro. E. Anna Nery Revista Enfermagem, 12(2):285–290, 2008.

R. S. Waslawick. Metodologia de pesquisa para ciência da computação. Elsevier, Rio de Janeiro, 2014.

D. Yang, M. Piergallini, I. Howley, and C. Rose. Forum thread recommendation for massive open online courses. In Educational Data Mining 2014, 2014.
Publicado
17/05/2017
SANTOS, Rafael; NUNES, Fábio; OLIVEIRA, Manoela; JÚNIOR, Methanias. Um Survey sobre a utilização de técnicas de Data Mining e Data Analytics por agências de investigação criminal do Brasil. In: SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 13. , 2017, Lavras. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2017 . p. 593-600. DOI: https://doi.org/10.5753/sbsi.2017.6092.