Extração e Avaliação de uma Base de Dados sobre Criminalidade em Português a partir do Twitter

  • Gabriel V. da Fonseca Miranda UFV
  • Vinícius Gabriel de J. Almeida UFV
  • Thais R. M. Braga Silva UFV
  • Fabrício A. Silva UFV

Resumo


Nos últimos anos, trabalhos que descrevem soluções de segurança para casas, sistemas de transporte e até mesmo cidades inteligentes têm sido desenvolvidos. Neste cenário, dados sobre criminalidade têm se tornado cada vez mais importantes. Embora ocorrências em bases policiais sejam frequentemente utilizadas, muitas vezes os crimes mais corriqueiros acabam não sendo registrados dessa forma. O objetivo deste trabalho é apresentar um método para a extração de dados de criminalidade em português a partir de postagens no Twitter feitas na cidade de São Paulo. A maioria dos trabalhos relacionados encontrados faz esse tipo de extração automatizada para textos em inglês. Quando o português é considerado, frequentemente a acurácia não é apresentada e a base final é pequena. Neste trabalho, a base de dados final possui 1.333 tweets rotulados, que foram comparados a uma base policial, mostrando similaridades e possibilidades de complementação de informações.

Referências

Adesola, F., Misra, S., Omoregbe, N., Damasevicius, R., and Maskeliunas, R. (2019). An IOT-Based Architecture for Crime Management in Nigeria, pages 245–254. Springer Singapore, Singapore.

Cai, L. and Zhu, Y. (2015). The challenges of data quality and data quality assessment in the big data era. Data Sci. J., 14:2.

Clarindo, J. P., Coutinho, F., and Freitas, A. L. (2016). Detecção de casos de violência patrimonial a partir do twitter. In Anais do V Brazilian Workshop on Social Network Analysis and Mining, pages 211–216. SBC.

dos Reis, G. O. and Nakamura, E. F. (2017). Crimes: reportes oficiais vs. postagens no twitter. In Anais Estendidos do XXIII Simpósio Brasileiro de Sistemas Multimídia e Web, pages 111–114. SBC.

dos Santos, L. S. F. C. (2015). Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social twitter. Master’s thesis, Universidade Federal de Minas Gerais, Belo Horizonte.

Gerber, M. S. (2014). Predicting crime using twitter and kernel density estimation. Decision Support Systems, 61:115–125.

Laufs, J., Borrion, H., and Bradford, B. (2020). Security and the smart city: A systematic review. Sustainable Cities and Society, 55:102023.

Mahajan, R. and Mansotra, V. (2021). Correlating crime and social media: using semantic sentiment analysis. International Journal of Advanced Computer Science and Applications, 12(3).

Neto, A. J. V., Zhao, Z., Rodrigues, J. J. P. C., Camboim, H. B., and Braun, T. (2018). Fog-based crime-assistance in smart iot transportation system. IEEE Access, 6:11101–11111.

Prathap, B. R. and Ramesha, K. (2018). Twitter sentiment for analysing different types of crimes. In 2018 International Conference on Communication, Computing and Internet of Things (IC3IoT), pages 483–488. IEEE.

Sarhan, Q. I. (2020). Systematic survey on smart home safety and security systems using the arduino platform. IEEE Access, 8:128362–128384.

Secron, T. M., da Silva, E. R., de Farias, C. M., and Cruz, T. (2016). Sigaciente: Uma ferramenta para inferência do trânsito e de rotas seguras baseada em dados sociais. In ERSI’2016, pages 58–65.

Vivek, M. and Prathap, B. R. (2023). Spatio-temporal crime analysis and forecasting on twitter data using machine learning algorithms. SN Computer Science, 4(4):383.
Publicado
06/08/2023
MIRANDA, Gabriel V. da Fonseca; ALMEIDA, Vinícius Gabriel de J.; SILVA, Thais R. M. Braga; SILVA, Fabrício A.. Extração e Avaliação de uma Base de Dados sobre Criminalidade em Português a partir do Twitter. In: SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO UBÍQUA E PERVASIVA (SBCUP), 15. , 2023, João Pessoa/PB. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 61-70. ISSN 2595-6183. DOI: https://doi.org/10.5753/sbcup.2023.230076.