Automating the Classification of Crime Reports in Altamira, Pará using BERT-based Architectures
Resumo
Com o crescente volume de dados gerados na segurança pública, surge uma necessidade urgente de automatizar os procedimentos internos para garantir uma resposta mais rápida e eficaz. Este artigo apresenta a aplicação de algoritmos baseados no ajuste fino da arquitetura Bidirectional Encoder Representations from Transformers (BERT) para classificar crimes em relatos de boletins de ocorrência da Cidade de Altamira, Pará. Os resultados obtidos demonstraram que o BERTimbau alcançou acurácias entre 88% e 90% nos testes realizados, indicando um grande potencial para otimizar a consolidação dos boletins de ocorrência e contribuir significativamente para a segurança pública.
Palavras-chave:
Grandes modelos de linguagem, Aprendizado de Máquina, Processamento de Linguagem Natural
Referências
Alves, D., Marques, M., Santos, R., and Santos, A. (2024). Classificação de boletins de ocorrências através de modelos de linguagem baseados em bert. In Anais do XII Workshop de Computação Aplicada em Governo Eletrônico, pages 169–179, Porto Alegre, RS, Brasil. SBC.
Assad, F. J. P. and Chagas, J. F. C. (2019). Análise preditiva de manchas criminais no estado de são paulo.
Brasil (2019). O sistema nacional de informações de segurança pública, prisionais, de rastreabilidade de armas e munições, de material genético, de digitais e de drogas (sinesp). Disponível em: [link]. Acesso em : 27 de julho de 2024.
Brasil (2022). Após dois anos, chega ao fim estado de emergência em saúde pública por conta da covid-19 no brasil. Disponível em: [link]. Acesso em : 27 de julho de 2024.
Brasil (2023). Agu inova no uso de inteligência artificial para aprimorar eficiência e prestação de serviços à sociedade. Disponível em: [link]. Acesso em : 18 de agosto de 2024.
Brasil (2024). Anuário brasileiro de segurança pública 2024. Disponível em: [link]. Acesso em : 27 de julho de 2024.
Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., Wirth, R., et al. (2000). Crisp-dm 1.0: Step-by-step data mining guide. SPSS inc, 9(13):1–73.
Devlin, J., Chang, M., Lee, K., and Toutanova, K. (2018). Bert: Pre-training of deep bidirectional transformers for language understanding. CoRR, abs/1810.04805.
Farias, H. S. d. (2020). O avanço da covid-19 e o isolamento social como estratégia para redução da vulnerabilidade. Espaço e Economia. Revista brasileira de geografia econômica, (17).
Koegl, C. J. and Day, D. M. (2019). The monetary costs of crime for a sample of offenders in ontario. Canadian Journal of Criminology and Criminal Justice, 61(3):21–44.
Ratul, M. A. R. (2020). A comparative study on crime in denver city based on machine learning and data mining. arXiv preprint arXiv:2001.02802.
Souza, F., Nogueira, R., and Lotufo, R. (2020). Bertimbau: pretrained bert models for brazilian portuguese. In 9th Brazilian Conference on Intelligent Systems, BRACIS, Rio Grande do Sul, Brazil, October 20-23 (to appear).
Souza, S. L. (2022). Mineração de dados em banco de dados de segurança pública no estado do pará, brasil. Dissertação de Mestrado, Programa de Pós-Graduação em Segurança Pública. Universidade Federal do Pará.
Trindade, E. A. R. A. (2019). Homicídios na região metropolitana de Belém: práticas para contenção e vulnerabilidades. Dissertação de Mestrado, Programa de Pós-Graduação em Segurança Pública. Universidade Federal do Pará.
Assad, F. J. P. and Chagas, J. F. C. (2019). Análise preditiva de manchas criminais no estado de são paulo.
Brasil (2019). O sistema nacional de informações de segurança pública, prisionais, de rastreabilidade de armas e munições, de material genético, de digitais e de drogas (sinesp). Disponível em: [link]. Acesso em : 27 de julho de 2024.
Brasil (2022). Após dois anos, chega ao fim estado de emergência em saúde pública por conta da covid-19 no brasil. Disponível em: [link]. Acesso em : 27 de julho de 2024.
Brasil (2023). Agu inova no uso de inteligência artificial para aprimorar eficiência e prestação de serviços à sociedade. Disponível em: [link]. Acesso em : 18 de agosto de 2024.
Brasil (2024). Anuário brasileiro de segurança pública 2024. Disponível em: [link]. Acesso em : 27 de julho de 2024.
Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., Wirth, R., et al. (2000). Crisp-dm 1.0: Step-by-step data mining guide. SPSS inc, 9(13):1–73.
Devlin, J., Chang, M., Lee, K., and Toutanova, K. (2018). Bert: Pre-training of deep bidirectional transformers for language understanding. CoRR, abs/1810.04805.
Farias, H. S. d. (2020). O avanço da covid-19 e o isolamento social como estratégia para redução da vulnerabilidade. Espaço e Economia. Revista brasileira de geografia econômica, (17).
Koegl, C. J. and Day, D. M. (2019). The monetary costs of crime for a sample of offenders in ontario. Canadian Journal of Criminology and Criminal Justice, 61(3):21–44.
Ratul, M. A. R. (2020). A comparative study on crime in denver city based on machine learning and data mining. arXiv preprint arXiv:2001.02802.
Souza, F., Nogueira, R., and Lotufo, R. (2020). Bertimbau: pretrained bert models for brazilian portuguese. In 9th Brazilian Conference on Intelligent Systems, BRACIS, Rio Grande do Sul, Brazil, October 20-23 (to appear).
Souza, S. L. (2022). Mineração de dados em banco de dados de segurança pública no estado do pará, brasil. Dissertação de Mestrado, Programa de Pós-Graduação em Segurança Pública. Universidade Federal do Pará.
Trindade, E. A. R. A. (2019). Homicídios na região metropolitana de Belém: práticas para contenção e vulnerabilidades. Dissertação de Mestrado, Programa de Pós-Graduação em Segurança Pública. Universidade Federal do Pará.
Publicado
17/11/2024
Como Citar
SILVA, Gabryel; KURIBAYASHI, Hugo; SANTOS, Reginaldo; SANTOS, Adam.
Automating the Classification of Crime Reports in Altamira, Pará using BERT-based Architectures. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 21. , 2024, Belém/PA.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2024
.
p. 823-833.
ISSN 2763-9061.
DOI: https://doi.org/10.5753/eniac.2024.245263.