Avaliação Preliminar de Técnicas de PLN para Classificação de Relatos em Boletins de Ocorrência Policial

  • Ryan F. de Sousa UFPI
  • Raimundo S. Moura UFPI

Resumo


Este trabalho investiga a aplicação de técnicas de Processamento de Linguagem Natural (PLN) para análise de relatos textuais de Boletins de Ocorrência (BOs) da Secretaria de Segurança Pública do Estado do Piauí. A análise manual destes relatos é complexa e morosa. Esta fase inicial foca na classificação automática da natureza da ocorrência a partir da descrição textual não estruturada, um passo fundamental para futuras verificações de consistência e extração de informações. Avaliamos três abordagens: Random Forest com TF-IDF, uma rede híbrida CNN-LSTM com embeddings GloVe pré-treinados, e um Grande Modelo de Linguagem (LLM) Qwen 2.5 7B ajustado via QLoRA. Resultados preliminares em um dataset balanceado indicam que o LLM ajustado obteve o melhor desempenho (F1-Score: 0.69), superando o Random Forest (0.61) e a CNN-LSTM (0.59). Questões de qualidade dos dados foram identificadas como um possível gargalo, sugerindo que trabalhos futuros devem focar na limpeza dos dados e no refinamento de métodos de extração com LLMs.

Referências

Amorim, M. S. and Pereira, J. R. S. (2019). Tipificação de ocorrências policiais utilizando machine learning. Trabalho de Conclusão de Curso (TCC).

Anjos Junior, O. and et al. (2020). Padrões de concentração espacial de roubos de automóveis em municípios da grande joão pessoa a partir de técnicas de aprendizado de máquinas. Teoria e Prática em Administração, 11(2):28–45.

Bird, S., Klein, E., and Loper, E. (2009). Natural language processing with Python: analyzing text with the natural language toolkit. O’Reilly Media, Inc.

Castro, U. R. M. (2020). Explorando aprendizagem supervisionada em dados heterogêneos para predição de crimes. Dissertação de mestrado, PUC-Minas.

Delegacia Virtual (2025). Delegacia virtual do ministério da justiça e segurança pública. Acesso em: 24 mar. 2025.

Kremer, G. R. (2023). Algoritmos de aprendizado de máquina aplicados a dados públicos para obtenção de insights em segurança pública. Trabalho de Conclusão de Curso (TCC).

Matos, H., Souza, S., Santos, R., Costa, J., and Costa, C. (2022). A supervised classifier for police reports at the state of pará, brazil. In Anais da II Escola Regional de Alto Desempenho Norte 2 e II Escola Regional de Aprendizado de Máquina e Inteligência Artificial Norte 2, pages 21–24, Porto Alegre, RS, Brasil. SBC.
Publicado
28/05/2025
SOUSA, Ryan F. de; MOURA, Raimundo S.. Avaliação Preliminar de Técnicas de PLN para Classificação de Relatos em Boletins de Ocorrência Policial. In: ENCONTRO UNIFICADO DE COMPUTAÇÃO DO PIAUÍ (ENUCOMPI), 17. , 2025, Teresina/PI. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 79-88. DOI: https://doi.org/10.5753/enucompi.2025.9622.