Avaliação Preliminar de Técnicas de PLN para Classificação de Relatos em Boletins de Ocorrência Policial
Resumo
Este trabalho investiga a aplicação de técnicas de Processamento de Linguagem Natural (PLN) para análise de relatos textuais de Boletins de Ocorrência (BOs) da Secretaria de Segurança Pública do Estado do Piauí. A análise manual destes relatos é complexa e morosa. Esta fase inicial foca na classificação automática da natureza da ocorrência a partir da descrição textual não estruturada, um passo fundamental para futuras verificações de consistência e extração de informações. Avaliamos três abordagens: Random Forest com TF-IDF, uma rede híbrida CNN-LSTM com embeddings GloVe pré-treinados, e um Grande Modelo de Linguagem (LLM) Qwen 2.5 7B ajustado via QLoRA. Resultados preliminares em um dataset balanceado indicam que o LLM ajustado obteve o melhor desempenho (F1-Score: 0.69), superando o Random Forest (0.61) e a CNN-LSTM (0.59). Questões de qualidade dos dados foram identificadas como um possível gargalo, sugerindo que trabalhos futuros devem focar na limpeza dos dados e no refinamento de métodos de extração com LLMs.
Referências
Anjos Junior, O. and et al. (2020). Padrões de concentração espacial de roubos de automóveis em municípios da grande joão pessoa a partir de técnicas de aprendizado de máquinas. Teoria e Prática em Administração, 11(2):28–45.
Bird, S., Klein, E., and Loper, E. (2009). Natural language processing with Python: analyzing text with the natural language toolkit. O’Reilly Media, Inc.
Castro, U. R. M. (2020). Explorando aprendizagem supervisionada em dados heterogêneos para predição de crimes. Dissertação de mestrado, PUC-Minas.
Delegacia Virtual (2025). Delegacia virtual do ministério da justiça e segurança pública. Acesso em: 24 mar. 2025.
Kremer, G. R. (2023). Algoritmos de aprendizado de máquina aplicados a dados públicos para obtenção de insights em segurança pública. Trabalho de Conclusão de Curso (TCC).
Matos, H., Souza, S., Santos, R., Costa, J., and Costa, C. (2022). A supervised classifier for police reports at the state of pará, brazil. In Anais da II Escola Regional de Alto Desempenho Norte 2 e II Escola Regional de Aprendizado de Máquina e Inteligência Artificial Norte 2, pages 21–24, Porto Alegre, RS, Brasil. SBC.
