Prediction of road accidents in Santa Catarina: impacts of data enhancements
Abstract
Este trabalho foca no ajuste de dados antes do treinamento de modelos para predizer acidentes rodoviários. Usa registros da Polícia Rodoviária Federal (PRF) sobre acidentes em Santa Catarina. Uma análise exploratória desses dados permitiu identificar inconsistências entre registros de acidentes em cada trecho de 100 metros. Isso motivou a correção e complementação dos dados da PRF, usando informações de outras fontes sobre as vias, antes de treinar modelos preditivos. Modelos RF, SVM e MLP foram treinados com os dados originais e melhorados. Experimentos revelaram que melhoramentos nos dados permitiram aumentar significativamente a acurácia e o F1-Score dos modelos RF e SVM, enquanto a inclusão de novas variáveis teve impacto menor.References
ANTT (2025). Base de dados de rodovias federais da agência nacional de transportes terrestres. [link] (acessado em 7 março 2025).
Cai, Q., Abdel-Aty, M., Yuan, J., Lee, J., and Wu, Y. (2020). Real-time crash prediction on expressways using deep generative models. Transportation Research Part C: Emerging Technologies, 117:102697.
DNIT (2025). Departamento nacional de infraestrutura de transportes, vgeo - sistema de informações geográficas do DNIT. [link] (acessado em 7 março 2025).
Huang, T., Wang, S., and Sharma, A. (2020). Highway crash detection and risk estimation using deep learning. Accident Analysis Prevention, 135:105392.
Mo, W., Lee, J., Abdel-Aty, M., Mao, S., and Jiang, Q. (2024). Dynamic short-term crash analysis and prediction at toll plazas for proactive safety management. Accident Analysis Prevention, 197:107456.
Peng, Y., Li, C., Wang, K., Gao, Z., and Yu, R. (2020). Examining imbalanced classification algorithms in predicting real-time traffic crash risk. Accident Analysis Prevention, 144:105610.
PRF, P. R. F. (2025). Dados abertos da PRF. [link] (acessado em 5 março 2025).
Tran, T., He, D., Kim, J., and Hickman, M. (2023). Msgnn: A multi-structured graph neural network model for real-time incident prediction in large traffic networks. Transportation Research Part C: Emerging Technologies, 156:104354.
Yu, L., Du, B., Hu, X., Sun, L., Han, L., and Lv, W. (2021). Deep spatio-temporal graph convolutional network for traffic accident prediction. Neurocomputing, 423:135–147.
Cai, Q., Abdel-Aty, M., Yuan, J., Lee, J., and Wu, Y. (2020). Real-time crash prediction on expressways using deep generative models. Transportation Research Part C: Emerging Technologies, 117:102697.
DNIT (2025). Departamento nacional de infraestrutura de transportes, vgeo - sistema de informações geográficas do DNIT. [link] (acessado em 7 março 2025).
Huang, T., Wang, S., and Sharma, A. (2020). Highway crash detection and risk estimation using deep learning. Accident Analysis Prevention, 135:105392.
Mo, W., Lee, J., Abdel-Aty, M., Mao, S., and Jiang, Q. (2024). Dynamic short-term crash analysis and prediction at toll plazas for proactive safety management. Accident Analysis Prevention, 197:107456.
Peng, Y., Li, C., Wang, K., Gao, Z., and Yu, R. (2020). Examining imbalanced classification algorithms in predicting real-time traffic crash risk. Accident Analysis Prevention, 144:105610.
PRF, P. R. F. (2025). Dados abertos da PRF. [link] (acessado em 5 março 2025).
Tran, T., He, D., Kim, J., and Hickman, M. (2023). Msgnn: A multi-structured graph neural network model for real-time incident prediction in large traffic networks. Transportation Research Part C: Emerging Technologies, 156:104354.
Yu, L., Du, B., Hu, X., Sun, L., Han, L., and Lv, W. (2021). Deep spatio-temporal graph convolutional network for traffic accident prediction. Neurocomputing, 423:135–147.
Published
2025-04-23
How to Cite
FÜHR, Gustavo Konescki; INACIO, Eduardo Camilo; FILETO, Renato.
Prediction of road accidents in Santa Catarina: impacts of data enhancements. In: REGIONAL DATABASE SCHOOL (ERBD), 20. , 2025, Florianópolis/SC.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 60-69.
ISSN 2595-413X.
DOI: https://doi.org/10.5753/erbd.2025.7274.
