Desenvolvimento e Análise de Algoritmos Aplicados na Predição de Acidentes em Ambiente Fabril

  • Brayan C. Ksenhuck AMBEV
  • Mário E. M. Vieira AMBEV
  • Thiago A. Lechuga AMBEV
  • Fabrício O. Bezerra HBSIS
  • Pedro L. P. Corrêa USP

Resumo


Acidentes de trabalho é um tema relevante, principalmente quando temos uma realidade no Brasil onde ocorreram mais de meio milhão de ocorrências no ano de 2017. Na empresa onde este projeto foi realizado da área de Alimentação e Bebidas, não diferente do cenário nacional, é abordado como um tema crítico, necessitando-se de uma abordagem focada para resolver este problema. Este trabalho apresenta um caso de estudo de um planejamento de 10 anos para diminuição nos acidentes de trabalho, concluindo-se na entrega de um algoritmo de predição de acidentes. O objetivo deste trabalho foi desenvolver um modelo de predição e analisar os resultados de cinco diferentes algoritmos para indicar a probabilidade de possíveis acidentes nas cervejarias, sendo possível tomar ações preventivas. Como escopo de análise, foram abordados os algoritmos, Random Forest, Regressão Logística, Classificador XGB, Linear SVC, SVC. O algoritmo que obteve a melhor desempenho, utilizando a métrica ROC_AUC como determinante, foi o Support Vector Clustering (SVC) com 73,75%. Com este, o modelo realiza a predição com aproximadamente 62% de precisão e 74% de recall. O principal diferencial deste trabalho é a publicação do código fonte como software livre na plataforma GitHub para aplicação em outras empresas de manufatura, bens de consumo, entre outras.

Palavras-chave: código fonte livre, aprendizado de máquina, análise de desempenho, labor accident

Referências

LORENA, Talita. . In: MINISTÉRIO DA ECONOMIA. Acidentes de trabalho apresentam queda de 6,2% em 2017. [S. l.], 28 set. 2018. Disponível em: http://www.previdencia.gov.br/2018/09/acidentes-de-trabalho-apresentam-queda-de-62-em-2017/. Acesso em: 22 mar. 2019.

PENN, Chris. . In: IBM. The evolution of the data-driven company. [S. l.], 24 fev. 2017. Disponível em: https://www.ibm.com/blogs/business-analytics/evolution-data-driven-company/. Acesso em: 11 fev. 2019.

JUNIOR, Sergio Ricardo Correia de Sá. A regulação jurídica da proteção de dados pessoais no Brasil. In: JUNIOR, Sergio Ricardo Correia de Sá. A regulação jurídica da proteção de dados pessoais no Brasil. Orientador: Eduardo Magrani. 2018. Monografia (Programa de Pós-Graduação) - Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2018. f. 47. Disponível em: https://www.maxwell.vrac.puc-rio.br/37295/37295.PDF. Acesso em: 19 ago. 2019.

BATANERO C.; ESTEPA A.; GODINO J.D. Análisis exploratorio de datos: sus posibilidades en la enseñanza secundaria. Suma, 9, 25-31. 1991.

Gustavo Enrique de Almeida Prado Alves. Pré-processamento de dados em aprendizado de máquina supervisionado. 2003. Monografia (Doutorado em Instituto de Ciências Matemáticas e de Computação) - USP. São Paulo.

CHAPMAN, Pete et al. CRISP-DM 1.0 Step-by-step data mining guide, USA: SPSS Inc. CRISPWP-0800, 2000.

WITTEN, Ian H. et al. Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann, 2016.

PÉREZ, Joaquín et al. A data preparation methodology in data mining applied to mortality population databases. In: New Contributions in Information Systems and Technologies. Springer, Cham, 2015. p. 1173-1182.

CASTRO, JORGE ALBERTO. VINHETA HISTÓRICA KARL PEARSON. SESQUICENTENÁRIO DE SEU NASCIMENTO. Portal de Periódicos Científicos - FURG, [S. l.], ano 2007, 2007. Disponível em: https://periodicos.furg.br/vittalle/article/download/982/414. Acesso em: 19 jul. 2019.

Rodgers, J. L., & Nicewander, W. A. (1988). Thirteen Ways to Look at the Correlation Coefficient. The American Statistician, 42(1), 59-66.

PRATI, R. C.; BATISTA, G. E. A. P. A.; MONARD, M. C. Curvas ROC para avaliação de classificadores. The Institute of Electrical and Electronics Engineers (IEEE), [S. l.], 2008. Disponível em: http://conteudo.icmc.usp.br/pessoas/gbatista/files/ieee_la2008.pdf. Acesso em: 27 ago. 2019.

REFAEILZADEH, PAYAM; TANG, LEI; LIU, HUAN. Cross-Validation. Cross-Validation, Arizona State University, 2008. Disponível em: http://leitang.net/papers/ency-cross-validation.pdf. Acesso em: 22 jul. 2019.

R. Kohavi, “A study of cross-validation and bootstrap for accuracy estimation and model selection,” Proceedings of the International Joint Conference on Artificial Intelligence, pp. 1137-1145, 1995.

Fushiki, T. (2009). Estimation of prediction error by using K-fold cross-validation. Statistics and Computing, 21(2), 137–146. doi:10.1007/s11222-009-9153-8

Menditto, A., Patriarca, M., & Magnusson, B. (2006). Understanding the meaning of accuracy, trueness and precision. Accreditation and Quality Assurance, 12(1), 45–47. doi:10.1007/s00769-006-0191-z.

Monico, Galera & Dal Poz, Aluir & Galo, Mauricio & Santos, Marcelo & Oliveira, Leonardo. (2009). Acurácia e precisão: revendo os conceitos de forma acurada / Accuracy and Precision: Reviewing the concepts by means of an accurate procedure. Boletim de Ciencias Geodesicas. 15. 469-483. 10.13140/2.1.1815.8086.

PRATI, R. C.; BATISTA, G. E. A. P. A.; MONARD, M. C. Curvas ROC para avaliação de classificadores. The Institute of Electrical and Electronics Engineers (IEEE), [S. l.], 2008. Disponível em: http://conteudo.icmc.usp.br/pessoas/gbatista/files/ieee_la2008.pdf. Acesso em: 27 ago. 2019.

Sá, Clebiano da Costa. Métodos de validação tradicional e temporal aplicados à avaliação de classificadores de RNAs codificantes e não codificantes. 2018. Dissertação (Mestrado em Bioinformática) - Bioinformática, Universidade de São Paulo, São Paulo, 2018. doi:10.11606/D.95.2018.tde-19052018-122805. Acesso em: 2019-09-04.

MATTHEWS, Brian W. Comparison of the predicted and observed secondary structure of T4 phage lysozyme. Biochimica et Biophysica Acta (BBA)-Protein Structure, v. 405, n. 2, p. 442-451, 1975.

Jurman G, Riccadonna S, Furlanello C (2012) A Comparison of MCC and CEN Error Measures in Multi-Class Prediction. PLOS ONE 7(8): e41882. https://doi.org/10.1371/journal.pone.0041882
Publicado
27/11/2019
KSENHUCK, Brayan C.; VIEIRA, Mário E. M. ; LECHUGA, Thiago A. ; BEZERRA, Fabrício O. ; CORRÊA, Pedro L. P. . Desenvolvimento e Análise de Algoritmos Aplicados na Predição de Acidentes em Ambiente Fabril. In: CONGRESSO LATINO-AMERICANO DE SOFTWARE LIVRE E TECNOLOGIAS ABERTAS (LATINOWARE), 16. , 2019, Foz do Iguaçu. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 22-31. DOI: https://doi.org/10.5753/latinoware.2019.10329.