Transferência de Aprendizado para Redes Bayesianas com Aplicação em Predição de Falha de Discos Rígidos
Resumo
Predizer falhas em Discos Rígidos é muito importante para evitar perda de dados e custos adicionais. Logo, um esforço pode ser observado para encontrar métodos adequados de predição de falhas. Apesar dos resultados encorajantes alcançados por vários métodos, um aspecto notado é a falta de dados disponíveis para construir modelos confiáveis. Transferência de Aprendizado oferece uma alternativa válida, uma vez que pode ser usada para transferir conhecimento de modelos de Disco com muitos dados para Discos com menos dados. Neste trabalho, avaliamos estratégias de Transferência de Aprendizado para esta tarefa. Além disso propomos uma estratégia para construir fontes de informação baseadas no agrupamento de modelos de disco parecidos. Resultados mostraram que todos os cenários testados de transferência melhoram a performance dos métodos de predição, principalmente para Discos com muito poucos dados.
Referências
Backblaze (2016). Hard drive data and stats. [link]. [Online; accessed 2017-04-26].
Chaves, I. C., de Paula, M. R. P., Leite, L. G. M., Queiroz, L. P., Gomes, J. P. P., and Machado, J. C. (2016). Banhfap: A bayesian network based failure prediction approach for hard disk drives. In Intelligent Systems (BRACIS), 2016 5th Brazilian Conference on, pages 427–432. IEEE.
Guyon, I., Weston, J., Barnhill, S., and Vapnik, V. (2002). Gene selection for cancer classification using support vector machines. Machine learning, 46(1-3):389–422.
Jocelyn T. Chi, E. C. C. and Baraniuk, R. G. (2016). k-pod: A method for k-means clustering of missing data. The American Statistician, 70:91–99.
Luis, R., Sucar, L. E., and Morales, E. F. (2010). Inductive transfer for learning bayesian networks. Machine Learning, 79(1):227–255.
McKinney, W. (2008–). Pandas: a python data analysis library. [link]. [Online; accessed 2017-04-26].
Murray, J. F., Hughes, G. F., and Kreutz-Delgado, K. (2005). Machine learning methods for predicting failures in hard drives: A multiple-instance application. Journal of Machine Learning Research, 6(May):783–816.
Pan, S. J. and Yang, Q. (2010). A survey on transfer learning. IEEE Transactions on knowledge and data engineering, 22(10):1345–1359.
Pearl, J. (1988). Probabilistic reasoning in intelligent systems.
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., et al. (2011). Scikit-learn: Machine learning in python. The Journal of Machine Learning Research, 12:2825–2830.
Pereira, F. L. F., dos Santos Lima, F. D., de Moura Leite, L. G., Gomes, J. P. P., and de Castro Machado, J. (2017). Transfer learning for bayesian networks with application on hard disk drives failure prediction. In 2017 Brazilian Conference on Intelligent Systems (BRACIS), pages 228–233. IEEE.
Spirtes, P., Glymour, C. N., and Scheines, R. (2000). Causation, prediction, and search. MIT press.
Vachtsevanos, G., Lewis, F. L., Roemer, M., Hess, A., and Wu, B. (2006). Intelligent Fault Diagnosis and Prognosis for Engineering Systems: Methods and Case Studies. John Wiley & Sons.
Xu, C., Wang, G., Liu, X., Guo, D., and Liu, T.-Y. (2016). Health status assessment and failure prediction for hard drives with recurrent neural networks. IEEE Transactions on Computers, 65(11):3502–3508.
Zhou, Y., Hospedales, T. M., and Fenton, N. (2016). When and where to transfer for bayesian network parameter learning. Expert Systems with Applications, 55:361 – 373.