Proposta de uma arquitetura de Data Warehouse para análise de SDN e aplicações de Aprendizado de Máquina
Resumo
Este artigo apresenta a proposta de uma arquitetura de Data Warehouse que tem como fonte de dados e objeto de estudo os fluxos IP e ataques em SDN. A proposta tem como objetivo fornecer um conjunto de dados consistente e limpo para aplicações de aprendizado de máquina e qualquer aplicação que deseje consumir dados desta característica. Para atingir os objetivos propostos foi desenvolvido um banco de dados multidimensional, que é alimentado por uma etapa de ETL baseada na coleta de fluxos de rede. Dentre resultados obtidos é a arquitetura em si, na qual um conjunto de dados pode ser explorado através de consultas OLAP pelas aplicações de aprendizado de máquina.
Referências
Costa, L. R. (2013). OpenFlow e o Paradigma de Redes Definidas por Software. Universidade de Brasília.
Huang, N.-F., Li, C.-C., Li, C.-H., et al. (2017). Application identification system for SDN QoS based on machine learning and DNS responses. In 2017 19th Asia-Pacific Network Operations and Management Symposium (APNOMS). IEEE.
Kimball, R. and Ross, M. (2011). The data warehouse toolkit: the complete guide todimensional modeling. 2nd revised ed. Canada: John Wiley and Sons, Inc.
Lopez, M. A., Lobato, A. G. P., Mattos, D. M. F. and Alvarenga, I. D. (2017). Um Algoritmo Não Supervisionado e Rápido para Seleção de Características em Classificação de Tráfego. In XXXV Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos. Sociedade Brasileira de Computação (SBC).
Losarwar, V. and Joshi, D. M. (2012). Data Preprocessing in Web Usage Mining. In International Conference on Artificial Intelligence and Embedded Systems(ICAIES’2012).
Mansmann, S., Ur Rehman, N., Weiler, A. and Scholl, M. H. (2014). Discovering OLAP dimensions in semi-structured data. Information Systems, v. 44, p. 120–133.
Moro, F. L., Amaral, A., Amaral, A. P. and Nogueira, R. (nov 2017). Detecção e autorreparo de anomalias em redes definidas por software. In XVII Simpósio Brasileiro em Segurança da Informação e de Sistemas Computacionais. Sociedade Brasileira de Computação (SBC).
Nogueira, R. (2017). Newsminer: um sistema de data warehouse baseado em textos de notícias. Universidade Federal de São Carlos (UFSCar).