Classificação de Tráfego para Gerenciamento de Largura de Banda em Redes Definidas por Software
Resumo
As aplicações têm requisitos diferentes em termos de largura de banda e atraso para entregar a qualidade de serviço esperada. Por esse e outros motivos, surgiram novos paradigmas como as redes definidas por software, que permitem o desenvolvimento de novas aplicações para programação dinâmica de dispositivos de roteamento na rede por meio de um dispositivo denominado controlador. Neste trabalho, são testados cinco modelos de machine learning para classificação do tráfego de rede, que quando implementados no controlador possibilitem descobrir os tipos de aplicações e seus requisitos de qualidade de serviço. Os resultados obtidos demonstram que o modelo Random Forest tem um excelente desempenho na classificação do tráfego de rede usando poucos pacotes e alcança margens de precisão muito altas. Por outro lado, notou-se que os modelos de aprendizado de máquina baseados em streaming de dados são muito sensíveis ao banco de dados e à quantidade de pacotes utilizados na classificação.
Referências
Alkazaz, A. and Saado Kharouki, M. (2020). Evaluation of adaptive random forest algorithm for classification of evolving data stream.
Amaral, P., Dinis, J., Pinto, P., Bernardo, L., Tavares, J., and Mamede, H. (2016a). Machine learning in software defined networks: Data collection and traffic classification. In 2016 IEEE 24th International Conference on Network Protocols, pages 1–5.
Amaral, P., Dinis, J., Pinto, P., Bernardo, L., Tavares, J., and Mamede, H. S. (2016b). Machine learning in software defined networks: Data collection and traffic classification. In 2016 IEEE 24th International conference on network protocols (ICNP), pages 1–5. IEEE.
Biondi, P. (2023). Welcome to scapy’s documentation! [link].
Gandhi, R. (2018). Support vector machine — introduction to machine learning algorithms. [link].
Google (2023). System requirements and supported devices for youtube. [link].
Huawei (2022). Overview of bandwidth managementt. [link].
ITU (2001). End-user multimedia QoS categories. International Telecommunication Union (ITU).
Karakus, M. and Durresi, A. (2017). Quality of service (qos) in software defined networking (sdn): A survey. Journal of Network and Computer Applications, 80:200 – 218.
Microsoft (2023). How much bandwidth does skype need? [link].
Mocelin Júnior, N. J. and Fiorese, A. (2023). Flowprisdn: A framework for bandwidth management for prioritary data flows applied to a smart city scenario. In International Conference on Advanced Information Networking and Applications, pages 346–357. Springer.
Navlani, A. (2023). Decision tree classification in python tutorial. [link].
Rabello, E. B. (2017). Cross validation: Avaliando seu modelo de machine learning. [link].
Raikar, M. M., Meena, S., Mulla, M. M., Shetti, N. S., and Karanandi, M. (2020). Data traffic classification in software defined networks (sdn) using supervised-learning. Procedia Computer Science, 171:2750–2759.
UNB (2016). Vpn-nonvpn dataset (iscxvpn2016). [link].
Verma, Y. (2021). A beginner’s guide to hoeffding tree with python implementation. [link].
Yan Chen, Toni Farley, N. Y. (2004). Qos requirements of network applications on the internet. Systems Management, 4.
Zander, S., Nguyen, T., and Armitage, G. (2012). Sub-flow packet sampling for scalable ml classification of interactive traffic. In 37th Annual IEEE Conference on Local Computer Networks, pages 68–75.
Zhou, D., Yan, Z., Fu, Y., and Yao, Z. (2018). A survey on network data collection. Journal of Network and Computer Applications, 116:9–23.
Zivkovic, S. (2022). Machine learning – introduction to random forest. [link].