Advancing Network Monitoring and Operation with In-band Network Telemetry and Data Plane Programmability
Resumo
Redes de comunicação modernas operam sob altas expectativas de desempenho e resiliência. Isto, principalmente em função da continua proliferação de aplicações inelásticas altamente distribuídas. Neste contexto, torna-se essencial para a operação de uma infraestrutura de rede a monitoração aguçada do estado, comportamento, e desempenho do tráfego e dos dispositivos de rede assim como a resolução ágil de quaisquer problems os afetem. Nesta tese, faz-se diversas contribuições — alicerçadas em telemetria de rede in-band e programabilidade do plano — para a disciplina de monitoração e operação de redes. Formaliza-se problemas de orquestração de ações de telemetria, provase o pertencimento destes à classe de problemas NP-Completos, e propõe-se heurísticas polinomiais capazes de resolver instâncias reais destes problemas em tempo hábil. Projeta-se, também, um sistema que combina telemetria in-band e computação in-network para possibilitar a detecção e diagnóstico de violações de service-level objectives de forma altamente acurada e precisa. Finalmente, introduz-se uma abordagem para recuperação de falhas de dispositivos e enlaces de rede que re-roteia tráfego através de caminhos ótimos (segundo políticas de encaminhamento) na escala de tempo do plano de dados. Também discute-se oportunidades e desafios relacionados a adaptação da abordagem proposta para a realização de outras tarefas de gerência de redes que são sensíveis ao fator tempo.
Referências
Bosshart, P., Daly, D., Gibb, G., Izzard, M., McKeown, N., Rexford, J., Schlesinger, C., Talayco, D., Vahdat, A., Varghese, G., and Walker, D. (2014). P4: Programming protocol-independent packet processors. SIGCOMM Comput. Commun. Rev., 44(3):87–95.
Bosshart, P., Gibb, G., Kim, H.-S., Varghese, G., McKeown, N., Izzard, M., Mujica, F., and Horowitz, M. (2013). Forwarding metamorphosis: Fast programmable matchaction processing in hardware for sdn. In Proceedings of the ACM SIGCOMM 2013 Conference on SIGCOMM, SIGCOMM ’13, pages 99–110, New York, NY, USA. ACM.
Cordeiro, W. L. d. C., Marques, J. A., and Gaspary, L. P. (2017). Data plane programmability beyond openflow: Opportunities and challenges for network and service operations and management. Journal of Network and Systems Management, 25(4):784–818.
Dalmazo, B. L., Marques, J. A., Costa, L. R., Bonfim, M. S., Carvalho, R. N., da Silva, A. S., Fernandes, S., Bordim, J. L., Alchieri, E., Schaeffer-Filho, A., Paschoal Gaspary, L., and Cordeiro, W. (2021). A systematic review on distributed denial of service attack defense mechanisms in programmable networks. International Journal of Network Management, 31(6):e2163.
González, L. A. Q., Castanheira, L., Marques, J. A., Schaeffer-Filho, A., and Gaspary, L. P. (2021). Bungee: An adaptive pushback mechanism for ddos detection and mitigation in p4 data planes. In 2021 IFIP/IEEE International Symposium on Integrated Network Management (IM), pages 393–401.
Ilha, A. d. S., Lapolli, A. C., Marques, J. A., and Gaspary, L. P. (2021). Euclid: A fully in-network, p4-based approach for real-time ddos attack detection and mitigation. IEEE Transactions on Network and Service Management, 18(3):3121–3139.
Kim, C., Sivaraman, A., Katta, N., Bas, A., Dixit, A., and Wobker, L. J. (2015). In-band network telemetry via programmable dataplanes. In Proceedings of the 2015 ACM Symposium on SDN Research, SOSR’15, New York, NY, USA. ACM.
Lapolli, A. C., Marques, J. A., and Gaspary, L. P. (2019). Offloading real-time ddos attack detection to programmable data planes. In 2019 IFIP/IEEE Symposium on Integrated Network and Service Management (IM), pages 19–27.
Marques, J., Levchenko, K., and Gaspary, L. (2020). Intsight: Diagnosing slo violations with in-band network telemetry. In Proceedings of the 16th International Conference on Emerging Networking EXperiments and Technologies, CoNEXT ’20, page 421–434, New York, NY, USA. Association for Computing Machinery.
Marques, J. A. and Gaspary, L. (2018). Explorando estratégias de orquestração de telemetria em planos de dados programáveis. In Anais do XXXVI Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos, pages 1299–1312, Porto Alegre, RS, Brasil. SBC.
Marques, J. A., Levchenko, K., and Gaspary, L. P. (2023). Responding to network failures at data-plane speeds with network programmability. In 2023 IEEE/IFIP Network Operations and Management Symposium (NOMS). To appear.
Marques, J. A., Luizelli, M. C., da Costa Filho, R. I. T., and Gaspary, L. P. (2019). An optimization-based approach for efficient network monitoring using in-band network telemetry. Journal of Internet Services and Applications, 10(1):1–20.
McKeown, N., Anderson, T., Balakrishnan, H., Parulkar, G., Peterson, L., Rexford, J., Shenker, S., and Turner, J. (2008). Openflow: Enabling innovation in campus networks. SIGCOMM Comput. Commun. Rev., 38(2):69–74.
Silva, M. V., Marques, J. A., Gaspary, L., and Granville, L. Z. (2018). Identificação de fluxos elefantes em redes de ponto de troca de tráfego com suporte à programabilidade p4. In Anais do XXXVI Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos, pages 1131–1144, Porto Alegre, RS, Brasil. SBC.
Silva, M. V. B. d., Marques, J. A., Gaspary, L. P., and Granville, L. Z. (2020). Identifying elephant flows using dynamic thresholds in programmable ixp networks. Journal of Internet Services and Applications, 11(1):1–12.
Vassoler, G., Marques, J. A., and Gaspary, L. P. (2023). Vermont: Towards an in-band telemetry-based approach for live network property verification. In 2023 IEEE/IFIP Network Operations and Management Symposium (NOMS). To appear.