Uso da Informação Mútua Ajustada na Seleção de Atributos numa Base de Dados de Detecção de Intrusos

Luiz E. R. Martins; Nelcileno Virgílio de Souza Araújo; Allan G. de Oliveira; Letízia Manuella Serqueira Eugênio

doi:10.5753/erigo.2024.4828

Luiz E. R. Martins UFMT
Nelcileno Virgílio de Souza Araújo UFMT
Allan G. de Oliveira UFMT
Letízia Manuella Serqueira Eugênio UFMT

DOI: https://doi.org/10.5753/erigo.2024.4828

Resumo

Sistemas de Detecção de Intrusão (IDSs) são fundamentais para monitorar redes e identificar comportamentos anômalos. Este artigo aplica uma técnica de seleção de atributos para extrair as características mais representativas da base de dados NSL-KDD, utilizando uma abordagem híbrida que combina a Taxa de Ganho de Informação e o algoritmo K-means. A métrica de Informação Mútua Ajustada (IMA) foi empregada para definir o subconjunto ótimo de atributos. Com essa técnica, foi possível reduzir a dimensionalidade dos atributos de 41 para 7, alcançando uma acurácia de 70%, o que demonstra a eficácia da abordagem proposta.

Palavras-chave: detecção de intrusão, seleção de atributos, informação mútua ajustada, NSL-KDD, aprendizado de máquina

Referências

Alessia Amelio, C. P. (2016). Correction for closeness: Adjusting normalized mutual information measure for clustering comparison.

Araújo, N., de Oliveira, R., Ferreira, E., Shinoda, A. A., and Bhargava, B. (2010). Identifying important characteristics in the kdd99 intrusion detection dataset by feature selection using a hybrid approach. In 2010 17th International Conference on Telecommunications, pages 552–558.

Kayacik, H. G., Zincir-Heywood, A. N., and Heywood, M. I. (2005). Selecting features for intrusion detection: A feature relevance analysis on kdd 99 intrusion detection datasets. In Proceedings of the third annual conference on privacy, security and trust, volume 94, pages 1723–1722. Citeseer.

Kurniabudi, K., Stiawan, D., Dr, D., Idris, M., Bamhdi, A., and Budiarto, R. (2020). Cicids-2017 dataset feature analysis with information gain for anomaly detection. IEEE Access, PP:1–1.

Lazarenko, D. and Bonald, T. (2021). Pairwise adjusted mutual information. CoRR, abs/2103.12641.

Lippmann, R., Haines, J. W., Fried, D. J., Korba, J., and Das, K. (2000). The 1999 darpa off-line intrusion detection evaluation. Computer networks, 34(4):579–595.

Liu, H. and Lang, B. (2019). Machine learning and deep learning methods for intrusion detection systems: A survey. Applied Sciences, 9(20).

Zhang, X. and Liu, C.-A. (2023). Model averaging prediction by k-fold cross-validation. Journal of Econometrics, 235(1):280–301.