Detecção de Malwares Android: Levantamento Empírico da Disponibilidade e da Atualização das Fontes de Dados

  • Tainá Soares UNIPAMPA
  • Joner Mello UNIPAMPA
  • Lucas Barcellos UNIPAMPA
  • Renato Sayyed UNIPAMPA
  • Guilherme Siqueira UNIPAMPA
  • Karina Casola UNIPAMPA
  • Estevão Costa UFAM
  • Nicolas Gustavo UFAM
  • Eduardo Feitosa UFAM
  • Diego Kreutz UNIPAMPA

Resumo


Neste estudo avaliamos 84 fontes de dados utilizadas para a concepção de modelos de aprendizado de máquina aplicados à detecção de malwares Android, sendo 39 lojas de aplicativos, 30 datasets e 15 repositórios de APKs. Verificamos que 68,75% dos trabalhos utilizam fontes de dados antigas, mesmo existindo opções de fontes atuais. Também observamos que a disponibilidade e a corretude dos registros das fontes de dados nem sempre são condizentes com o informado e, consequentemente, podem impactar negativamente a qualidade dos métodos de detecção de malwares.

Referências

Allix, K., Bissyandé, T. F., Klein, J., and Le Traon, Y. (2015). Are your training datasets yet relevant? In Piessens, F., Caballero, J., and Bielova, N., editors, Engineering Secure Software and Systems, pages 51–67, Cham. Springer International Publishing.

Kouliaridis, V., Kambourakis, G., and Peng, T. (2020). Feature importance in mobile malware detection. CoRR, abs/2008.05299.

Sharma, T. and Rattan, D. (2021). Malicious application detection in android — a systematic literature review. Computer Science Review, 40:100373.

Soares, T., Mello, J., Barcellos, L., Sayyed, R., Siqueira, G., Casola, K., Costa, E., Gustavo, N., Feitosa, E., and Kreutz, D. (2021a). Detecção de malwares android: Levantamento empírico da disponibilidade e da atualização das fontes de dados (versão estendida). https://arxiv.kreutz.xyz/wrseg2021_disponibilidade_ve1.pdf.

Soares, T., Siqueira, G., Barcellos, L., Sayyed, R., Vargas, L., Rodrigues, G., Assolin, J., Pontes, J., and Kreutz, D. (2021b). Detecção de malwares android: datasets e reprodutibilidade. https://arxiv.kreutz.xyz/mh21_reprodutibilidade.pdf.

Wang, S., Chen, Z., Yan, Q., Yang, B., Peng, L., and Jia, Z. (2019). A mobile malware detection method using behavior features in network traffic. Journal of Network and Computer Applications, 133:15–25.
Publicado
27/10/2021
SOARES, Tainá et al. Detecção de Malwares Android: Levantamento Empírico da Disponibilidade e da Atualização das Fontes de Dados. In: ESCOLA REGIONAL DE REDES DE COMPUTADORES (ERRC), 19. , 2021, Charqueadas/RS. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 49-54. DOI: https://doi.org/10.5753/errc.2021.18541.