Detecção de Spams Utilizando ConteúdoWeb Associado a Mensagens

  • Marco Ribeiro
  • Leonardo Teixeira
  • Pedro Guerra
  • Adriano Veloso
  • Wagner Meira Jr.
  • Dorgival Guedes
  • Cristine Hoepers
  • Klaus Steding-Jessen
  • Marcelo Chaves

Resumo

Neste trabalho propomos uma estratégia de detecção de spams que explora o conteúdo das páginas Web para as quais mensagens apontam. Descrevemos uma metodologia para a coleta dessas páginas, caracterizamos a relação entre as páginas e as mensagens de spam e, em seguida, utilizamos um algoritmo de aprendizado de máquina para extrair as informações relevantes para a detecção de spam. Mostramos que a utilização de informações das páginas mencionadas melhora significativamente a classificação de spams e hams, gerando um baixo índice de falsos positivos. Nosso estudo revela que as páginas apontadas pelos spams ainda são um campo de batalha não explorado pelos filtros, onde os spammers não se preocupam em esconder a sua identidade.

Publicado
2017-06-23
Como Citar
RIBEIRO, Marco et al. Detecção de Spams Utilizando ConteúdoWeb Associado a Mensagens. Revista Brasileira de Redes de Computadores e Sistemas Distribuídos (RB-RESD), [S.l.], jun. 2017. ISSN 1983-4217. Disponível em: <https://sol.sbc.org.br/index.php/rbresd/article/view/79>. Acesso em: 17 maio 2024. doi: https://doi.org/10.1234/rb-resd.v4i1.79.
Edição
Seção
Articles