Recomendação de Tags a Partir de Métricas de Qualidade de Atributos Textuais em Aplicações da Web 2.0

  • Fabiano Belém UFMG
  • Eder Martins UFMG
  • Jussara Almeida UFMG
  • Marcos Gonçalves UFMG
  • Gisele L. Pappa UFM

Resumo


Diversas aplicações populares da Web 2.0 permitem aos usuários a livre atribuição de palavras-chave (tags) ao conteúdo, para prover uma melhor organização e descrição do mesmo. Nessas aplicações, serviços de recomendação de tags podem auxiliar o usuário nessa tarefa, melhorando a qualidade da informação disponível e, consequentemente, a eficácia de diversos serviços de Recuperação de Informação (RI) que exploram tags, tais como busca e categorização. Este trabalho trata do problema de recomendar tags de alta qualidade a partir não somente de tags previamente associadas ao conteúdo de um objeto como também de termos presentes em outros atributos textuais (por exemplo, título e descrição) associados ao objeto. Nele, propomos o uso dessas duas fontes de informação para geração de termos candidatos e a combinação de diversas métricas heurísticas em uma função para estimar a qualidade das tags. Para tentar gerar e evoluir novas funções de ranking, utilizamos como ferramenta um algoritmo de Programação Genética (PG). A função proposta e as geradas pela PG foram avaliadas em diferentes cenários, com diferentes quantidades de entrada disponíveis, em diferentes aplicações populares da Web 2.0: LastFM, YahooVideo e YouTube. Nossos resultados experimentais indicam que a heurística e as funções geradas pelo GP são mais eficazes que algoritmos de recomendação de tags considerados estado-da-arte.
Palavras-chave: Algoritmos, Experimentação
Publicado
05/10/2010
Como Citar

Selecione um Formato
BELÉM, Fabiano; MARTINS, Eder; ALMEIDA, Jussara; GONÇALVES, Marcos; PAPPA, Gisele L.. Recomendação de Tags a Partir de Métricas de Qualidade de Atributos Textuais em Aplicações da Web 2.0. In: SIMPÓSIO BRASILEIRO DE SISTEMAS MULTIMÍDIA E WEB (WEBMEDIA), 16. , 2010, Belo Horizonte. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2010 . p. 99-106.