Descoberta de Subtópicos Adaptativa por Consulta para Recuperação de Imagens Diversificadas
Resumo
Dadas as complexas tarefas de pesquisa impostas aos sistemas de recuperação de multimídia, os resultados baseados em similaridade frequentemente representam conjuntos de itens redundantes. Diversas tarefas de pesquisa do mundo real exigem ampla cobertura de vários subtópicos implícitos de uma determinada consulta. Muitos trabalhos propuseram a diversificação de resultados baseada em agrupamento para lidar com esse problema. No entanto, a definição do número de grupos (sub-tópicos) a serem descobertos é um desafio de longa data. Para atenuar tais problemas, este trabalho propõe uma nova abordagem de recuperação de imagens diversificadas com a descoberta de subtópicos de modo não supervisionado e adaptativo por consulta baseada na otimização da qualidade intrínseca de agrupamentos. Nossa análise experimental mostrou melhorias significativas tanto em termos de relevância quanto de diversidade.
Referências
Ionescu, B., Gînsca, A., Boteanu, B., Popescu, A., Lupu, M., and Muller, H. (2015). Retrieving diverse social images at mediaeval 2015: Challenge, dataset and evaluation. In MediaEval.
Muhlenbach, F. and Lallich, S. (2009). A new clustering algorithm based on regions of influence with self-detection of the best number of clusters. In IEEE ICDM.
Salvador, S. and Chan, P. (2004). Determining the number of clusters/segments in hierarchical clustering/segmentation algorithms. In IEEE ICTAI.
Santos, R. L. T., Macdonald, C., and Ounis, I. (2015). Search result diversification. Found Trends Inf Ret, 9(1):1–90.
Tollari, S. (2016). UPMC at mediaeval 2016 retrieving diverse social images task. In MediaEval.
Xie, X. L. and Beni, G. (1991). A validity measure for fuzzy clustering. IEEE TPAMI, 13(8):841–847.
Zhai, C. X., Cohen, W. W., and Lafferty, J. (2003). Beyond independent relevance: Methods and evaluation metrics for subtopic retrieval. In ACM SIGIR.