Explorando o uso de árvores B+ na Indexação de Dados por Similaridade
Resumo
Este artigo apresenta um novo método de indexação métrico denominado GroupSim+ que, quando comparado com trabalhos correlatos, permite um maior estreitamento das regiões mínimas de poda. Essa característica do método contribui para a otimização de consultas por similaridade. Os resultados dos experimentos realizados com diferentes conjuntos de dados reais demonstram a eficácia da abordagem adotada no desenvolvimento do GroupSim+.
Referências
Razente, H., Lima, R. B., and Barioni, M. C. (2017). Similarity search through onedimensional embeddings. In ACM SAC, pages 874–879, Marrakech, Marrocos. DOI: https://doi.org/10.1145/3019612.3019674
Samet, H. (2006). Foundations of Multidimensional and Metric Data Structures. Morgan Kaufmann, San Francisco.
Socorro, R., Mico, L., and Oncina, J. (2011). A fast pivot-based indexing algorithm for metric spaces. Pattern Recognition Letters, 32(11):1511–1516. DOI: https://doi.org/10.1016/j.patrec.2011.04.016
Traina-Jr, C., Filho, R. F., Traina, A., Vieira, M. R., and Faloutsos, C. (2007). The omnifamily of all-purpose access methods: A simple and effective way to make similarity search more efficient. The VLDB Journal, 16(4):483–505. DOI: https://doi.org/10.1007/s00778-005-0178-0