Paralelização do algoritmo DIANA em OpenMP

Hethini Ribeiro; Roberta Spolon; Aleardo Manacero Jr.; Renata S. Lobato

doi:10.5753/eradsp.2018.13602

Hethini Ribeiro UNESP
Roberta Spolon UNESP
Aleardo Manacero Jr. UNESP
Renata S. Lobato UNESP

DOI: https://doi.org/10.5753/eradsp.2018.13602

Resumo

A produção global de dados aumentou aproximadamente 40% ao ano no início da década passada. Esses grandes conjuntos de dados, também chamados de Big Data, estão colocando desafios inevitáveis em muitas áreas e, em particular, no campo de Machine Learning (ML). Algoritmos de ML são capazes de extrair informações úteis de grandes repositórios de dados, porém essas aplicações são dispendiosas computacionalmente, como por exemplo os algoritmos hierárquicos AGNES e DIANA, que por sua vez, possuem complexidade O (n) e O (2n) respectivamente. Sendo assim, o grande desafio consiste em processar grandes quantidades de dados em um período de tempo realista. Nesse contexto, propõe-se a paralelização do algoritmo DIANA OpenMP.

Referências

BELL, J. (2015). Machine Learning: Hands-On for Developers and Technical Professionals. John Wiley Sons.

BHIMANI, J., LEESER, M., and MI, N. (2015). Accelerating K-Means Clustering with Parallel Implementations and GPU computing. In: High Performance Extreme Computing Conference (HPEC).

DANALIS, A., MCCURDY, C., and VETTER, J. S. (2012). Efficient quality threshold clustering for parallel architectures.

FRÄNTI, P., REZAEI, M., and ZHAO, Q. (2014). Centroid index: cluster level similarity measure. pattern recognition.

JOHNSON, S. (1967). Hierarchical clustering schemes. Psychometrika

LOPES, N. and RIBEIRO, B. (2015). Machine learning for adaptive many-core machines: A practical approach. Springer.

Paralelização do algoritmo DIANA em OpenMP

Resumo

Referências

Artigos mais lidos do(s) mesmo(s) autor(es)