Paralelização do algoritmo DIANA em OpenMP

  • Hethini Ribeiro UNESP
  • Roberta Spolon UNESP
  • Aleardo Manacero Jr. UNESP
  • Renata S. Lobato UNESP

Resumo


A produção global de dados aumentou aproximadamente 40% ao ano no início da década passada. Esses grandes conjuntos de dados, também chamados de Big Data, estão colocando desafios inevitáveis em muitas áreas e, em particular, no campo de Machine Learning (ML). Algoritmos de ML são capazes de extrair informações úteis de grandes repositórios de dados, porém essas aplicações são dispendiosas computacionalmente, como por exemplo os algoritmos hierárquicos AGNES e DIANA, que por sua vez, possuem complexidade O (n) e O (2n) respectivamente. Sendo assim, o grande desafio consiste em processar grandes quantidades de dados em um período de tempo realista. Nesse contexto, propõe-se a paralelização do algoritmo DIANA OpenMP.

Referências

BELL, J. (2015). Machine Learning: Hands-On for Developers and Technical Professionals. John Wiley Sons.

BHIMANI, J., LEESER, M., and MI, N. (2015). Accelerating K-Means Clustering with Parallel Implementations and GPU computing. In: High Performance Extreme Computing Conference (HPEC).

DANALIS, A., MCCURDY, C., and VETTER, J. S. (2012). Efficient quality threshold clustering for parallel architectures.

FRÄNTI, P., REZAEI, M., and ZHAO, Q. (2014). Centroid index: cluster level similarity measure. pattern recognition.

JOHNSON, S. (1967). Hierarchical clustering schemes. Psychometrika

LOPES, N. and RIBEIRO, B. (2015). Machine learning for adaptive many-core machines: A practical approach. Springer.
Publicado
13/04/2018
RIBEIRO, Hethini; SPOLON, Roberta; MANACERO JR., Aleardo; LOBATO, Renata S.. Paralelização do algoritmo DIANA em OpenMP. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DE SÃO PAULO (ERAD-SP), 9. , 2018, São José dos Campos. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2018 . p. 57-60. DOI: https://doi.org/10.5753/eradsp.2018.13602.

Artigos mais lidos do(s) mesmo(s) autor(es)