Paralelização do algoritmo DIANA em OpenMP
Resumo
A produção global de dados aumentou aproximadamente 40% ao ano no início da década passada. Esses grandes conjuntos de dados, também chamados de Big Data, estão colocando desafios inevitáveis em muitas áreas e, em particular, no campo de Machine Learning (ML). Algoritmos de ML são capazes de extrair informações úteis de grandes repositórios de dados, porém essas aplicações são dispendiosas computacionalmente, como por exemplo os algoritmos hierárquicos AGNES e DIANA, que por sua vez, possuem complexidade O (n) e O (2n) respectivamente. Sendo assim, o grande desafio consiste em processar grandes quantidades de dados em um período de tempo realista. Nesse contexto, propõe-se a paralelização do algoritmo DIANA OpenMP.Referências
BELL, J. (2015). Machine Learning: Hands-On for Developers and Technical Professionals. John Wiley Sons.
BHIMANI, J., LEESER, M., and MI, N. (2015). Accelerating K-Means Clustering with Parallel Implementations and GPU computing. In: High Performance Extreme Computing Conference (HPEC).
DANALIS, A., MCCURDY, C., and VETTER, J. S. (2012). Efficient quality threshold clustering for parallel architectures.
FRÄNTI, P., REZAEI, M., and ZHAO, Q. (2014). Centroid index: cluster level similarity measure. pattern recognition.
JOHNSON, S. (1967). Hierarchical clustering schemes. Psychometrika
LOPES, N. and RIBEIRO, B. (2015). Machine learning for adaptive many-core machines: A practical approach. Springer.
BHIMANI, J., LEESER, M., and MI, N. (2015). Accelerating K-Means Clustering with Parallel Implementations and GPU computing. In: High Performance Extreme Computing Conference (HPEC).
DANALIS, A., MCCURDY, C., and VETTER, J. S. (2012). Efficient quality threshold clustering for parallel architectures.
FRÄNTI, P., REZAEI, M., and ZHAO, Q. (2014). Centroid index: cluster level similarity measure. pattern recognition.
JOHNSON, S. (1967). Hierarchical clustering schemes. Psychometrika
LOPES, N. and RIBEIRO, B. (2015). Machine learning for adaptive many-core machines: A practical approach. Springer.
Publicado
13/04/2018
Como Citar
RIBEIRO, Hethini; SPOLON, Roberta; MANACERO JR., Aleardo; LOBATO, Renata S..
Paralelização do algoritmo DIANA em OpenMP. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DE SÃO PAULO (ERAD-SP), 9. , 2018, São José dos Campos.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2018
.
p. 57-60.
DOI: https://doi.org/10.5753/eradsp.2018.13602.