Graph Pattern Mining: consolidating models, systems, and abstractions


Este texto resume as contribuições da tese intitulada ”Mineração de Padrões em Grafos: consolidando modelos, sistemas e abstrações”, aprovada no Programa de Pós-Graduação em Ciência da Computação da Universidade Federal de Minas Gerais (DCC/UFMG). Mineração de Padrões em Grafos (Graph Pattern Mining, GPM) refere-se a uma classe de problemas que envolve o processamento de subgrafos extraídos de grafos maiores. As aplicações para algoritmos de GPM incluem a consulta de subgrafos com propriedades específicas de interesse, a identificação de estruturas de motivos em redes biológicas, entre outras. Os algoritmos de GPM são desafiadores de desenvolver e, assim, sistemas de GPM de uso geral surgem como uma solução para melhorar a experiência do usuário com tais algoritmos. Nesta tese, propomos um modelo baseado em primitivas para representar algoritmos de GPM, um sistema distribuído que implementa este modelo, e um extenso estudo experimental de algoritmos populares usados em sistemas de GPM. Demonstramos empiricamente a eficácia do modelo proposto, mostrando um desempenho competitivo em relação aos concorrentes, sem sacrificar a expressividade dos algoritmos.

Palavras-chave: data mining, graph mining, frequent subgraph mining, parallel and distributed systems, spark, big data


DIAS, Vinícius; GUEDES, Dorgival. Graph Pattern Mining: consolidating models, systems, and abstractions. In: CONCURSO DE TESES E DISSERTAÇÕES (CTDBD) - SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 39. , 2024, Florianópolis/SC. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 190-195. DOI: