Agrupamento interativo aplicado à mineração de processos
Resumo
A mineração de processos visa descobrir, analisar e melhorar automaticamente processos de negócios. Trace clustering é uma tarefa comumente usada para reduzir a complexidade inerente dos processos, identificando padrões. Esta pesquisa concentra-se na aplicação de conhecimentos de especialistas em mineração de processos por meio de agrupamento interativo, aqui referido como interactive trace clustering. O objetivo é melhorar o agrupamento de traces, reduzindo possíveis perdas decorrentes de suposições arbitrárias sobre a semelhança entre os pontos de dados, o que é comumente requerido em cenários não supervisionados. Experimentos iniciais consideraram agrupamento por particionamento e três esquemas de representação vetorial para traces. Resultados preliminares mostram potencial para melhorar a qualidade de trace clustering inserindo conhecimento de especialistas.
Referências
Aalst, W. M. P., Adriansyah, A., and van Dongen, B. F. (2012). Replaying history on process models for conformance checking and performance analysis. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 2(2):182–192.
Awasthi, P., Balcan, M., and Voevodski, K. (2017). Local algorithms for interactive clustering. J. of Machine Learning Research, 18:1–35.
Correa, G., Marcacini, R., Hruschka, E., and Rezende, S. (2015). Interactive textual feature selection for consensus clustering. Pattern Recognition Letters, 52:25–31.
da Silva, L. A., Peres, S. M., and Boscarioli, C. (2016). Introdução a Mineração de Dados: Com Aplicações em R. Elsevier, Brasil.
Han, J., Kamber, M., and Pei, J. (2011). Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers Inc., San Francisco, CA, USA, 3rd edition.
Hu, Y., Milios, E. E., and Blustein, J. (2014). Interactive document clustering with feature supervision through reweighting. Intelligent Data Analysis, 18:561–581.
Lu, X. (2018). Using behavioral context in process mining: exploration, preprocessing and analysis of event data. PhD thesis, Eindhoven University of Technology.
Maita, A. R. C., Martins, L., Paz, C. R. L., Rafferty, L., Hung, P. C. K., Peres, S. M., and Fantinato, M. (2017). A systematic mapping study of process mining. Enterprise Information Systems, 12:1–45.
Okabe, M. and Yamada, S. (2009). Clustering with constrained similarity learning. In Int. Conf. on Web Intel. and Intel. Agent Tech., volume 3, pages 30–33, USA. IEEE.
Rousseeuw, P. J. (1986). Silhouettes: A graphical aid to the interpretation and validation of cluster analysis. J. of Computational and Applied Mathematics, 20(1):53–65.
Song, M., Gunther, C. W., and Aalst, W. M. P. (2008). Trace clustering in process mining. In 4th Int. Work. on Business Process Intelligence, pages 109–120. Springer.
Stanley, D. (2004). Properties of the hubert-arable adjusted rand index. Psychological Methods, 9(3):386–396.
Turney, P. D. and Pantel, P. (2010). From frequency to meaning: Vector space models of semantics. J. of Artificial Intelligence Research, 37(1):141188.
Weske, M. (2007). Business Process Management: Concepts, Languages, Architectures. Springer, 2nd edition.