Python OAM: apresentação e uso de uma biblioteca de explicabilidade para processos de detecção de outliers

  • Rodrigo F. Silva Universidade Tecnológica Federal do Paraná (UTFPR)
  • Luiz Gomes-Jr Universidade Tecnológica Federal do Paraná (UTFPR)

Resumo


Detecção de outliers é usada para identificar falhas e fraudes, entre outras aplicações. Algoritmos de detecção são limitados em termos de prover informação sobre a razão da anomalia identificada. Outlier Aspect Mining (OAM) analisa quais aspectos da observação anômala a separam das demais. Este artigo descreve a implementação e uso de uma biblioteca em Python que possibilita o usuário aplicar algoritmos de OAM e analisar os resultados. Demonstramos a aplicação da biblioteca em um caso de uso relacionado à pandemia de COVID-19.
Palavras-chave: Explicabilidade de Anomalias, Detecção de Outliers, OAM, Biblioteca em Python, Análise Visual, Outlier, Outlying Aspect Mining, Python, Ipath

Referências

Chandola, V., Banerjee, A., and Kumar, V. (2009). Anomaly detection: A survey. ACM Computing Surveys, 41(3):15:1-15:58.

Cheng, Z., Zou, C., and Dong, J. (2019). Outlier detection using isolation forest and local outlier factor. In Proceedings of the Conference on Research in Adaptive and Convergent Systems, RACS ’19, pages 161-168, New York, NY, USA. Association for Computing Machinery.

Samariya, D., Aryal, S., and Ting, K. M. (2020a). A new effective and efficient measure for outlying aspect mining. arXiv: 2004.13550.

Samariya, D., Ma, J., and Aryal, S. (2020b). A Comprehensive Survey on Outlying Aspect Mining Methods. arXiv: 2005.02637.

the Vinh, N., Chan, J., Romano, S., Bailey, J., Leckie, C., Ramamohanarao, K., and Pei, J. (2016). Discovering outlying aspects in large datasets. Data Mining and Knowledge Discovery, 30.
Publicado
19/09/2022
Como Citar

Selecione um Formato
SILVA, Rodrigo F.; GOMES-JR, Luiz. Python OAM: apresentação e uso de uma biblioteca de explicabilidade para processos de detecção de outliers. In: DEMONSTRAÇÕES E APLICAÇÕES - SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 37. , 2022, Búzios. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2022 . p. 71-76. DOI: https://doi.org/10.5753/sbbd_estendido.2022.21846.