Detecção de Outliers em Finanças de Instituições de Ensino Superior Brasileiras Utilizando Aprendizado de Máquina Não Supervisionado

  • Nathan C. Freitas UFRPE
  • Roberta M. M. Gouveia UFRPE
  • Ebony M. Rodrigues UFRPE
  • Gabriel Alves UFRPE
  • Maria da Conceição M. Batista UFRPE
  • Rodrigo Lins Rodrigues UFRPE

Resumo


A mineração de dados educacionais (EDM) é amplamente utilizada como uma ferramenta para se obter uma melhor compreensão sobre as nuances existentes no processo de ensino e aprendizagem. Na educação superior, é possível analisar a influência dos valores financeiros investidos pelas instituições, pois a presença de ferramentas relacionadas podem auxiliar os gestores a diminuir gastos nas suas instituições. Este trabalho trata da detecção de instituições que apresentam valores financeiros de despesas discrepantes (outliers). Para isso, são realizados agrupamentos visando à criação de grupos coesos e são aplicados métodos não supervisionados de detecção de outliers. Os resultados demonstram a criação de grupos que possuem instituições outliers com perfis semelhantes. O método proporciona um meio de investigar quais instituições são discrepantes quanto às suas despesas declaradas, apresentando um estudo sobre essas instâncias.

Referências

Baker, R. et al. (2010). Data mining for education. International encyclopedia of education, 7(3):112–118.

Colombo, S. S. (2014). Gestão universitária: os caminhos para a excelência. Penso Editora.

Costa, E., Baker, R. S., Amorim, L., Magalhães, J., and Marinho, T. (2012). Mineração de dados educacionais: conceitos, técnicas, ferramentas e aplicações. Jornada de Atualização em Informática na Educação, 1(1):1–29.

da Silva Vieira, A., Bertolini, D., and Schwerz, A. L. (2022). Análise do desempenho no enade dos concluintes de computaçao usando técnica de agrupamento. In Anais do XXXIII Simpósio Brasileiro de Informática na Educação, pages 834–845. SBC.

de Siqueira Gê, E. A. and Borges, E. F. (2021). Identificação de outliers em processos de dispensas e inexigibilidades em licitações públicas: um estudo comparativo entre ufrn, ifrn e ufersa nos anos de 2017 e 2018. Revista Inovar Contábil, 2(01).

do Nascimento, P. S. C., da Silva Junior, A. S., Schulz, C. L., dos Santos, M. V. R., Maciel, A. M. A., Rodrigues, R. L., do Nascimento, R. R., and Alencar, F. M. R. (2021). Análise dos impactos da gestão do tempo no desempenho acadêmico através da mineração de dados educacionais. In Anais do XXXII Simpósio Brasileiro de Informática na Educação, pages 783–791. SBC.

Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P. (1996). From data mining to knowledge discovery in databases. AI magazine, 17(3):37–37.

Freitas, N. C., Gouveia, R. M., de Albuquerque Júnior, G. A., Maria da Conceição, M. B., and Rodrigues, R. L. (2022). A implementation mathematical-computational method for the detection and treatment of financial outliers in higher education. In Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional, pages 740–751. SBC.

Goldstein, M. and Uchida, S. (2016). A comparative evaluation of unsupervised anomaly detection algorithms for multivariate data. PloS one, 11(4):e0152173.

Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E., and Tatham, R. L. (2009). Análise multivariada de dados. Bookman editora.

Han, J., Pei, J., and Tong, H. (2022). Data mining: concepts and techniques. Morgan kaufmann.

INEP (2023). Resumo técnico do censo da educação superior.

Machado, R. G. (2022). Subsídio às fiscalizações públicas: Identificação dos municípios com gastos discrepantes na educação básica. Caderno de Finanças Públicas, 22(01).

Morettin, P. A. and Bussab, W. O. (2017). Estatística básica. Saraiva Educação SA.

Romero, C. and Ventura, S. (2013). Data mining in education. Wiley Interdisciplinary Reviews: Data mining and knowledge discovery, 3(1):12–27.

Spanol, M., Oliveira, E., Alves, G., Bittencourt, I. M., Falcao, T. P., and Mello, R. F. (2022). Uso de agrupamento para avaliação de desempenho educacional e apoio à gestão em áreas de investimento. In Anais do XXXIII Simpósio Brasileiro de Informática na Educação, pages 944–955. SBC.

Vasconcelos, J. C., Lima, P. V. P. S., Rocha, L. A., and Khan, A. S. (2021). Infraestrutura escolar e investimentos públicos em educação no brasil: a importância para o desempenho educacional. Ensaio: Avaliação e Políticas Públicas em Educação, 29(113):874–898.

Wang, H., Bah, M. J., and Hammad, M. (2019). Progress in outlier detection techniques: A survey. Ieee Access, 7:107964–108000.

Zhao, Y., Nasrullah, Z., and Li, Z. (2019). Pyod: A python toolbox for scalable outlier detection. arXiv preprint arXiv:1901.01588.
Publicado
06/11/2023
FREITAS, Nathan C.; GOUVEIA, Roberta M. M.; RODRIGUES, Ebony M.; ALVES, Gabriel; BATISTA, Maria da Conceição M.; RODRIGUES, Rodrigo Lins. Detecção de Outliers em Finanças de Instituições de Ensino Superior Brasileiras Utilizando Aprendizado de Máquina Não Supervisionado. In: SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO (SBIE), 34. , 2023, Passo Fundo/RS. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 1489-1500. DOI: https://doi.org/10.5753/sbie.2023.235303.