Detecção de Outliers em Finanças de Instituições de Ensino Superior Brasileiras Utilizando Aprendizado de Máquina Não Supervisionado
Abstract
Educational Data Mining (EDM) is widely used as a tool to gain a better understanding of nuances in the teaching and learning process. In higher education, it is possible to analyze the influence of the financial amounts invested by the institutions, since the presence of related tools can help managers to reduce expenses in their institutions. This work deals with the detection of institutions that present discrepant financial value of expenses (outliers). For this, clusterings are performed in order to create cohesive groups and unsupervised outlier detection methods are applied. The results demonstrate the creation of groups that have outlier institutions with similar profiles. The method provides a means of investigating which institutions are discrepant in terms of their declared expenses, presenting a study on these instances.References
Baker, R. et al. (2010). Data mining for education. International encyclopedia of education, 7(3):112–118.
Colombo, S. S. (2014). Gestão universitária: os caminhos para a excelência. Penso Editora.
Costa, E., Baker, R. S., Amorim, L., Magalhães, J., and Marinho, T. (2012). Mineração de dados educacionais: conceitos, técnicas, ferramentas e aplicações. Jornada de Atualização em Informática na Educação, 1(1):1–29.
da Silva Vieira, A., Bertolini, D., and Schwerz, A. L. (2022). Análise do desempenho no enade dos concluintes de computaçao usando técnica de agrupamento. In Anais do XXXIII Simpósio Brasileiro de Informática na Educação, pages 834–845. SBC.
de Siqueira Gê, E. A. and Borges, E. F. (2021). Identificação de outliers em processos de dispensas e inexigibilidades em licitações públicas: um estudo comparativo entre ufrn, ifrn e ufersa nos anos de 2017 e 2018. Revista Inovar Contábil, 2(01).
do Nascimento, P. S. C., da Silva Junior, A. S., Schulz, C. L., dos Santos, M. V. R., Maciel, A. M. A., Rodrigues, R. L., do Nascimento, R. R., and Alencar, F. M. R. (2021). Análise dos impactos da gestão do tempo no desempenho acadêmico através da mineração de dados educacionais. In Anais do XXXII Simpósio Brasileiro de Informática na Educação, pages 783–791. SBC.
Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P. (1996). From data mining to knowledge discovery in databases. AI magazine, 17(3):37–37.
Freitas, N. C., Gouveia, R. M., de Albuquerque Júnior, G. A., Maria da Conceição, M. B., and Rodrigues, R. L. (2022). A implementation mathematical-computational method for the detection and treatment of financial outliers in higher education. In Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional, pages 740–751. SBC.
Goldstein, M. and Uchida, S. (2016). A comparative evaluation of unsupervised anomaly detection algorithms for multivariate data. PloS one, 11(4):e0152173.
Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E., and Tatham, R. L. (2009). Análise multivariada de dados. Bookman editora.
Han, J., Pei, J., and Tong, H. (2022). Data mining: concepts and techniques. Morgan kaufmann.
INEP (2023). Resumo técnico do censo da educação superior.
Machado, R. G. (2022). Subsídio às fiscalizações públicas: Identificação dos municípios com gastos discrepantes na educação básica. Caderno de Finanças Públicas, 22(01).
Morettin, P. A. and Bussab, W. O. (2017). Estatística básica. Saraiva Educação SA.
Romero, C. and Ventura, S. (2013). Data mining in education. Wiley Interdisciplinary Reviews: Data mining and knowledge discovery, 3(1):12–27.
Spanol, M., Oliveira, E., Alves, G., Bittencourt, I. M., Falcao, T. P., and Mello, R. F. (2022). Uso de agrupamento para avaliação de desempenho educacional e apoio à gestão em áreas de investimento. In Anais do XXXIII Simpósio Brasileiro de Informática na Educação, pages 944–955. SBC.
Vasconcelos, J. C., Lima, P. V. P. S., Rocha, L. A., and Khan, A. S. (2021). Infraestrutura escolar e investimentos públicos em educação no brasil: a importância para o desempenho educacional. Ensaio: Avaliação e Políticas Públicas em Educação, 29(113):874–898.
Wang, H., Bah, M. J., and Hammad, M. (2019). Progress in outlier detection techniques: A survey. Ieee Access, 7:107964–108000.
Zhao, Y., Nasrullah, Z., and Li, Z. (2019). Pyod: A python toolbox for scalable outlier detection. arXiv preprint arXiv:1901.01588.
Colombo, S. S. (2014). Gestão universitária: os caminhos para a excelência. Penso Editora.
Costa, E., Baker, R. S., Amorim, L., Magalhães, J., and Marinho, T. (2012). Mineração de dados educacionais: conceitos, técnicas, ferramentas e aplicações. Jornada de Atualização em Informática na Educação, 1(1):1–29.
da Silva Vieira, A., Bertolini, D., and Schwerz, A. L. (2022). Análise do desempenho no enade dos concluintes de computaçao usando técnica de agrupamento. In Anais do XXXIII Simpósio Brasileiro de Informática na Educação, pages 834–845. SBC.
de Siqueira Gê, E. A. and Borges, E. F. (2021). Identificação de outliers em processos de dispensas e inexigibilidades em licitações públicas: um estudo comparativo entre ufrn, ifrn e ufersa nos anos de 2017 e 2018. Revista Inovar Contábil, 2(01).
do Nascimento, P. S. C., da Silva Junior, A. S., Schulz, C. L., dos Santos, M. V. R., Maciel, A. M. A., Rodrigues, R. L., do Nascimento, R. R., and Alencar, F. M. R. (2021). Análise dos impactos da gestão do tempo no desempenho acadêmico através da mineração de dados educacionais. In Anais do XXXII Simpósio Brasileiro de Informática na Educação, pages 783–791. SBC.
Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P. (1996). From data mining to knowledge discovery in databases. AI magazine, 17(3):37–37.
Freitas, N. C., Gouveia, R. M., de Albuquerque Júnior, G. A., Maria da Conceição, M. B., and Rodrigues, R. L. (2022). A implementation mathematical-computational method for the detection and treatment of financial outliers in higher education. In Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional, pages 740–751. SBC.
Goldstein, M. and Uchida, S. (2016). A comparative evaluation of unsupervised anomaly detection algorithms for multivariate data. PloS one, 11(4):e0152173.
Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E., and Tatham, R. L. (2009). Análise multivariada de dados. Bookman editora.
Han, J., Pei, J., and Tong, H. (2022). Data mining: concepts and techniques. Morgan kaufmann.
INEP (2023). Resumo técnico do censo da educação superior.
Machado, R. G. (2022). Subsídio às fiscalizações públicas: Identificação dos municípios com gastos discrepantes na educação básica. Caderno de Finanças Públicas, 22(01).
Morettin, P. A. and Bussab, W. O. (2017). Estatística básica. Saraiva Educação SA.
Romero, C. and Ventura, S. (2013). Data mining in education. Wiley Interdisciplinary Reviews: Data mining and knowledge discovery, 3(1):12–27.
Spanol, M., Oliveira, E., Alves, G., Bittencourt, I. M., Falcao, T. P., and Mello, R. F. (2022). Uso de agrupamento para avaliação de desempenho educacional e apoio à gestão em áreas de investimento. In Anais do XXXIII Simpósio Brasileiro de Informática na Educação, pages 944–955. SBC.
Vasconcelos, J. C., Lima, P. V. P. S., Rocha, L. A., and Khan, A. S. (2021). Infraestrutura escolar e investimentos públicos em educação no brasil: a importância para o desempenho educacional. Ensaio: Avaliação e Políticas Públicas em Educação, 29(113):874–898.
Wang, H., Bah, M. J., and Hammad, M. (2019). Progress in outlier detection techniques: A survey. Ieee Access, 7:107964–108000.
Zhao, Y., Nasrullah, Z., and Li, Z. (2019). Pyod: A python toolbox for scalable outlier detection. arXiv preprint arXiv:1901.01588.
Published
2023-11-06
How to Cite
FREITAS, Nathan C.; GOUVEIA, Roberta M. M.; RODRIGUES, Ebony M.; ALVES, Gabriel; BATISTA, Maria da Conceição M.; RODRIGUES, Rodrigo Lins.
Detecção de Outliers em Finanças de Instituições de Ensino Superior Brasileiras Utilizando Aprendizado de Máquina Não Supervisionado. In: BRAZILIAN SYMPOSIUM ON COMPUTERS IN EDUCATION (SBIE), 34. , 2023, Passo Fundo/RS.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2023
.
p. 1489-1500.
DOI: https://doi.org/10.5753/sbie.2023.235303.
