Uma ferramenta para geração de datasets educacionais no formato Weka
Resumo
Modelos para mineração de dados (MD) têm sido amplamente discutidos nos últimos anos. Um software, muito difundido no meio acadêmico, que auxilia o processo de MD é o Weka. Este artigo apresenta uma ferramenta (e sua avaliação) que objetiva substituir o trabalho manual, exercendo o processo de transformação dos dados de um banco de dados, em um dataset no formato exigido pelo Weka. A avaliação da ferramenta, realizada por pesquisadores da área de MD para educação, resultou em níveis positivos de usabilidade e percepção de utilidade.
Palavras-chave:
mineração de dados, Weka, transformação de dados, datasets educacionais
Referências
Allen, I. E. and Seaman, C. A. (2007). Likert scales and data analyses. Quality progress, 40(7):64.
Baker, R., Isotani, S., and Carvalho, A. (2011). Mineração de dados educacionais: Oportunidades para o Brasil. Brazilian Journal of Computers in Education, 19(02):03.
Bateson, G. (1986). Mente e natureza: a unidade necessária. F. Alves.
Calixto, K., Segundo, C., and de Gusmão, R. P. (2017). Mineração de dados aplicada à educação: um estudo comparativo acerca das características que influenciam a evasão escolar. In Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação - SBIE), volume 28, page 1447.
Cristofor, L. (2008). Artool project. University of Massachusetts, Boston.
Dukas, R. (1998). Cognitive ecology: the evolutionary ecology of information processing and decision making. University of Chicago Press.
Garner, S. R. et al. (1995). Weka: The Waikato environment for knowledge analysis. In Proceedings of the New Zealand computer science research students conference, pages 57–64. Citeseer.
Gašević, D., Dawson, S., and Siemens, G. (2015). Let’s not forget: Learning analytics are about learning. TechTrends, 59(1):64–71.
Groblschegg, M. (2003). Developing a test data generator for market basket analysis for e-commerce applications. Vienna University of Economics and Business Administration.
Haddawy, P. et al. (2007). Deriving financial aid optimization models from admissions data. In Frontiers In Education Conference-Global Engineering: Knowledge Without Borders, Opportunities Without Passports, 2007. FIE’07. 37th Annual, pages F2A–7. IEEE.
Hall, M., Frank, E., Holmes, G., Pfahringer, B., Reutemann, P., and Witten, I. H. (2009). The Weka data mining software: an update. ACM SIGKDD explorations newsletter, 11(1):10–18.
Hosmer Jr, D. W., Lemeshow, S., and Sturdivant, R. X. (2013). Applied logistic regression, volume 398. John Wiley & Sons.
Omari, A., Langer, R., and Conrad, S. (2008). Tartool: A temporal dataset generator for market basket analysis. In International Conference on Advanced Data Mining and Applications, pages 400–410. Springer.
Piaget, J. and Del Val, J. A. (1970). La epistemología genética. A. Redondo.
Smart, P., Heersmink, R., and Clowes, R. W. (2017). The cognitive ecology of the internet. In Cognition beyond the brain, pages 251–282. Springer.
Tijiboy, A. V., Macçada, D. L., Santarosa, L. M. C., and Fagundes, L. d. C. (1999). Aprendizagem cooperativa em ambientes telemáticos. Informática na Educação: teoria & prática. Porto Alegre. Vol. 1, n. 2 (abr. 1999), p. 19-28.
Tribble, E. and Sutton, J. (2011). Cognitive ecology as a framework for shakespearean studies. Shakespeare Studies, 39:94.
Worcester, R. M. and Burns, T. R. (1975). Statistical examination of relative precision of verbal scales. Journal of the Market Research Society, 17(3):181–197.
Zyt, J., Klosgen, W., and Zytkow, J. (2002). Handbook of data mining and knowledge discovery. Oxford University Press.
Baker, R., Isotani, S., and Carvalho, A. (2011). Mineração de dados educacionais: Oportunidades para o Brasil. Brazilian Journal of Computers in Education, 19(02):03.
Bateson, G. (1986). Mente e natureza: a unidade necessária. F. Alves.
Calixto, K., Segundo, C., and de Gusmão, R. P. (2017). Mineração de dados aplicada à educação: um estudo comparativo acerca das características que influenciam a evasão escolar. In Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação - SBIE), volume 28, page 1447.
Cristofor, L. (2008). Artool project. University of Massachusetts, Boston.
Dukas, R. (1998). Cognitive ecology: the evolutionary ecology of information processing and decision making. University of Chicago Press.
Garner, S. R. et al. (1995). Weka: The Waikato environment for knowledge analysis. In Proceedings of the New Zealand computer science research students conference, pages 57–64. Citeseer.
Gašević, D., Dawson, S., and Siemens, G. (2015). Let’s not forget: Learning analytics are about learning. TechTrends, 59(1):64–71.
Groblschegg, M. (2003). Developing a test data generator for market basket analysis for e-commerce applications. Vienna University of Economics and Business Administration.
Haddawy, P. et al. (2007). Deriving financial aid optimization models from admissions data. In Frontiers In Education Conference-Global Engineering: Knowledge Without Borders, Opportunities Without Passports, 2007. FIE’07. 37th Annual, pages F2A–7. IEEE.
Hall, M., Frank, E., Holmes, G., Pfahringer, B., Reutemann, P., and Witten, I. H. (2009). The Weka data mining software: an update. ACM SIGKDD explorations newsletter, 11(1):10–18.
Hosmer Jr, D. W., Lemeshow, S., and Sturdivant, R. X. (2013). Applied logistic regression, volume 398. John Wiley & Sons.
Omari, A., Langer, R., and Conrad, S. (2008). Tartool: A temporal dataset generator for market basket analysis. In International Conference on Advanced Data Mining and Applications, pages 400–410. Springer.
Piaget, J. and Del Val, J. A. (1970). La epistemología genética. A. Redondo.
Smart, P., Heersmink, R., and Clowes, R. W. (2017). The cognitive ecology of the internet. In Cognition beyond the brain, pages 251–282. Springer.
Tijiboy, A. V., Macçada, D. L., Santarosa, L. M. C., and Fagundes, L. d. C. (1999). Aprendizagem cooperativa em ambientes telemáticos. Informática na Educação: teoria & prática. Porto Alegre. Vol. 1, n. 2 (abr. 1999), p. 19-28.
Tribble, E. and Sutton, J. (2011). Cognitive ecology as a framework for shakespearean studies. Shakespeare Studies, 39:94.
Worcester, R. M. and Burns, T. R. (1975). Statistical examination of relative precision of verbal scales. Journal of the Market Research Society, 17(3):181–197.
Zyt, J., Klosgen, W., and Zytkow, J. (2002). Handbook of data mining and knowledge discovery. Oxford University Press.
Publicado
29/10/2018
Como Citar
SILVEIRA, Pedro D. N.; CURY, Davidson; MENEZES, Crediné; SANTOS, Otávio L..
Uma ferramenta para geração de datasets educacionais no formato Weka. In: SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO (SBIE), 29. , 2018, Fortaleza/CE.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2018
.
p. 1343-1352.
DOI: https://doi.org/10.5753/cbie.sbie.2018.1343.
