Uma abordagem para atribuição automática de metadados sobre enunciados de questões em vídeos educacionais
Resumo
Sistemas de recomendação podem ser utilizados para organizar e recuperar vídeos utilizados na educação, a partir de metadados. Enunciados de questões em videoaulas podem fornecer metadados úteis para esse processo. Porém, ao contrário de fontes textuais, não há marcadores claros que os identifiquem, já que o conteúdo é apresentado em fala contínua. Além disso, eles podem estar mesclados à explicações dadas pelo professor durante a fala, o que torna a identificação mais complexa. Esse trabalho, propõe um modelo de identificação e classificação automática de enunciados de questões em videoaulas em inglês com base na Taxonomia de Bloom Digital. A avaliação do modelo foi realizada utilizando algoritmos classificadores, onde o modelo BERT se destacou como superior aos demais.
Referências
Aquino, B., Barrére, E., and de Souza, J. F. (2022). Classificação automática de estilos de videoaulas. In Anais do XXXIII Simpósio Brasileiro de Informática na Educação, pages 956–967, Porto Alegre, RS, Brasil. SBC.
Aquino, B., de Souza, J. F., and Barrére, E. (2023). Automatic classification of learning material styles. Revista Brasileira de Informática na Educação, 31:906–924.
Baevski, A., Zhou, Y., Mohamed, A., and Auli, M. (2020). Wav2vec 2.0: A framework for self-supervised learning of speech representations. Advances in neural information processing systems, 33:12449–12460.
Balasubramanian, V., Doraisamy, S. G., and Kanakarajan, N. K. (2016). A multimodal approach for extracting content descriptive metadata from lecture videos. Journal of Intelligent Information Systems, 46:121–145.
Barrére, E., Alvim de Almeida, M., Aparecida Vitor, M., and Francisco de Souza, J. (2020a). Utilização de enriquecimento semântico para a recomendação automática de videoaulas no Moodle. Revista Brasileira de Informática na Educação, 28(1).
Barrére, E., Souza, J., and Soares, E. R. (2020b). Framework para segmentação temporal de vídeos educacionais. In Anais do XXXI Simpósio Brasileiro de Informática na Educação, pages 972–981. SBC.
Barrére, E., Souza, J., Vitor, M. A., and de Almeida, M. A. (2018). Recomendação automática de videoaulas no Moodle. In Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação-SBIE), volume 29, page 1613.
Borges, M. V. M., and dos Reis, J. C. (2019). Semantic-enhanced recommendation of video lectures. In 2019 IEEE 19th International Conference on Advanced Learning Technologies (ICALT), volume 2161, pages 42–46. IEEE.
Carvalho, H., Pitangui, C., Assis, L., and Vivas, A. (2020). Educavídeos: Um sistema de recomendação de objetos de aprendizagem de vídeos educacionais do YouTube. In XVII Congresso Brasileiro de Ensino Superior a Distância.
Coelho, S. A., and de Souza, J. F. (2014). Anotação semântica de transcritos para indexação e busca de vídeos. In Conferência Ibero Americana (WWW/INTERNET).
Devlin, J., Chang, M.-W., Lee, K., and Toutanova, K. (2019). Bert: Pre-training of deep bidirectional transformers for language understanding.
Gani, M. O., Ayyasamy, R. K., Sangodiah, A., and Fui, Y. T. (2023). Bloom’s taxonomy-based exam question classification: The outcome of CNN and optimal pre-trained word embedding technique. Education and Information Technologies, pages 1–22.
Haris, S. S., and Omar, N. (2015). Bloom’s taxonomy question categorization using rules and n-gram approach. Journal of Theoretical & Applied Information Technology, 76(3).
Lima Dias, L., Barrére, E., Siqueira Barbosa, J., and de Souza, J. F. (2017). Uma abordagem para identificação de similaridade entre recursos educacionais utilizando bases de conhecimento externas. Revista Brasileira de Informática na Educação, 25(2).
Mohammed, M. and Omar, N. (2020). Question classification based on bloom’s taxonomy cognitive domain using modified tf-idf and word2vec. PloS one, 15(3):e0230442.
Omar, N., Haris, S. S., Hassan, R., Arshad, H., Rahmat, M., Zainal, N. F. A., and Zulkifli, R. (2012). Automated analysis of exam questions according to bloom’s taxonomy. Procedia-Social and Behavioral Sciences, 59:297–303.
Pal, S., Pramanik, P. K. D., Majumdar, T., and Choudhury, P. (2019). A semi-automatic metadata extraction model and method for video-based e-learning contents. Education and Information Technologies, 24:3243–3268.
Radford, A., Kim, J. W., Xu, T., Brockman, G., McLeavey, C., and Sutskever, I. (2023). Robust speech recognition via large-scale weak supervision. In International Conference on Machine Learning, pages 28492–28518. PMLR.
Razzaghnoori, M., Sajedi, H., and Jazani, I. K. (2018). Question classification in Persian using word vectors and frequencies. Cognitive Systems Research, 47:16–27.
Setyaningsih, E. R., and Listiowarni, I. (2021). Categorization of exam questions based on bloom taxonomy using naïve bayes and laplace smoothing. In 2021 3rd East Indonesia Conference on Computer and Information Technology (EIConCIT), pages 330–333. IEEE.
Yahya, A. (2011). Automatic classification of questions into bloom’s cognitive levels using support vector machines. In The International Arab Conference on Information Technology.
Yahya, A. A., Toukal, Z., and Osman, A. (2012). Bloom’s taxonomy–based classification for item bank questions using support vector machines. In Ding, W., Jiang, H., Ali, M., and Li, M., editors, Modern Advances in Intelligent Systems and Tools, pages 135–140, Berlin, Heidelberg. Springer Berlin Heidelberg.
Yang, H., and Meinel, C. (2014). Content based lecture video retrieval using speech and video text information. IEEE Transactions on Learning Technologies, 7(2):142–154.