Computational Mining on IBICT BDTD’s Thesis and Dissertation Metadata for Supporting Social Science Research

  • Rodrigo R. Filho Universidade Federal de Goias
  • Elismênnia Oliveira Universidade Federal de Goias
  • Jordão Nunes Universidade Federal de Goiás
  • Marcelo Inuzuka Universidade Federal de Goiás
  • Hugo do Nascimento Universidade Federal de Goiás

Resumo


The Brazilian Digital Library of Thesis and Dissertations (BDTD) provides essential data to support many social sciences investigations. Nevertheless, there is still a lack of computation tools tailored for helping extract and analyze the necessary information from the BDTD library. In this paper, we discuss the development of computational solutions to answer questions from a particular social sciences research using metadata from BDTD. The solutions involve the integration of data processing and presentation techniques, such as string-processing algorithms, knowledge graphs and information visualizations. All programming codes implemented at the scope of the project are available for helping other researchers. The paper also highlights the importance of having researchers from Social Science and Computer Science working together, what motivates future collaborations in these areas.

Palavras-chave: Social Science, text analysis, knowledge graphs, information visualization

Referências

Alves, A. D., Yanasse, H. H., and Soma, N. Y. (2011). SUCUPIRA: A system for Information extraction of the Lattes Platform to identify academic social networks. In 6th Iberian Conference on Information Systems and Technologies (CISTI 2011), pages 1–6. ISSN: 2166-0735.

Bucher-Maluschke, J. S. N. F., Silva, J. C. e., and Souza, I. B. d. S. d. (2019). REVISÃO SOBRE O PRESÍDIO FEMININO NOS ESTUDOS BRASILEIROS. Pcologia & Sociedade, 31. Publisher: Associação Brasileira de Psicologia Social.

Campello, B. S., Vianna, M. M., Caldeira, P. d. T., Abreu, V. L. F. G., Carvalho, M. d. C., and Benigno, A. C. e. S. (2007). Literatura sobre biblioteca escolar: caracterı́sticas de citações de teses e dissertações brasileiras. Transinformação, 19(3):227–236.

Costa, O. A. d. and Rodrigues, A. C. L. (2019). Mapeamento da produção cientı́fica na BDTD do IBICT sobre a Pedagogia da Alternância de 2011 a 2018. Revista Brasileira de Educação do Campo, 4:e7257–e7257.

Hayashi, M. C. P. I., Cabrero, R. d. C., Costa, M. d. P. R. d., and Hayashi, C. R. M. (2007). Indicadores da participação feminina em Ciência e Tecnologia. Transinformação, 19(2):169–187. Publisher: Pontifı́cia Universidade Católica de Campinas.

Kambatla, K., Kollias, G., Kumar, V., and Grama, A. (2014). Trends in big data analytics. Journal of Parallel and Distributed Computing, 74(7):2561–2573.

McAfee, A. and Brynjolfsson, E. (2012). Big data: the management revolution. Harvard Business Review, 90(10):60–66, 68, 128.

Mena-Chalco, J. P. and Cesar Junior, R. M. (2009). ScriptLattes: an open-source knowledge extraction system from the Lattes platform. Journal of the Brazilian Computer Society, 15(4):31–39.

Santos Junior, J. d. S. and Real, G. C. M. (2017). Dropout from higher education: the state of the art of researches in Brazil since 1990. Avaliação: Revista da Avaliação da Educação Superior (Campinas), 22(2):385–402. Publisher: Avaliação: Revista da Avaliação da Educação Superior.

Silva, P. d., Pinto, G. F. S., and Furnival, A. C. (2018). Análise dos aspectos normtivos e legais do uso de fotografias contidas em teses e dissertações disponı́veis na BDTD/IBICT. Brazilian Journal of Information Science: Research Trends, 12(3):22 ao 33–22 ao 33. Number: 3.

Vitta, F. C. F. d., Sgavioli, A. J. R., Scarlassara, B. S., Novaes, C. F. M., Cruz, G. d. A., and Moura, M. M. (2018). National Scientific Production in the Special Education Area and Daycare. Revista Brasileira de Educação Especial, 24(4):619–636. Publisher: Associação Brasileira de Pesquisadores em Educação Especial.

Zhang, J., Wong, J.-S., Li, T., and Pan, Y. (2014). A comparison of parallel large-scale knowledge acquisition using rough set theory on different MapReduce runtime systems. International Journal of Approximate Reasoning, 55(3):896–907.
Publicado
20/10/2020
R. FILHO, Rodrigo; OLIVEIRA, Elismênnia; NUNES, Jordão; INUZUKA, Marcelo; DO NASCIMENTO, Hugo. Computational Mining on IBICT BDTD’s Thesis and Dissertation Metadata for Supporting Social Science Research. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 17. , 2020, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2020 . p. 603-614. ISSN 2763-9061. DOI: https://doi.org/10.5753/eniac.2020.12163.