Processo de ETL para inserção de dados estatísticos do ensino superior brasileiro com foco em mulheres nas áreas STEM no grafo de conhecimento da plataforma ELLAS

  • Bruna Oenning Amador Universidade Tecnológica Federal do Paraná (UTFPR)
  • Rita Cristina Galarraga Berardi Universidade Tecnológica Federal do Paraná (UTFPR) https://orcid.org/0000-0002-0281-8952

Resumo


Uma discussão eficiente sobre a sub-representação de mulheres em áreas STEM na América Latina deve ser baseada em dados. Posto isso, este artigo tem como objetivo propor um processo de ETL adaptado para Dados Conectados para a integração de dados estatísticos do INEP com foco em mulheres no grafo de conhecimento da plataforma ELLAS. Foi implementado um pipeline que responde questões sobre sobre mulheres na educação superior brasileira em áreas STEM. Este trabalho contribui para a área de grafos de conhecimento por expor uma aplicação prática e seus desdobramentos.
Palavras-chave: ETL, INEP, grafo de conhecimento, STEM

Referências

Carroll, J. J., Bizer, C., Hayes, P., Stickler, P. (2005) Named graphs. Journal of Web Semantics, Elsevier, v. 3, n. 4, p. 247–267. ISSN 1570-8268.

Cordeiro, K. F., et al. (2011). An approach for managing and semantically enriching the publication of linked open government data. 3rd Workshop in Applied Computing for Electronic Government (WCGE). 82-95.

Costa, F., Avila, C., Rolim, T., Andrade, R., & Vidal, V. (2022). DIKW4IoT: Uma abordagem baseada na hierarquia DIKW para a construção de grafos de conhecimento para integração de dados de IoT. In Anais do XXXVII Simpósio Brasileiro de Bancos de Dados, (pp. 190-202). Porto Alegre: SBC.

Gil, A. C. (2022) Como elaborar projetos de pesquisa. [S.l.]: Editora Atlas. ISBN 9786559771646.

Granovskiy, B. (2018) Science, technology, engineering, and mathematics (stem) education: An overview. Congressional Research Service, ERIC.

Hildebrand, N., Amador, B., Maciel, C. e Berardi, R. (2024) A escassez de dados abertos estruturados em países latino-americanos com enfoque de gênero na educação superior. In Anais do XVIII Women in Information Technology, julho 21, 2024, Brasília/DF, Brasil. SBC, Porto Alegre, Brasil, 160-171.

Kimball, R., Caserta, J. (2011). The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data. Alemanha: Wiley.

Koonce, D., Zhou, J., Anderson, C., Hening, D. (2011) What is stem? ASEE Annual Conference Exposition, ASEE Conferences, Vancouver, n. 10.18260/1-2–18582.

Maciel, C., Guzman, I., Berardi, R., Caballero, BB, Rodriguez-Rodriguez, N., Frigo, L., Salgado, L., Jimenez, E., Bim, SA e Tapia, PC (2023) Plataforma de dados abertos para promover políticas de igualdade de gênero em STEM, em Anais do Western Decision Sciences Institute (WDSI). Abril de 2023. Portland Oregon, EUA.

Magalhães, H., Cardoso, L. (2016). Análise de dados abertos sobre o ensino superior brasileiro. Trabalho de conclusão de curso, Universidade de Brasília, Brasília - DF.

Open Knowledge (2024). Open Definition - Defining Open in Open Data, Open Content and Open Knowledge. Disponível em: [link].

Phuoc, D., Quoc, H., Ngo, H., Nhat, T., Hauswirth, M. (2016). The Graph of Things: A step towards the Live Knowledge Graph of connected things. Web Semantics: Science, Services and Agents on the World Wide Web. 37. 25-35.

Rodrigues, F., & Maciel, C. (2022). Um método para captura e compartilhamento de dados abertos educacionais via um processo ETL. In Anais do X Workshop de Computação Aplicada em Governo Eletrônico, (pp. 133-144). Porto Alegre: SBC.

Santos, S. (2016) Um processo para conversão e publicação de dados para modelo rdf seguindo os princípios de Linked Data. TCC (Graduação em Sistemas de Informação) - Universidade Federal do Ceará, Campus Quixadá, Quixadá.

Souza, V. L. (2023) Elaboração de uma ontologia que endereça a presença de mulheres em cursos de computação no brasil.TCC (Graduação em Sistemas de Informação) - Universidade Tecnológica Federal do Paraná, Campus Curitiba.

UNESCO. (2024) International Standard Classification of Education. Disponível em: [link].
Publicado
14/10/2024
AMADOR, Bruna Oenning; BERARDI, Rita Cristina Galarraga. Processo de ETL para inserção de dados estatísticos do ensino superior brasileiro com foco em mulheres nas áreas STEM no grafo de conhecimento da plataforma ELLAS. In: WORKSHOP DE TRABALHOS DE ALUNOS DA GRADUAÇÃO (WTAG) - SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 39. , 2024, Florianópolis/SC. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 15-21. DOI: https://doi.org/10.5753/sbbd_estendido.2024.243652.