Ensino de Engenharia de Dados nas Universidades Brasileiras: Estado Atual e Perspectivas de Mercado

Resumo


O termo Engenharia de Dados (ED) tem sido utilizado para se referir aos processos de adquirir, organizar e preparar dados para serem consumidos em análises ou aplicações. Com o surgimento da área de Ciência de Dados, esse termo tem sido usado para englobar o que tradicionalmente era conhecido como gerenciamento de dados. Neste estudo, exploramos a ED no contexto acadêmico e industrial brasileiro, destacando a sua crescente relevância e a necessidade de habilidades relacionadas a ela nos profissionais de computação. Nossa motivação foi percepção de que os avanços de pelo menos uma década na indústria em ED ainda não foram adequadamente absorvidos pelo ensino nas universidades. Para esse trabalho, construímos e comparamos duas taxonomias de tópicos, que resultaram, respectivamente, de levantamentos das disciplinas, bibliografias e ementas relacionadas a ED em universidades brasileiras e junto a empresas de tecnologia do país. Identificamos uma lacuna entre o ensino e mercado, com currículos desatualizados quanto a tópicos considerados relevantes para a indústria contemporânea. Em particular, tópicos sobre a plataformas de dados de alto desempenho, gerência de dados em nuvem e workflow de dados são destacados como grandes necessidades atuais da indústria, mas que são pouco explorados nos currículos. Nosso objetivo é subsidiar mudanças nos currículos que possam contribuir para a formação de profissionais mais qualificados e alinhados às necessidades modernas do mercado.

Palavras-chave: Engenharia de Dados, Mercado de Trabalho, Educação Superior

Referências

Arrieta-Ibarra, I. et al. (2018). Should we treat data as labor? moving beyond ”free”. AEA Papers and Proceedings, 108:38–42.

Bie, T. D. et al. (2022). Automating data science. Commun. ACM, 65(3):76–87.

Grillenberger, A. and Romeike, R. (2014). Big data - challenges for computer science education. In Proceedingso of the 7th Int. Conf. on Informatics in Schools: Situation, Evolution, and Perspectives, ISSEP, pages 29–40.

Grillenberger, A. and Romeike, R. (2017). Key concepts of data management – an empirical approach. In Proceedings of the 17th Koli Calling Int. Conf. on Computing Education Research, page 30–39.

Hassan, I. B. and Liu, J. (2019). Embedding data science into computer science education. In IEEE Int. Conf. on Electro Information Technology EIT, pages 367–372.

Nazábal, A. et al. (2020). Data engineering for data analytics: A classification of the issues, and case studies. CoRR, abs/2004.12929.

Reinsel, D. et al. (2018). The digitization of the world - from edge to core.

Silva, Y. N. et al. (2014). Integrating big data into the computing curricula. In The 45th ACM Technical Symposium on Computer Science Education, SIGCSE, pages 139–144.

Stonebraker, M. and C¸etintemel, U. (2005). ”one size fits all”: An idea whose time has come and gone. In Proceedings of the 21st International Conference on Data Engineering, ICDE, pages 2–11.

Zaharia, M. et al. (2021). Lakehouse: A new generation of open platforms that unify data warehousing and advanced analytics. In 11th Conference on Innovative Data Systems Research, CIDR 2021, Virtual Event, Online Proceedings.
Publicado
25/09/2023
AZEVEDO, Tarsis; DA SILVA, Altigran. Ensino de Engenharia de Dados nas Universidades Brasileiras: Estado Atual e Perspectivas de Mercado. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 38. , 2023, Belo Horizonte/MG. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 432-438. ISSN 2763-8979. DOI: https://doi.org/10.5753/sbbd.2023.232464.