Análise Comparativa das Demandas do Mercado de Trabalho em Ciência de Dados em 2024 com a Classificação Brasileira de Ocupações Utilizando Processamento de Linguagem Natural
Resumo
Este estudo teve como objetivo comparar as competências demandadas pelo mercado de trabalho em 2024 na área de Ciência de Dados com os parâmetros estabelecidos pela Classificação Brasileira de Ocupações (CBO). A análise destacou a natureza colaborativa e a versatilidade exigidas para atuar em diversos contextos, sublinhando a importância de compreender as transformações nas estruturas ocupacionais contemporâneas e a necessidade de revisar a CBO para refletir essas mudanças dinâmicas. Foram abordadas as etapas essenciais de pré-processamento de dados, destacando sua relevância para garantir uma análise robusta. O estudo também explorou a análise de frequência de palavras e de similaridades entre a descrição. Os resultados preliminares revelaram uma compreensão mais abrangente do panorama profissional, contribuindo para uma análise detalhada das demandas específicas no campo de Ciência de Dados e evidenciando a importância da adaptação contínua das classificações para melhor refletir a dinâmica evolutiva do mercado de trabalho.
Referências
Ayoobzadeh, M. 2022. "Freelance job search during times of uncertainty: protean career orientation, career competencies and job search. Personnel Review 6: 40–56.
Brasil. 2024. Ministério do Trabalho. *Classificação Brasileira de Ocupações*. Brasília. Disponível em: . Acesso em: 12 nov. 2023.
Radovilsky, Z. et al. 2018. "Skills requirements of business data analytics and data science jobs: A comparative analysis. In: Journal of Supply Chain and Operations Management. 2018, California, USA. p. 82-101.
Halwani, M.A., Amirkiaee, S.Y., Evangelopoulos, N. and Prybutok, V. 2022, "Job qualifications study for data science and big data professions", Information Technology & People, p 510-525.
Glez-Peña, D; Lourenço, A; López-Fernández, H.; Reboiro-Jato, M.; Fdez-Riverola, F. 2014. “Web scraping technologies in an API world. “In Briefings in Bioinformatics 15: 788–797.
Wilkinson, M.; Dumontier, M.; Aalbersberg, I. et al. 2016. “The FAIR Guiding Principles for scientific data management and stewardship.” In Scientific Data 3:18-16.
Python. 2022. re — Operações com expressões regulares. Disponível em: . Acesso em: 20 jan. 2024.
Grefenstette, G. 1999. Tokenization. p.117-133. In: van Halteren, H. Syntactic Wordclass Tagging: Text, Speech and Language Technology, 9 ed.Kremmen, Berlim, Alemanha.
Sarica, S.; Luo, J. 2021. Stopwords in technical language processing. PLOS ONE 16: 25 - 49.
Balakrishnan, V.; Lloyd-Yemoh, E. 2014. “Stemming and lemmatization: A comparison of retrieval performances.” in Software Engineering 2: 174-179.
Bergmanis, T.; Goldwater, S. 2018. Context-sensitive neural lemmatization with lematus. In 16th Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 2018, New Orleans, Louisiana, United States. Anais...p.1391-1400.
Sintia, S.; Defit, S.; Nurcahyo, G. 2021. “Product Codefication Accuracy With Cosine Similarity And Weighted Term Frequency And Inverse Document Frequency (TF-IDF).” in Journal of Applied Engineering and Technological Science (JAETS), 62-69.
Paletta, F. C., & Moreiro González, J. A. 2021. A transformação digital e os impactos no mercado de trabalho: estudo dos anúncios de emprego na web para profissionais da informação no setor privado. Information research, 26(3).
Schuster, M. E. 2008. Mercado de trabalho de tecnologia da informação: O Perfil dos profissionais demandado