Resume Analysis in Portuguese using Word Embeddings: Development of a Decision Support System for Candidate Selection

  • Manoel Garcia de Sousa Neto Universidade Federal do Pará
  • Filipe Saraiva Universidade Federal do Pará

Resumo


Este estudo propõe o uso de word embeddings para analisar e comparar currículos em português com descrições para vagas de emprego. Apresenta o desenvolvimento de um sistema de suporte à decisão que identifica a adequação dos candidatos com base em sua experiência profissional. O estudo utiliza diferentes modelos de word embeddings, como Word2Vec, Wang2Vec, FastText e GloVe, para gerar representações numéricas de palavras em currículos e descrições de empregos, a fim de avaliar o desempenho desses modelos no contexto da língua portuguesa. A pesquisa tem como objetivo auxiliar na análise de currículos e aprimorar a precisão dos processos de seleção de candidatos.

Palavras-chave: falhas elétricas, classificação, aprendizado de máquina, lógica fuzzy, explicabilidade

Referências

Anchiêta, Rafael; Neto, Francisco A.R.; Marinho, Jeziel C.; Moura, Raimundo(2021). PLN: Das Técnicas Tradicionais aos Modelos de Deep Learning. SCB OPEN LIB, Cap.1. p 3-5.

Bojanowski, P.; Grave, E.; Joulin, A.; Mikolov, Tomas. Enriching word vectors with subword information(2017). Transactions of the Association for Computational Linguistics, 5:135–146.

Bonadia, Graziella C. Barreto, Gilmar(2019).Análise de Sentimentos em comentários na língua portuguesa: uma comparação de métodos. Simpósio Brasileiro de Automação Inteligente, SBAI 2019, Brazil.

Devi, Renuka B.;Banu, Vijaya(2014). Introduction to Recruitment. SSRG International Journal of Economics and Management Studies 1.2, p.5-8.

Hartmann, Nathan et al(2017). Portuguese Word Embeddings: Evaluating on Word Analogies and Natural Language Tasks.arXiv preprint arXiv:1708.06025.

Ivancevich, J. M(2008). Gestão de recursos humanos. São Paulo: McGraw-Hill.

Ling, W.; Dyer, C.; Black, A. W.;Trancoso, I(2015). Two/too simple adaptations of word2vec for syntax problems. Em Proceedings of the 2015 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, p. 1299–1304.

Martins, V. S. Silva, C. D(2021).Text Classification in Law Area: a Systematic Review.Symposium on Knowledge Discovery, Mining and Learning, KDMILE 2021.

Medeiros, Morgana (2017).F.Recrutamento E Seleção De Pessoas: Métodos E Técnicas Que Podem Ser Utilizados Por Profissionais De Recursos Humanos.2017; Monografia; (Aperfeiçoamento/Especialização em Gestão de Pessoas) - Universidade do Sul de Santa Catarina.

Mikolov, Tomas et al(2013). Efficient Estimation of Word Representations in Vector Space. ArXiv13013781.

Mohamed, Ashif; Bagawathinathan, Wickram; Iqbal, Usama; Shamrath, Shahik; Jayakody, Anuradha(2018). Smart Talents Recruiter - Resume Ranking and Recommendation System. 2018 IEEE International Conference on Information and Automation for Sustainability (ICIAfS). Sri Lanka.

Najjar,Arwa; Amro,Belal; Macedo, Mario(2021). An Intelligent Decision Support System For Recruitment: Resumes Screening and Applicants Ranking. Computers & Applied Sciences Complete, Informatica (Ljubljana), Vol.45 (4).

Núcleo Interinstitucional de Linguística Computacional (NILC)(2017). Repositório de Word Embeddings do NILC. Universidade de São Paulo. Available in: [link].

Oliveira, Maxwell Ferreira(2011). Metodologia científica: um manual para a realização de pesquisas em Administração. Catalão: UFG.

Oliveira, Ikaro Ramon Vidal De; Macêdo, Maria Erilúcia Cruz(2020). O Papel Determinante do Currículo no Processo de Recrutamento e Seleção / The Role of Curriculum in the Recruitment and Selection Process. ID on line. Revista de psicologia, [S.l.], v. 14, n. 49, p. 212-228.

Pastro, Jonata Teixeira(2018). Detecção de tweets sobre Eventos de Trânsito usando Word Embedding. Monografia(Bacharelado em Ciência da Computação), Instituto de Informática, Universidade Federal do Rio Grande do Sul, Brazil.

Pennington, Jeffrey; Socher, Richard; Manning(2014), Christopher.GloVe: Global Vectors for Word Representation. Proceedings of the 2014 Conference on Empiricial Methods in Natural Language Processing.

Rodrigues, J. et al(2016). Lx-dsemvectors: Distributional semantics models for portuguese. In: Computational Processing of the Portuguese Language. Cham: Springer International Publishing, p. 259–270. ISBN 978-3-319-41552-9.

Roy, Pradeep Kumar; Chowdhary, Sarabjeet Singh; Bathia, Rocky(2020). A Machine Learning approach for automation of Resume Recommendation system. Procedia Computer Science, vol. 167. p 2318-2327.

Sivaramakrishnan, N; Subramaniyaswamy. V, Arunkumara, S(2018). Validating effective resume based on employer’s interest with recommendation system. Int. J. Pure Appl. Math., volume 119.

Sousa, Priscila Sad(2018). Estimando Similaridade Entre Entidades Quando Apenas Seus Nomes Estão Disponíveis. Dissertação(Mestrado em Ciência da Computação)-Departamento de Computação - DECOM, Universidade Federal de Ouro Preto, Brazil.

Souza, Luiz Fernando; Gonçalves, Alexandre Leopoldo; Souza, João Artur(2020). Utilização Prática de Word Embeddings Aplicada à Classificação de Texto. X Congreso Internacional de Conocimiento e Innovación. Panama.

Spearman, C. (1904). The Proof and Measurement of Association between Two Things. Am. J. Psychol. 15, 72–101.

Zhai, M.; Tan, J.; Choi, J.D(2016). Intrinsic and Extrinsic Evaluations of Word Embeddings. In Proceedings of the Thirtieth AAAIConference on Artificial Intelligence (AAAI’16), Phoenix, AZ, USA.
Publicado
25/09/2023
DE SOUSA NETO, Manoel Garcia; SARAIVA, Filipe. Resume Analysis in Portuguese using Word Embeddings: Development of a Decision Support System for Candidate Selection. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 20. , 2023, Belo Horizonte/MG. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 1074-1088. ISSN 2763-9061. DOI: https://doi.org/10.5753/eniac.2023.234609.