Algoritmo para Cálculo da Similaridade Semântica entre Nomes de Conferências Cadastradas no Curriculum Lattes e na Base Qualis
Resumo
A Plataforma Lattes é um ambiente no qual os pesquisadores registram dados relacionados às suas atividades acadêmicas, dentre elas as publicações em periódicos e eventos. No Brasil, esses periódicos e eventos podem ter um indicador de avaliação conhecido como Qualis. A automatização da extração de dados de publicações de periódicos do currı́culo Lattes e a obtenção do Qualis correspondente é uma tarefa trivial graças ao uso do ISSN como chave de identificação. No entanto, quando se trata de artigos publicados em eventos, a única chave de identificação disponı́vel é o nome do evento, o que dificulta essa busca. Neste artigo, propomos um algoritmo para uma comparação eficiente de sentenças e o aplicamos na comparação de nomes de eventos para que seja possı́vel buscar com o máximo de assertividade o Qualis para as publicações em eventos registradas em um currı́culo.
Referências
Farouk, M. (2018). Sentence semantic similarity based on word embedding and wordnet. In International Conference on Computer Engineering and Systems (ICCES), pages 33–37.
Ho, C., Murad, M. A. A., Kadir, R. A., and Doraisamy, S. C. (2010). Word sense disambiguation-based sentence similarity. In International Conference on Computational Linguistics: Posters (COLING), pages 418—-426.
Sucupira (2020). 05/03/2020. Portal sucupira. https://sucupira.capes.gov.br. Último acesso em