Desambiguação de nomes em redes sociais acadêmicas: Um estudo de caso usando DBLP
Resumo
A identificação de autores é fundamental a precisão dos cálculos bibliométricos, mas homônimos e polissemia atrapalham a identificação, sendo necessária a aplicação de um algoritmo de desambiguação de nomes de autor. Este artigo propõe uma técnica de desambiguação que consiste em extração automática de características seguidas da aplicação de um classificador. Os resultados obtidos no estudo de caso atingiram precisão de 96%, similar ao estado da arte da literatura.
Referências
Han, H., Giles, L., Zha, H., Li, C., and Tsioutsiouliklis, K. (2004). Two supervised learning approaches for name disambiguation in author citations. In Chen, H., editor, 4th ACM/IEEE-CS Joint Conference on Digital Libraries, pages 296–305.
Lima, H., Silva, T., Moro, M., Santos, R., Meira, Wagner, J., and Laender, A. (2015). Assessing the profile of top Brazilian computer science researchers. Scientometrics, pages 1–18.
Liu,W., Dogan, R. I., Kim, S., Comeau, D. C., Kim,W., Yeganova, Z., and Lu, Z. (2014). Author name disambiguation for pubmed. Journal of the Association for Information Science and Technology, 65(4):765–781.
Milojevic, S. (2013). Accuracy of simple, initials-based methods for author name disambiguation. Journal of Informetrics, 7(2):767–773.
Rodriguez, J., Kuncheva, L., and Alonso, C. (2006). Rotation forest: A new classifier ensemble method. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 28(10):1619–1630.
Smalheiser, N. R. and Torvik, V. I. (2009). Author name disambiguation. Annual Review of Information Science and Technology, 43(1):1–43.
Song, Y., Huang, J., Council, I. G., Li, J., and Giles, C. L. (2007). Efficient topic-based unsupervised name disambiguation. In Sugimoto, S., editor, JCDL ’07 Proceedings of the 7th ACM/IEEE-CS joint conference on Digital libraries, pages 342–351.
Strotmann, A. and Zhao, D. (2012). Author name disambiguation: What difference does it make in author-based citation analysis? Journal of the American Society for Information Science and Technology, 63(9):1820–1833.