Processo Sistemático Baseado em Métricas Não-Dicotômicas para Avaliação de Predição de Links em Redes de Coautoria

  • Elisandra Aparecida Alves da Silva Instituto Federal de Educação, Ciência e Tecnologia de São Paulo
  • Marco Túlio Carvalho de Andrade Universidade de São Paulo

Resumo


Predição de Links é uma área de pesquisa importante no contexto de Análise de Redes Sociais tendo em vista que predizer sua evolução é um mecanismo útil para melhorar e propiciar a comunicação entre usuários. Nas redes de coautoria isso pode ser utilizado para recomendação de usuários com interesses de pesquisa comuns. Este artigo apresenta um processo sistemático baseado em métricas não-dicotômicas para avaliação de predição de links em redes de coautoria, sendo considerada a definição de métodos para as seguintes tarefas identificadas: seleção de dados e determinação de novos links. Para seleção de dados definiu-se um sensor fuzzy baseado em atributos dos nós. O uso de composições fuzzy foi considerado para determinação de novos links "ponderados" entre dois autores, adotando-se não apenas atributos dos nós, mas também a combinação de atributos de outros links observados. O link ponderado é denominado "qualidade da relação" e é obtido pelo uso de propriedades estruturais da rede. Para avaliação dos resultados foi adotada a AUC obtida a partir da curva ROC.

Palavras-chave: Predição de Links, Redes de Coautoria, Métricas Não-Dicotômicas

Referências

Acar, E., Dunlavy, D. M., and Kolda, T. G. (2009). Link prediction on evolving data using matrix and tensor factorizations. In ICDMW ’09: Proceedings of the 2009 IEEE International Conference on Data Mining Workshops, pages 262–269, Washington, DC, USA. IEEE Computer Society.

Adamic, L. A. and Adar, E. (2001). Friends and neighbors on the web. SOCIAL NETWORKS, 25:211–230.

Barabási, A. L., Jeong, H., Néda, Z., Ravasz, E., Schubert, A., and Vicsek, T. (2002). Evolution of the social network of scientific collaborations. Physica A: Statistical Mechanics and its Applications, 311(3-4):590 – 614.

Bradley, A. P. (1997). The use of the area under the roc curve in the evaluation of machine learning algorithms. Pattern Recognition, 30(7):1145–1159.

Davidsen, J., Ebel, H., and Bornholdt, S. (2002). Emergence of a small world from local interactions: Modeling acquaintance networks. Physical Review Letters, 88(12):128701.

Egan, J. P. (1975). Signal detection theory and ROC analysis. Academic Press, New York, USA.

Fawcett, T. (2006). An introduction to roc analysis. Pattern Recogn. Lett., 27(8):861–874.

Grossman, J. W. (2002). The evolution of the mathematical research collaboration graph. Congressus Numerantium, 158:201–212.

Hanley, J. A. and Mcneil, B. J. (1982). The meaning and use of the area under a receiver operating characteristic (roc) curve. Radiology, 143(1):29–36.

Hasan, M., Chaoji, V., Salem, S., and Zaki, M. J. (2006). Link prediction using supervised learning.

Jin, E. M., Girvan, M., and Newman, M. E. J. (2001). The structure of growing social networks. Physical Review E, 64(4):046132.

Liben-Nowell, D. and Kleinberg, J. (2007). The link-prediction problem for social networks. Journal of the American Society for Information Science and Technology, 58(7):1019–1031.

Murata, T. and Moriyasu, S. (2008). Link prediction based on structural properties of online social networks. New Generation Comput., 26(3):245–257.

Newman, M. E. J. (2001). The structure of scientific collaboration networks. Proceedings of the National Academy of Sciences USA, 98(2):404–409.

Newman, M. E. J. (2002). The structure and function of networks. Computer Physics Communications, 147:40–45.

Newman, M. E. J. (2003). The structure and function of complex networks. SIAM Review, 45:167–256.

Prati, R. C., Batista, G. E. A. P. A., and Monard, M. C. (2008). Curvas roc para avaliação de classificadores. Revista IEEE América Latina, 6(2):215–222.

Scripps, J., Tan, P.-N., Chen, F., and Esfahanian, A.-H. (2008). A matrix alignment approach for link prediction. Pattern Recognition, 2008. ICPR 2008. 19th International Conference on, pages 1–4.

Silva, E. A. A. and Andrade, M. T. C. (2011). Proposta de um Processo Sistemático Baseado em Métricas N˜ao-Dicotômicas para Avaliação de Predição de Links em Redes de Coautoria. PhD thesis, Escola Politécnica da Universidade de S˜ao Paulo.

Spackman, K. A. (1989). Signal detection theory: Valuable tools for evaluating inductive learning. Proceedings of the 6th Int Workshop on Machine Learning, pages 160–163. Trier, U. (2009). Digital bibliography & library project (dblp).

Wang, C., Satuluri, V., and Parthasarathy, S. (2007). Local probabilistic models for link prediction. In ICDM ’07: Proceedings of the 2007 Seventh IEEE International Conference on Data Mining, pages 322–331, Washington, DC, USA. IEEE Computer Society.

Watts, D. J. (1999). Small Worlds. Princeton University Press, New Jersey.

Watts, D. J. and Strogatz, S. H. (1998). Collective dynamics of ’small-world’ networks. Nature, 393:440–442.
Publicado
01/08/2014
Como Citar

Selecione um Formato
SILVA, Elisandra Aparecida Alves da; ANDRADE, Marco Túlio Carvalho de. Processo Sistemático Baseado em Métricas Não-Dicotômicas para Avaliação de Predição de Links em Redes de Coautoria. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING (BRASNAM), 3. , 2014, Brasília. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2014 . p.   188-199. ISSN 2595-6094.