Identificação de perfis de comportamento de usuários no Ethereum utilizando técnicas de aprendizado de máquina

  • Júlia A. Valadares UFJF
  • Vinicius C. Oliveira UFJF
  • José Eduardo de Azevedo Sousa UFJF
  • Heder S. Bernardino UFJF
  • Saulo Moraes Villela UFJF
  • Alex B. Vieira UFJF
  • Glauber Dias Gonçalves UFPI

Resumo


Ethereum é uma das maiores plataformas de cripto ativos atualmente, e vem se tornando um ambiente de negócios digitais entre usuários. O Ethereum foi concebido para permitir transações descentralizadas entre usuários anônimos. Contudo, o desenvolvimento de métodos para identificar perfis de comportamentos de usuários, mantendo suas identidades anônimas, têm o potencial para alavancar negócios nessa plataforma. Nesse trabalho, investigamos o uso de aprendizado de máquina para classificar um perfil de usuário como profissional ou comum a partir de atributos de suas transações. Essa classificação é desafiadora devido à pequena fração de usuários publicamente rotulados no Ethereum e ainda a fração consideravelmente menor de usuários profissionais. Para conduzir essa investigação, treinamos modelos considerando conjuntos cuidadosamente balanceados de transações com usuários rotulados. Nossos resultados mostram modelos de alto desempenho para a classificação de perfis, alcançando desempenho superior a 90% para acurácia, precisão, revocação e demais medidas relacionadas. Adicionalmente, identificamos as características mais relevantes em transações para essa classificação.

Referências

Aspembitova, A. T., Feng, L., and Chew, L. Y. (2021). Behavioral structure of users in cryptocurrency market. Plos one, 16(1):e0242600.

Bartoletti, M., Carta, S., Cimoli, T., and Saia, R. (2020). Dissecting ponzi schemes on ethereum: identification, analysis, and impact. Future Generation Computer Systems, 102:259–277.

Boughorbel, S., Jarray, F., and El-Anbari, M. (2017). Optimal classifier for imbalanced data using matthews correlation coefficient metric. PloS one, 12(6).

Breiman, L. (1996). Bagging predictors. Machine learning, 24(2):123–140.

Chen, T., Li, Z., Zhu, Y., Chen, J., Luo, X., Lui, J. C.-S., Lin, X., and Zhang, X. (2020). Understanding ethereum via graph analysis. ACM Transactions on Internet Technology (TOIT), 20(2):1–32.

Cortes, C. and Vapnik, V. (1995). Support-vector networks. Machine learning, 20(3):273– 297.

Dietterich, T. G. et al. (2002). Ensemble learning. The handbook of brain theory and neural networks, 2:110–125.

Hu, T., Liu, X., Chen, T., Zhang, X., Huang, X., Niu, W., Lu, J., Zhou, K., and Liu, Y. (2021). Transaction-based classification and detection approach for ethereum smart contract. Information Processing & Management, 58(2):102462.

Mascarenhas, J. Z., Vieira, A. B., and Ziviani, A. (2018). Análise da rede de transações do ethereum. In Anais do I Workshop em Blockchain: Teoria, Tecnologias e Aplicações (WBlockchain-SBRC 2018), volume 1. SBC.

Motamed, A. P. and Bahrak, B. (2019). Quantitative analysis of cryptocurrencies transaction graph. Applied Network Science, 4(1):131.

Norvill, R., Pontiveros, B. B. F., State, R., Awan, I., and Cullen, A. (2017). Automated labeling of unknown contracts in ethereum. In 2017 26th International Conference on Computer Communication and Networks (ICCCN), pages 1–6. IEEE.

Oliveira, V. C., Valadares, J. A., Sousa, J. E. A., Bernardino, H. S., Vieira, A. B., Villela, S. M., and Gonçalves, G. D. (2021). Analyzing Transaction Conrfimation in Ethereum Using Machine Learning Techniques. SIGMETRICS Perform. Eval. Rev., 48(4):12–15.

Payette, J., Schwager, S., and Murphy, J. (2017). Characterizing the ethereum address space. https://pdfs.semanticscholar.org/db53/a0281ea25f0041ca4aa812be5c9013f33f26.pdf.

Peterson, L. E. (2009). K-nearest neighbor. Scholarpedia, 4(2):1883.

Rebello, G., Hu, Y., Thilakarathna, K., Batista, G., Seneviratne, A., and Duarte, O. C. M. B. (2020). Melhorando a acurácia da detecção de lavagem de dinheiro na rede bitcoin. In Anais do XXXVIII SBRC, pages 728–741. SBC.

Safavian, S. R. and Landgrebe, D. (1991). A survey of decision tree classifier methodology. IEEE transactions on systems, man, and cybernetics, 21(3):660–674.

Schär, F. (2020). Decentralized finance: On blockchain-and smart contract-based financial markets. Available at SSRN 3571335.

Singh, H. J. and Hafid, A. S. (2019). Prediction of transaction confirmation time in etheIn International Congress on Blockchain reum blockchain using machine learning. and Applications, pages 126–133. Springer.

Sousa, J. E. A., Oliveira, V., Valadares, J., Gonçalves, G. D., Villela, S. M., Bernardino Soares, H., and Vieira, A. B. (2020). An analysis of the fees and pending time correlation in ethereum. International Journal of Network Management, page e2113.

Sousa, J. E. A., Oliveira, V. C., Valadares, J. A., Vieira, A. B., Bernardino, H. S., Villela, S. M., and Gonçalves, G. D. (2021). Fighting Under-price DoS Attack in Ethereum with Machine Learning Techniques. SIGMETRICS Perform. Eval. Rev., 48(4):24–27.

Wang, M., Ichijo, H., and Xiao, B. (2020). Cryptocurrency address clustering and labeling. arXiv preprint arXiv:2003.13399.

Wood, G. (2014). Ethereum: A secure decentralised generalised transaction ledger. Ethereum project yellow paper, 151:1–32.

Wright, R. E. (1995). Reading and understanding multivariate statistics, chapter Logistic regression, page 217–244. American Psychological Association.

Wu, S. X., Wu, Z., Chen, S., Li, G., and Zhang, S. (2021). Community detection in blockchain social networks. Journal of Communications and Information Networks, 6(1):59–71.

Xu, G., Guo, B., Su, C., Zheng, X., Liang, K., Wong, D. S., and Wang, H. (2020). Am i eclipsed? a smart detector of eclipse attacks for ethereum. Computers & Security, 88:101604.
Publicado
16/08/2021
VALADARES, Júlia A.; OLIVEIRA, Vinicius C.; SOUSA, José Eduardo de Azevedo; BERNARDINO, Heder S.; VILLELA, Saulo Moraes; VIEIRA, Alex B.; GONÇALVES, Glauber Dias. Identificação de perfis de comportamento de usuários no Ethereum utilizando técnicas de aprendizado de máquina. In: WORKSHOP EM BLOCKCHAIN: TEORIA, TECNOLOGIAS E APLICAÇÕES (WBLOCKCHAIN), 4. , 2021, Uberlândia. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 60-73. DOI: https://doi.org/10.5753/wblockchain.2021.17129.