Avaliação Empírica de Técnicas de Comparação Privada Aplicadas na Resolução de Entidades

  • Thiago Pereira da Nóbrega Universidade Estadual da Paraíba / Universidade Federal de Campina Grande
  • Carlos Eduardo Santos Pires Universidade Federal de Campina Grande
  • Tiago Brasileiro Araújo Universidade Federal de Campina Grande

Resumo


A Resolução de Entidades com Preservação de Privacidade (REPP) consiste em identificar entidades que representam o mesmo objeto no mundo real, mantendo a privacidade dos dados. Nesse contexto, diferentes técnicas de comparação de dados privados vêm sendo utilizadas como, por exemplo, Filtros de Bloom. Contudo, o Filtro de Bloom, não apresenta uma boa precisão quando dados numéricos ou datas são comparados. Este trabalho tem por objetivo avaliar empiricamente se a Criptografia Assimétrica Homomórfica (CAH) pode melhorar a precisão da comparação envolvendo dados privados não textuais. Os resultados apontam que o uso de CAH para comparar dados não textuais pode melhorar a precisão da REPP.
Palavras-chave: Resolução de Entidades com Preservação de Privacidade, Análise de precisão, Criptografia Assimétrica Homomórfica

Referências

Agarwal, S. and Trachtenberg, A. (2006). Approximating the number of differences between remote sets. In IEEE Information Theory Workshop, pages 217–221. IEEE.

Christen, P. (2012). Data Matching. Springer Berlin Heidelberg, Berlin, Heidelberg.

Parmar, P., B. Padhar, S., N. Patel, S., I. Bhatt, N., and H. Jhaveri, R. (2014). Survey of Various Homomorphic Encryption algorithms and Schemes. International Journal of Computer Applications, 91(8):26–32.

Pita, R., Pinto, C., Melo, P., Silva, M., Barreto, M., and Rasella, D. (2015). A Spark-based workflow for probabilistic record linkage of healthcare data. CEUR Workshop Proceedings, 1330:17–26.

Randall, S. M., Ferrante, A. M., Boyd, J. H., Bauer, J. K., and Semmens, J. B. (2014). Privacy-preserving record linkage on large real world datasets. Journal of Biomedical Informatics, 50:205–212.

Schmidlin, K., Clough-Gorr, K. M., Spoerri, A., and group, f. S. N. C. s. (2015). Privacy Preserving Probabilistic Record Linkage (P3RL): a novel method for linking existing health-related data and maintaining participant confidentiality. BMC Medical Research Methodology, 15(1):46.

Schnell, R., Bachteler, T., and Reiher, J. (2009). Privacy-preserving record linkage using Bloom filters. BMC Med Inform.Decis.Mak., 9:41.

Tran, K.-n., Vatsalan, D., and Christen, P. (2013). GeCo. Proceedings of the 22nd ACM international conference on Conference on information & knowledge management - CIKM ’13, pages 2473–2476.

Vatsalan, D., Christen, P., and Verykios, V. S. (2013). A taxonomy of privacy-preserving record linkage techniques. Information Systems, 38(6):946–969.
Publicado
04/10/2016
DA NÓBREGA, Thiago Pereira; PIRES, Carlos Eduardo Santos; ARAÚJO, Tiago Brasileiro. Avaliação Empírica de Técnicas de Comparação Privada Aplicadas na Resolução de Entidades. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 31. , 2016, Salvador/BA. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2016 . p. 121-126. ISSN 2763-8979. DOI: https://doi.org/10.5753/sbbd.2016.24315.