Análise Experimental de Abordagens de Preservação de Privacidade para Testes Qui-quadrado em GWAS
Resumo
Demanda por estudos de sequenciamento genético tem resultado na crescente produção e coleta de dados genômicos da população geral. Tais dados possuem um caráter altamente sensível pois, a partir destes é possível deduzir informações não apenas sobre o indivíduo em si, mas também seus familiares. Portanto, existe a necessidade por métodos de preservar a privacidade de participantes sem grandes perdas de utilidade. Neste artigo conduzimos uma análise experimental avaliando quatro diferentes abordagens para distribuir a estatística resultante do teste qui-quadrado para tabelas de contingência garantindo privacidade e utilidade com o intuito de determinar qual modelo diferencialmente privado melhor preserva a utilidade dos dados.
Referências
Han, Z., Liu, H., and Wu, Z. (2018). A differential privacy preserving framework with nash equilibrium in genome-wide association studies. In 2018 International Conference on Networking and Network Applications (NaNA), pages 91–96. IEEE.
Homer, N., Szelinger, S., Redman, M., Duggan, D., Tembe, W., Muehling, J., Pearson, J. V., Stephan, D. A., Nelson, S. F., and Craig, D. W. (2008). Resolving individuals contributing trace amounts of dna to highly complex mixtures using high-density snp genotyping microarrays. PLoS genetics, 4(8):e1000167.
Sei, Y. and Ohsuga, A. (2017). Privacy-preserving chi-squared testing for genome snp databases. In 2017 39th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC), pages 3884–3889. IEEE.
Wang, M., Ji, Z., Wang, S., Kim, J., Yang, H., Jiang, X., and Ohno-Machado, L. (2017). Mechanisms to protect the privacy of families when using the transmission disequilibrium test in genome-wide association studies. Bioinformatics, 33(23):3716–3725.
Wang, R., Li, Y. F., Wang, X., Tang, H., and Zhou, X. (2009). Learning your identity and disease from research papers: information leaks in genome wide association study. In Proceedings of the 16th ACM conference on Computer and communications security, pages 534–544.
Yamamoto, A. and Shibuya, T. (2021). More practical differentially private publication of key statistics in gwas. Bioinformatics Advances, 1(1):vbab004.