Análise Experimental de Abordagens de Preservação de Privacidade para Testes Qui-quadrado em GWAS

  • Antonio A. Marreiras Neto Universidade Federal do Ceará (UFC)
  • Manuel Edvar B. Filho Universidade Federal do Ceará (UFC)
  • Javam C. Machado Universidade Federal do Ceará (UFC)

Resumo


Demanda por estudos de sequenciamento genético tem resultado na crescente produção e coleta de dados genômicos da população geral. Tais dados possuem um caráter altamente sensível pois, a partir destes é possível deduzir informações não apenas sobre o indivíduo em si, mas também seus familiares. Portanto, existe a necessidade por métodos de preservar a privacidade de participantes sem grandes perdas de utilidade. Neste artigo conduzimos uma análise experimental avaliando quatro diferentes abordagens para distribuir a estatística resultante do teste qui-quadrado para tabelas de contingência garantindo privacidade e utilidade com o intuito de determinar qual modelo diferencialmente privado melhor preserva a utilidade dos dados.

Palavras-chave: Privacidade e segurança dos dados, Gestão de dados especializada e específica do domínio

Referências

Dwork, C., McSherry, F., Nissim, K., and Smith, A. (2006). Calibrating noise to sensitivity in private data analysis. In Theory of Cryptography: Third Theory of Cryptography Conference, TCC 2006, New York, NY, USA, March 4-7, 2006. Proceedings 3, pages 265–284. Springer.

Han, Z., Liu, H., and Wu, Z. (2018). A differential privacy preserving framework with nash equilibrium in genome-wide association studies. In 2018 International Conference on Networking and Network Applications (NaNA), pages 91–96. IEEE.

Homer, N., Szelinger, S., Redman, M., Duggan, D., Tembe, W., Muehling, J., Pearson, J. V., Stephan, D. A., Nelson, S. F., and Craig, D. W. (2008). Resolving individuals contributing trace amounts of dna to highly complex mixtures using high-density snp genotyping microarrays. PLoS genetics, 4(8):e1000167.

Sei, Y. and Ohsuga, A. (2017). Privacy-preserving chi-squared testing for genome snp databases. In 2017 39th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC), pages 3884–3889. IEEE.

Wang, M., Ji, Z., Wang, S., Kim, J., Yang, H., Jiang, X., and Ohno-Machado, L. (2017). Mechanisms to protect the privacy of families when using the transmission disequilibrium test in genome-wide association studies. Bioinformatics, 33(23):3716–3725.

Wang, R., Li, Y. F., Wang, X., Tang, H., and Zhou, X. (2009). Learning your identity and disease from research papers: information leaks in genome wide association study. In Proceedings of the 16th ACM conference on Computer and communications security, pages 534–544.

Yamamoto, A. and Shibuya, T. (2021). More practical differentially private publication of key statistics in gwas. Bioinformatics Advances, 1(1):vbab004.
Publicado
25/09/2023
Como Citar

Selecione um Formato
MARREIRAS NETO, Antonio A.; B. FILHO, Manuel Edvar; MACHADO, Javam C.. Análise Experimental de Abordagens de Preservação de Privacidade para Testes Qui-quadrado em GWAS. In: WORKSHOP DE TRABALHOS DE ALUNOS DA GRADUAÇÃO (WTAG) - SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 38. , 2023, Belo Horizonte/MG. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 29-35. DOI: https://doi.org/10.5753/sbbd_estendido.2023.232752.