Aplicação de Top-k Reverso com Privacidade sobre os Dados Públicos de COVID-19 no Estado do Ceará
Resumo
Neste artigo propomos uma consulta top-k reverso diferencialmente privada. Nossa estratégia permite ao pesquisador obter dados menos frequentes de acordo com o seu critério de busca, com alta garantia de privacidade dos indivíduos que contribuíram com os dados pessoais no banco de dados original. Aplicamos a nossa estratégia sobre os dados públicos da COVID-19 do Estado do Ceará. Nossos resultados experimentais mostram que o resultado da consulta top-k proposta retorna alto grau de semelhança ao resultado de uma consulta top-k convencional.
Referências
Dwork, C. (2011). Differential privacy.Encycl. Cryptography and Security, pages 338–340.
Dwork, C., McSherry, F., Nissim, K., and Smith, A. (2006). Calibrating noise to sensiti-vity in private data analysis. In Theory of cryptography conference, pages 265–284.
Dwork, C., Roth, A., et al. (2014). The algorithmic foundations of differential privacy. Foundations and Trends in Theoretical Computer Science, 9(3-4):211–407.
McSherry, F. and Talwar, K. (2007). Mechanism design via differential privacy. In FOCS,volume 7, pages 94–103.
McSherry, F. D. (2009). Privacy integrated queries: an extensible platform for privacy-preserving data analysis. In ACM SIGMOD Int. Conf. on Management of data, pages19–30.
Narayanan, A. and Shmatikov, V. (2006). How to break anonymity of the netflix prize dataset. arXiv preprint cs/0610105. SUS(2020).
Boletim epidemiológico novo coronavírus(covid-19). https://bit.ly/32yFY7a. Acessado em 19-06-2020.
Vlachou, A., Doulkeridis, C., Kotidis, Y., and Nørv ̊ag, K. (2010). Reverse top-k queries. In International Conference on Data Engineering, pages 365–376.