Short Paper: Descoberta automática de restrições de negação confiáveis

  • Eduardo Henrique Monteiro Pena UTFPR
  • Eduardo Cunha de Almeida UFPR

Resumo


Restrições de negação (RNs) expressam regras que identificam inconsistências em um banco de dados. Compô-las, no entanto, é uma tarefa onerosa. Nós propomos um método que descobre RNs com base em evidências extraídas das tuplas de um conjunto de dados. Nosso método descobre RNs confiáveis, mesmo que o conjunto de dados contenha erros. Nossos experimentos com dados reais mostram que é possível encontrar RNs que, com alta precisão e revocação, apontam para inconsistências dos dados de entrada.

Palavras-chave: Data Profiling, Data Quality.

Referências

Abedjan, Z., Golab, L., and Naumann, F. (2015). Profiling relational data: A survey. The VLDB Journal, 24(4):557–581. DOI: https://doi.org/10.1007/s00778-015-0389-y

Chu, X., Ilyas, I. F., and Papotti, P. (2013). Discovering denial constraints. Proc. VLDB Endow., 6(13):1498–1509. DOI: https://doi.org/10.14778/2536258.2536262

Killick, R., Fearnhead, P., and Eckley, I. A. (2012). Optimal detection of changepoints with a linear computational cost. Journal of the American Statistical Association, 107(500):1590–1598. DOI: https://doi.org/10.1080/01621459.2012.737745

Pena, E. H. M. and de Almeida, E. C. (2018). BFastDC: A bitwise algorithm for mining denial constraints. In DEXA 2018, pages 53–68. DOI: https://doi.org/10.1007/978-3-319-98809-2_4

Rekatsinas, T., Chu, X., Ilyas, I. F., and Ré, C. (2017). Holoclean: Holistic data repairs with probabilistic inference. PVLDB, 10(11):1190–1201. DOI: https://doi.org/10.14778/3137628.3137631
Publicado
07/10/2019
PENA, Eduardo Henrique Monteiro; DE ALMEIDA, Eduardo Cunha. Short Paper: Descoberta automática de restrições de negação confiáveis. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 34. , 2019, Fortaleza. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 187-192. ISSN 2763-8979. DOI: https://doi.org/10.5753/sbbd.2019.8821.