Buskaki Empresas - Ferramenta para busca de dados abertos de empresas curitibanas
Resumo
A busca de dados de Pessoa Jurídica é um processo relevante para diversas entidades, seja para consultar uma fonte confiável de dados sobre potenciais parceiros de negócios, para estudos relacionados a desenvolvimento urbano ou para simplesmente coletar informações sobre determinada empresa. Neste contexto, este artigo apresenta uma ferramenta para busca de informações de empresas curitibanas que disponibilize outras formas de consulta além do CNPJ, baseada em Sistemas de Informação Geográfica (SIG) e cidades inteligentes. A ferramenta utiliza dados abertos e aplica algoritmos de comparação textual para aumentar a abrangência dos resultados da busca.
Referências
Chen, S.-M., Cheng, S.-H., and Lan, T.-C. (2016). A novel similarity measure between intuitionistic fuzzy sets based on the centroid points of transformed fuzzy numbers with applications to pattern recognition. Information Sciences, 343:15–40.
Cohen, W. W., Kautz, H., and McAllester, D. (2000). Hardening soft information sources. In Proceedings of the sixth ACM SIGKDD international conference on Knowledge discovery and data mining, pages 255–259.
Davis, C. A. and Fonseca, F. T. (2007). Assessing the certainty of locations produced by an address geocoding system. Geoinformatica, 11(1):103–129.
Hamming, R. W. (1950). Error detecting and error correction codes. The Bell System Technical Journal, XXIX(2):147–160.
Hernández, M. A. and Stolfo, S. J. (1995). The merge/purge problem for large databases. ACM Sigmod Record, 24(2):127–138.
Jordão, C. C. and Rosa, J. L. G. (2012). Metaphone-pt br: The phonetic importance on search and correction of textual information. In International Conference on Intelligent Text Processing and Computational Linguistics, pages 297–305. Springer.
Junior, E. S. B. (2020). Buskaki Empresas Ferramenta para busca de dados abertos de empresas curitibanas. Monografia (Engenharia da Computação), UTFPR.
Levenshtein, V. I. (1966). Binary codes capable of correcting deletions, insertions and reversals. Soviet Physics Doklady, 10(8):707–710. Doklady Akademii Nauk SSSR, V163 No4 845-848 1965.
Philips, L. (1990). Hanging on the metaphone. Computer Language, 7(12):39–43.
Philips, L. (2000). The double metaphone search algorithm. C/C++ users journal, 18(6):38–43.
Rahm, E. and Do, H. H. (2000). Data cleaning: Problems and current approaches. IEEE Data Eng. Bull., 23(4):3–13.
Ruberto, D. L. V. G. and Antoniazzi, R. L. (2017). Análise e comparação de algoritmos de similaridade e distância entre strings adaptados ao português brasileiro. In Anais da XIII Escola Regional de Banco de Dados. SBC.
Russell, R. and Odell, M. (1918). Soundex patent 01 261 167.
Russell, S. and Norvig, P. (2016). Artificial Intelligence: A Modern Approach. Pearson.
Singla, N. and Garg, D. (2012). String matching algorithms and their applicability in various applications. International journal of soft computing and engineering, 1(6):218– 222.