Construindo um Dataset Relacionado à Produção e Comercialização de Produtos da Hortifruticultura no Brasil
Resumo
Este artigo descreve o processo de construção de um dataset que reúne dados públicos relativos à produção e comercialização de produtos da horticultura e fruticultura no Brasil extraídos de diferentes fontes utilizando o processo de Web Scraping. Para compor a versão inicial do dataset, foram extraídos dados do Censo Demográfico de 2010, Sistema IBGE de Recuperação Automática (SIDRA) e da Companhia Nacional de Abastecimento (CONAB). Por fim, é apresentado uma descrição dos dados extraídos e de possíveis usos.
Referências
Diouf, Rabiyatou et al. (2019) Web scraping: state-of-the-art and areas of application. In: IEEE International Conference on Big Data (Big Data). IEEE. p. 6040-6042.
Medeiros, A. M. A., Gonçalves, E. C. (2023) Estudo Comparativo de Estratégias para o Pareamento de Nomes de Entidades na Língua Portuguesa. In: Anais XVIII ERBD.
Meira, C. A. A. et al. (2002) Análise da produção brasileira de frutas a partir do armazém de dados da fruticultura. Campinas, SP: Embrapa. 6 p. Disponível em: [link]. Acesso em: jun/23