Construindo um Dataset Relacionado à Produção e Comercialização de Produtos da Hortifruticultura no Brasil

  • Guilherme Alan Mohr UFSM
  • Gustavo Pinto da Silva UFSM
  • Janaína Balk Brandão UFSM
  • Daniel Lichtnow UFSM

Resumo


Este artigo descreve o processo de construção de um dataset que reúne dados públicos relativos à produção e comercialização de produtos da horticultura e fruticultura no Brasil extraídos de diferentes fontes utilizando o processo de Web Scraping. Para compor a versão inicial do dataset, foram extraídos dados do Censo Demográfico de 2010, Sistema IBGE de Recuperação Automática (SIDRA) e da Companhia Nacional de Abastecimento (CONAB). Por fim, é apresentado uma descrição dos dados extraídos e de possíveis usos.

Referências

Brandão, J. B. et al. (2023) Mercados e canais de comercialização na região central do RS: fatores relevantes para os produtores de frutas e hortaliças. Ciência Rural, 53

Diouf, Rabiyatou et al. (2019) Web scraping: state-of-the-art and areas of application. In: IEEE International Conference on Big Data (Big Data). IEEE. p. 6040-6042.

Medeiros, A. M. A., Gonçalves, E. C. (2023) Estudo Comparativo de Estratégias para o Pareamento de Nomes de Entidades na Língua Portuguesa. In: Anais XVIII ERBD.

Meira, C. A. A. et al. (2002) Análise da produção brasileira de frutas a partir do armazém de dados da fruticultura. Campinas, SP: Embrapa. 6 p. Disponível em: [link]. Acesso em: jun/23
Publicado
10/04/2024
MOHR, Guilherme Alan; SILVA, Gustavo Pinto da; BRANDÃO, Janaína Balk; LICHTNOW, Daniel. Construindo um Dataset Relacionado à Produção e Comercialização de Produtos da Hortifruticultura no Brasil. In: ESCOLA REGIONAL DE BANCO DE DADOS (ERBD), 19. , 2024, Farroupilha/RS. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 162-165. ISSN 2595-413X. DOI: https://doi.org/10.5753/erbd.2024.238839.