Pipeline automatizado para segmentação, rotulação e detecção de outliers em imagens de grãos de soja para geração de datasets
Resumo
Este artigo apresenta um pipeline computacional robusto e automatizado para o pré-processamento de imagens de grãos, realizando as etapas de segmentação, rotulação e detecção de outliers. A metodologia proposta é flexível, tratando imagens RGB e multiespectrais capturadas tanto em ambientes controlados quanto provenientes de fontes de dados externas, que introduzem variações de iluminação e fundo. O processo inicia com a otimização de canais de cor, como a conversão de RGB para CMYK para grãos de soja, seguida pela remoção de fundo e detecção de contornos para isolar cada grão individualmente. Uma contribuição central deste trabalho é um módulo de detecção de outliers que utiliza o Índice de Similaridade Estrutural (SSIM) para comparar cada grão segmentado a uma amostra de referência, separando automaticamente os grãos não conformes para revisão de um especialista. O resultado é um conjunto de dados limpo, padronizado e confiavelmente rotulado, pronto para ser utilizado em redes neurais. A implementação, baseada em bibliotecas de software livre como OpenCV e Scikit-image, demonstra que um pipeline de aquisição e tratamento bem estruturado atua como um multiplicador de qualidade, sendo fundamental para o sucesso de soluções baseadas em IA no agronegócio.
Palavras-chave:
Processamento de Imagens, Visão Computacional, Classificação de Grãos, Preparação de Dataset, Aprendizado de Máquina
Referências
SANTOS JÚNIOR, G. DE P. et al. Proposed Approach for Creating Soybean Grain Image Dataset. Anais do XXI Congresso Latino-Americano de Software Livre e Tecnologias Abertas (Latinoware 2024), p. 222–228, 27 nov. 2024. DOI: 10.5753/latinoware.2024.245770.
YANG, S. et al. High-throughput soybean seeds phenotyping with convolutional neural networks and transfer learning. Plant Methods, v. 17, n. 1, 5 maio 2021. DOI: 10.1186/s13007-021-00749-y.
ZHAO, G. et al. Real-time recognition system of soybean seed full-surface defects based on deep learning. Computers and Electronics in Agriculture, v. 187, p. 106230, ago. 2021. DOI: 10.1016/j.compag.2021.106230.
SONAWANE, S.; MOHANTY, B. K. An improved image processing scheme for automatic detection of harvested soybean seeds. Journal of Food Measurement and Characterization, v. 15, n. 6, p. 5607–5621, 30 ago. 2021. DOI: 10.1007/s11694-021-01124-0.
Villaverde, J. E., & Cleva, M. (2024). Volume estimation of unbroken soybeans samples using digital image processing techniques. Revista de Investigaciones Agropecuarias (RIA), 50(1), 8–13. DOI: 10.58149/7aj0-5549.
HANSEN, M. P.; MALCHOW, D. S. Overview of SWIR detectors, cameras, and applications. Thermosense XXX, 16 mar. 2008. DOI: 10.1117/12.777776
YANG, S. et al. High-throughput soybean seeds phenotyping with convolutional neural networks and transfer learning. Plant Methods, v. 17, n. 1, 5 maio 2021. DOI: 10.1186/s13007-021-00749-y.
ZHAO, G. et al. Real-time recognition system of soybean seed full-surface defects based on deep learning. Computers and Electronics in Agriculture, v. 187, p. 106230, ago. 2021. DOI: 10.1016/j.compag.2021.106230.
SONAWANE, S.; MOHANTY, B. K. An improved image processing scheme for automatic detection of harvested soybean seeds. Journal of Food Measurement and Characterization, v. 15, n. 6, p. 5607–5621, 30 ago. 2021. DOI: 10.1007/s11694-021-01124-0.
Villaverde, J. E., & Cleva, M. (2024). Volume estimation of unbroken soybeans samples using digital image processing techniques. Revista de Investigaciones Agropecuarias (RIA), 50(1), 8–13. DOI: 10.58149/7aj0-5549.
HANSEN, M. P.; MALCHOW, D. S. Overview of SWIR detectors, cameras, and applications. Thermosense XXX, 16 mar. 2008. DOI: 10.1117/12.777776
Publicado
22/10/2025
Como Citar
JÚNIOR, Gesmar de Paula Santo; CARDOSO, Alexandre; MARQUES, Leonardo Garcia; PERETTA, Igor S.; CARVALHO, Pedro; SILVA, Gabriel Henrique Camargo; PEREIRA, Bruno Sousa; ESPOSITO, Ivan Josef de Oliveira.
Pipeline automatizado para segmentação, rotulação e detecção de outliers em imagens de grãos de soja para geração de datasets. In: CONGRESSO LATINO-AMERICANO DE SOFTWARE LIVRE E TECNOLOGIAS ABERTAS (LATINOWARE), 22. , 2025, Foz do Iguaçu/PR.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 633-638.
DOI: https://doi.org/10.5753/latinoware.2025.16560.
