Uma abordagem com autoencoders variacionais condicionais para geração de materiais NLO com bandgap alvo

Resumo


Neste trabalho, é apresentado um pipeline de aprendizado de máquina para gerar vetores candidatos à materiais ópticos não lineares (NLO) com bandgap na faixa de 2–4 eV, essenciais para aplicações em computação quântica, como fontes de fótons emaranhados. Utilizando dados da base Materials Project, featurização automatizada e um modelo Random Forest para predição de bandgap (R2 > 0, 99), foi treinado um Autoencoder Variacional Condicional (CVAE-χ2) para gerar vetores sintéticos condicionados à faixa alvo. Dos vetores gerados, 65,1% apresentaram bandgap previsto entre 2 e 4 eV, demonstrando o potencial da abordagem para acelerar a descoberta de materiais NLO voltados a tecnologias quânticas.

Referências

Chen, C., Ye, W., Zuo, Y., Zheng, C., and Ong, S. P. (2019). Graph networks as a universal machine learning framework for molecules and crystals. Chemistry of Materials, 31(9):3564–3572.

Haq, S., Khalid, M., Braga, A. A. C., Alhokbany, N., and Chen, K. (2025). Design and evaluation of indacenothienothiophene based functional materials for second and third order nonlinear optics properties via dft approach. Scientific Reports, 15(1):13262.

Horton, M. K., Huck, P., Yang, R. X., Munro, J. M., Dwaraknath, S., Ganose, A. M., Kingsbury, R. S., Wen, M., Shen, J. X., Mathis, T. S., et al. (2025). Accelerated data-driven materials science with the materials project. Nature Materials, 24(10):1522–1532.

Kingma, D. P. and Welling, M. (2022). Auto-encoding variational bayes.

Matsunoshita, K., Yamaguchi, Y., Hamaie, M., Horibe, M., Tanibata, N., Takeda, H., Nakayama, M., Karasuyama, M., and Kobayashi, R. (2023). Optimization of force-field potential parameters using conditional variational autoencoder. Science and Technology of Advanced Materials: Methods, 3(1):2253713.

Sinha, S. and Dieng, A. B. (2022). Consistency regularization for variational auto-encoders.

Sohn, K., Lee, H., and Yan, X. (2015). Learning structured output representation using deep conditional generative models. In Cortes, C., Lawrence, N., Lee, D., Sugiyama, M., and Garnett, R., editors, Advances in Neural Information Processing Systems, volume 28. Curran Associates, Inc.

Ward, L., Dunn, A., Faghaninia, A., Zimmermann, N. E., Bajaj, S., Wang, Q., Montoya, J., Chen, J., Bystrom, K., Dylla, M., et al. (2018). Matminer: An open source toolkit for materials data mining. Computational Materials Science, 152:60–69.

Xie, C., Tikhonov, E., Chu, D., Wu, M., Kruglov, I., Pan, S., and Yang, Z. (2023). A prediction-driven database to enable rapid discovery of nonlinear optical materials. Science China Materials, 66(11):4473–4479.

Zuo, Y., Qin, M., Chen, C., Ye, W., Li, X., Luo, J., and Ong, S. P. (2021). Accelerating materials discovery with bayesian optimization and graph deep learning. Materials Today, 51:126–135.
Publicado
19/07/2026
LOPES, André; SANTOS, Carlos Eduardo de Souza; FREITAS, Rosiane de. Uma abordagem com autoencoders variacionais condicionais para geração de materiais NLO com bandgap alvo. In: SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO E COMUNICAÇÃO QUÂNTICAS (SBCCQ), 1. , 2026, Gramado/RS. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2026 . p. 164-175. DOI: https://doi.org/10.5753/sbccq.2026.22787.