MarIA - DeepSeek: Uma Proposta de Assistente por Modelo Amplo de Linguagem para Agentes Comunitários de Saúde
Resumo
Os primeiros 1.000 dias de vida, que compreendem a gestação e os dois primeiros anos da criança, representam um período crítico para prevenir doenças crônicas não transmissíveis (DCNT). No entanto, Agentes Comunitários de Saúde (ACS) enfrentam dificuldades para acessar e aplicar recomendações baseadas em evidências científicas durante esse período. Este trabalho apresenta o MarIA DeepSeek, uma assistente virtual baseada em modelos amplos de linguagem (LLMs), que integra técnicas de Prompt Chaining, Retrieval-Augmented Generation (RAG) e curadoria de documentos especializados para oferecer orientações personalizadas e cientificamente embasadas aos ACS. Os experimentos demonstraram que a ferramenta aprimora a precisão, a clareza e a acessibilidade das recomendações, superando modelos generalistas como GPT-4.0 e Gemini, e contribuindo para uma tomada de decisão mais eficaz na atenção primária à saúde.Referências
Alves-Costa, S., da S. Pereira, S. M., Haddad, A. E., Ribeiro, C. C. C., and Oliveira, A. E. F. (2024). The First Thousand Days of Life: A DOHaD Perspective to Dentistry. EDUFMA, 1st edition.
Araújo, S. M. P., Nascimento, G. G., Ladeira, L. L. C., Alves-Costa, S., Saraiva, M. C., Alves, C. M. C., Thomaz, E. B. A. F., and Ribeiro, C. C. C. (2024). Chronic oral disease burden at the first 1000 days: Intergenerational risk factors, brisa cohort. Oral Diseases, 30(8):5388–5396.
Bonifácio, L. P., Marques, J. M., and Vieira, E. M. (2019). Assessment of the knowledge of brazilian community health workers regarding prenatal care. Primary Health Care Research & Development, 20:e21.
Cardenas, L., Parajes, K., Zhu, M., and Zhai, S. (2024). Autohealth: Advanced llm-empowered wearable personalized medical butler for parkinson’s disease management. In 2024 IEEE 14th Annual Computing and Communication Workshop and Conference (CCWC), pages 0375–0379. IEEE.
Cursino, J. R. V., Calista, A. A., Nascimento, J. E. d. M., and Campos Filho, A. S. d. (2020). Uma revisão integrativa sobre o uso de chatbot para subsidiar o ensino na área da saúde. Revista de Saúde Digital e Tecnologias Educacionais.
da Silva, A. A. M., Simões, V. M. F., Barbieri, M. A., Cardoso, V. C., Alves, C. M. C., Thomaz, E. B. A. F., de Sousa Queiroz, R. C., Cavalli, R. C., Batista, R. F. L., and Bettiol, H. (2014). A protocol to identify non-classical risk factors for preterm births: the brazilian ribeirão preto and são luís prenatal cohort (brisa). Reproductive Health, 11:1–9.
Devlin, J. (2018). Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805.
Diniz, J. O., Dias Jr, D. A., da Cruz, L. B., Marques, R. C., Gomes Jr, D. L., Cortês, O. A., de Carvalho Filho, A. O., and Quintanilha, D. B. (2024). Efficientensemble: Diagnóstico de câncer de mama em imagens de ultrassom utilizando processamento de imagens e ensemble de efficientnets. In Simpósio Brasileiro de Computação Aplicada à Saúde (SBCAS), pages 202–213. SBC.
Diniz, J. O., Ferreira, J. L., da Silva, G. L., Quintanilha, D. B., Silva, A. C., and Paiva, A. (2021). Segmentação de coração em tomografias computadorizadas utilizando atlas probabilístico e redes neurais convolucionais. In Simpósio Brasileiro de Computação Aplicada à Saúde (SBCAS), pages 83–94. SBC.
DOHaD-SAP, S., de la Salud, O., et al. (2020). Developmental origins of health and disease concept: The environment in the first 1000 days of life and its association with noncommunicable diseases. Archivos argentinos de pediatria, 118(4):S118–S129.
Gao, Y., Xiong, Y., Gao, X., Jia, K., Pan, J., Bi, Y., Dai, Y., Sun, J., Wang, H., and Wang, H. (2023). Retrieval-augmented generation for large language models: A survey. arXiv preprint arXiv:2312.10997, 2:1.
Guo, D., Yang, D., Zhang, H., Song, J., Zhang, R., Xu, R., Zhu, Q., Ma, S., Wang, P., Bi, X., et al. (2025). Deepseek-r1: Incentivizing reasoning capability in llms via reinforcement learning. arXiv preprint arXiv:2501.12948.
Heston, T. F. and Khun, C. (2023). Prompt engineering in medical education. International Medical Education, 2(3):198–205.
Kohavi, R., Longbotham, R., Sommerfield, D., and Henne, R. M. (2009). Controlled experiments on the web: survey and practical guide. Data mining and knowledge discovery, 18:140–181.
Majbauddin, A., Tanimura, C., Aoto, H., Otani, S., Parrenas, M. C., Kobayashi, N., Morita, T., Inoue, K., Masumoto, T., and Kurozawa, Y. (2019). Association between dental caries indicators and serum glycated hemoglobin-levels among patients with type 2 diabetes mellitus. Journal of oral science, 61(2):335–342.
Manning, C. D. and Schütze, H. (2008). Foundations of Statistical Natural Language Processing. MIT Press, Cambridge, MA.
Mikhail, D., Farah, A., Milad, J., Nassrallah, W., Mihalache, A., Milad, D., Antaki, F., Balas, M., Popovic, M. M., Feo, A., et al. (2025). Performance of deepseek-r1 in ophthalmology: An evaluation of clinical decision-making and cost-effectiveness. medRxiv, pages 2025–02.
Muniz, A. K. O. A., Ribeiro, C. C. C., Vianna, E. O., Serra, H. C. O. A., Nascimento, J. X. P. T., Cardoso, V. C., Barbieri, M. A., Da Silva, A. A. M., and Bettiol, H. (2022). Factors associated with allergy traits around the 2nd year of life: a brazilian cohort study. BMC pediatrics, 22(1):703.
Nascimento, J. X. P. T., Ribeiro, C. C. C., Batista, R. F. L., de Britto Alves, M. T. S. S., Simões, V. M. F., Padilha, L. L., Cardoso, V. C., Vianna, E. O., Bettiol, H., Barbieri, M. A., et al. (2017). The first 1000 days of life factors associated with “childhood asthma symptoms”: Brisa cohort, brazil. Scientific reports, 7(1):16028.
Passinato, E. B., Rios, W. S., and Galvão Filho, A. R. (2024). Integração de modelos de linguagem e rag na criação de chatbots oftalmológicos. In Simpósio Brasileiro de Computação Aplicada à Saúde (SBCAS), pages 354–365. SBC.
Rodrigues, R. R., dos Santos Vasconcellos, A., and de Campos Filho, A. S. (2024). Desenvolvimento de um chatbot na atenção primária à saúde. Journal of Health Informatics, 16(Especial).
Roy, S., Goswami, M., Nargund, N., Mohanty, S., and Pattnaik, P. K. (2025). Conversational text extraction with large language models using retrieval-augmented systems. arXiv preprint arXiv:2501.09801.
Sakai, K., Uehara, Y., and Kashihara, S. (2024). Implementation and evaluation of llm-based conversational systems on a low-cost device. In 2024 IEEE Global Humanitarian Technology Conference (GHTC), pages 392–399. IEEE.
Souza, F., Nogueira, R., and Lotufo, R. (2020). BERTimbau: pretrained BERT models for Brazilian Portuguese. In 9th Brazilian Conference on Intelligent Systems, BRACIS, Rio Grande do Sul, Brazil, October 20-23.
Wei, J., Wang, X., Schuurmans, D., Bosma, M., Xia, F., Chi, E., Le, Q. V., Zhou, D., et al. (2022). Chain-of-thought prompting elicits reasoning in large language models. Advances in neural information processing systems, 35:24824–24837.
Araújo, S. M. P., Nascimento, G. G., Ladeira, L. L. C., Alves-Costa, S., Saraiva, M. C., Alves, C. M. C., Thomaz, E. B. A. F., and Ribeiro, C. C. C. (2024). Chronic oral disease burden at the first 1000 days: Intergenerational risk factors, brisa cohort. Oral Diseases, 30(8):5388–5396.
Bonifácio, L. P., Marques, J. M., and Vieira, E. M. (2019). Assessment of the knowledge of brazilian community health workers regarding prenatal care. Primary Health Care Research & Development, 20:e21.
Cardenas, L., Parajes, K., Zhu, M., and Zhai, S. (2024). Autohealth: Advanced llm-empowered wearable personalized medical butler for parkinson’s disease management. In 2024 IEEE 14th Annual Computing and Communication Workshop and Conference (CCWC), pages 0375–0379. IEEE.
Cursino, J. R. V., Calista, A. A., Nascimento, J. E. d. M., and Campos Filho, A. S. d. (2020). Uma revisão integrativa sobre o uso de chatbot para subsidiar o ensino na área da saúde. Revista de Saúde Digital e Tecnologias Educacionais.
da Silva, A. A. M., Simões, V. M. F., Barbieri, M. A., Cardoso, V. C., Alves, C. M. C., Thomaz, E. B. A. F., de Sousa Queiroz, R. C., Cavalli, R. C., Batista, R. F. L., and Bettiol, H. (2014). A protocol to identify non-classical risk factors for preterm births: the brazilian ribeirão preto and são luís prenatal cohort (brisa). Reproductive Health, 11:1–9.
Devlin, J. (2018). Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805.
Diniz, J. O., Dias Jr, D. A., da Cruz, L. B., Marques, R. C., Gomes Jr, D. L., Cortês, O. A., de Carvalho Filho, A. O., and Quintanilha, D. B. (2024). Efficientensemble: Diagnóstico de câncer de mama em imagens de ultrassom utilizando processamento de imagens e ensemble de efficientnets. In Simpósio Brasileiro de Computação Aplicada à Saúde (SBCAS), pages 202–213. SBC.
Diniz, J. O., Ferreira, J. L., da Silva, G. L., Quintanilha, D. B., Silva, A. C., and Paiva, A. (2021). Segmentação de coração em tomografias computadorizadas utilizando atlas probabilístico e redes neurais convolucionais. In Simpósio Brasileiro de Computação Aplicada à Saúde (SBCAS), pages 83–94. SBC.
DOHaD-SAP, S., de la Salud, O., et al. (2020). Developmental origins of health and disease concept: The environment in the first 1000 days of life and its association with noncommunicable diseases. Archivos argentinos de pediatria, 118(4):S118–S129.
Gao, Y., Xiong, Y., Gao, X., Jia, K., Pan, J., Bi, Y., Dai, Y., Sun, J., Wang, H., and Wang, H. (2023). Retrieval-augmented generation for large language models: A survey. arXiv preprint arXiv:2312.10997, 2:1.
Guo, D., Yang, D., Zhang, H., Song, J., Zhang, R., Xu, R., Zhu, Q., Ma, S., Wang, P., Bi, X., et al. (2025). Deepseek-r1: Incentivizing reasoning capability in llms via reinforcement learning. arXiv preprint arXiv:2501.12948.
Heston, T. F. and Khun, C. (2023). Prompt engineering in medical education. International Medical Education, 2(3):198–205.
Kohavi, R., Longbotham, R., Sommerfield, D., and Henne, R. M. (2009). Controlled experiments on the web: survey and practical guide. Data mining and knowledge discovery, 18:140–181.
Majbauddin, A., Tanimura, C., Aoto, H., Otani, S., Parrenas, M. C., Kobayashi, N., Morita, T., Inoue, K., Masumoto, T., and Kurozawa, Y. (2019). Association between dental caries indicators and serum glycated hemoglobin-levels among patients with type 2 diabetes mellitus. Journal of oral science, 61(2):335–342.
Manning, C. D. and Schütze, H. (2008). Foundations of Statistical Natural Language Processing. MIT Press, Cambridge, MA.
Mikhail, D., Farah, A., Milad, J., Nassrallah, W., Mihalache, A., Milad, D., Antaki, F., Balas, M., Popovic, M. M., Feo, A., et al. (2025). Performance of deepseek-r1 in ophthalmology: An evaluation of clinical decision-making and cost-effectiveness. medRxiv, pages 2025–02.
Muniz, A. K. O. A., Ribeiro, C. C. C., Vianna, E. O., Serra, H. C. O. A., Nascimento, J. X. P. T., Cardoso, V. C., Barbieri, M. A., Da Silva, A. A. M., and Bettiol, H. (2022). Factors associated with allergy traits around the 2nd year of life: a brazilian cohort study. BMC pediatrics, 22(1):703.
Nascimento, J. X. P. T., Ribeiro, C. C. C., Batista, R. F. L., de Britto Alves, M. T. S. S., Simões, V. M. F., Padilha, L. L., Cardoso, V. C., Vianna, E. O., Bettiol, H., Barbieri, M. A., et al. (2017). The first 1000 days of life factors associated with “childhood asthma symptoms”: Brisa cohort, brazil. Scientific reports, 7(1):16028.
Passinato, E. B., Rios, W. S., and Galvão Filho, A. R. (2024). Integração de modelos de linguagem e rag na criação de chatbots oftalmológicos. In Simpósio Brasileiro de Computação Aplicada à Saúde (SBCAS), pages 354–365. SBC.
Rodrigues, R. R., dos Santos Vasconcellos, A., and de Campos Filho, A. S. (2024). Desenvolvimento de um chatbot na atenção primária à saúde. Journal of Health Informatics, 16(Especial).
Roy, S., Goswami, M., Nargund, N., Mohanty, S., and Pattnaik, P. K. (2025). Conversational text extraction with large language models using retrieval-augmented systems. arXiv preprint arXiv:2501.09801.
Sakai, K., Uehara, Y., and Kashihara, S. (2024). Implementation and evaluation of llm-based conversational systems on a low-cost device. In 2024 IEEE Global Humanitarian Technology Conference (GHTC), pages 392–399. IEEE.
Souza, F., Nogueira, R., and Lotufo, R. (2020). BERTimbau: pretrained BERT models for Brazilian Portuguese. In 9th Brazilian Conference on Intelligent Systems, BRACIS, Rio Grande do Sul, Brazil, October 20-23.
Wei, J., Wang, X., Schuurmans, D., Bosma, M., Xia, F., Chi, E., Le, Q. V., Zhou, D., et al. (2022). Chain-of-thought prompting elicits reasoning in large language models. Advances in neural information processing systems, 35:24824–24837.
Publicado
09/06/2025
Como Citar
FRANÇA, Pedro A. F. et al.
MarIA - DeepSeek: Uma Proposta de Assistente por Modelo Amplo de Linguagem para Agentes Comunitários de Saúde. In: SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO APLICADA À SAÚDE (SBCAS), 25. , 2025, Porto Alegre/RS.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 305-316.
ISSN 2763-8952.
DOI: https://doi.org/10.5753/sbcas.2025.7088.