Usando LLMs para simplificar e representar documentos médicos
Resumo
Embora a medicina se destaque pela alta produtividade de artigos acadêmicos, a maior parte das pessoas enfrenta barreiras para compreender o conteúdo dessas publicações. A compreensão inadequada prejudica o acesso a informações cruciais e a adoção de práticas benéficas à saúde e ao bemestar. Diante desse cenário, a simplificação de textos emerge como ferramenta de grande relevância, ajudando a promover a disseminação eficaz do conhecimento em saúde. Nesse contexto, este artigo descreve experimentos que avaliam o uso de LLM para a simplificação de documentos médicos em português, gerando versões mais simples e acessíveis, além de extrair representações gráficas do seu conteúdo. Os resultados foram promissores, demonstrando a viabilidade da proposta em prover equidade no acesso a essa informação.
Palavras-chave:
LLM, simplificação textual, PLN, leiturabilidade
Referências
Barbosa, J. P., Conrado, A. L., and Belusci, H. T. (2023). Pressupostos para a atualização do indicador de alfabetismo funcional. Estudos em Avaliação Educacional, 34:1–23.
Finatto, M. J. B. (2025). Coleta de dados em compreensão de leitura de textos médicos: Letramento em saúde e acessibilidade textual e terminológica. Domínios De Lingu@gem, 19:e019015.
García-Barragán, Á., González Calatayud, A., Solarte-Pabón, O., Provencio, M., Menasalvas, E., and Robles, V. (2024). Gpt for medical entity recognition in spanish. Multimedia Tools and Applications.
González-Márquez, R., Schmidt, L., Schmidt, B. M., Berens, P., and Kobak, D. (2024). The landscape of biomedical research. Patterns (N Y), 5(6):100968.
INAF 2024. Alfabetismo no brasil. [link]. Accessed: 2025-05-05.
Jiang, P., Rayan, J., Dow, S. P., and Xia, H. (2023). Graphologue: Exploring large language model responses with interactive diagrams. In Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology, UIST ’23, New York, NY, USA. Association for Computing Machinery.
Leal, S. E., Duran, M. S., Scarton, C. E., Hartmann, N. S., and Aluísio, S. M. (2023). Nilc-metrix: assessing the complexity of written and spoken language in brazilian portuguese. Lang Resources & Evaluation.
Lima, A. L. D. (2016). Estudo especial sobre alfabetismo e competências socioemocionais na população adulta brasileira, chapter Tópico 1: Estudo especial sobre alfabetismo e competências socioemocionais na população adulta brasileira. Instituto Paulo Montenegro; Instituto Ayrton Senna; eduLab21.
Makhmutova, L., Salton, G., Perez-Tellez, F., and Ross, R. (2024). Automated medical text simplification for enhanced patient access. In Proceedings of the 17th International Joint Conference on Biomedical Engineering Systems and Technologies - Volume 2: HEALTHINF, pages 208–218. INSTICC, SciTePress.
Paes, A., Vianna, D., and Rodrigues, J. (2024). Modelos de linguagem. In Caseli, H. M. and Nunes, M. G. V., editors, Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português, book chapter 17. BPLN, 3 edition.
Teixeira, E. M., Guaraciaba, A. P. B., dos Santos, A. C. A., Guedes, B. L. d. S., Terra, C. M. D., Campos, I. B., de Souza, L. M., Amaral, P., Dias, A. M. N., Mendes, N. B. d. E. S., and Corrêa, C. R. (2021). O impacto das informações médicas obtidas através da internet na relação médico-paciente. Brazilian Journal of Health Review, 4(6):25225–25239.
Villar, G. S. and Finatto, M. J. B. (2024). Acessibilidade textual e terminológica: novos glossários sobre oncologia para a ferramenta medsimples. Mandinga: Revista de Estudos Linguísticos, 7:23–42.
Wang, L., Wang, M.-C., Zhang, Y.-R., Ma, J., Shao, H.-Y., and Chang, Z.-X. (2025a). Automated identification and representation of system requirements based on large language models and knowledge graphs. Applied Sciences, 15(7).
Wang, X., Liu, G., Zhu, B., He, J., Zheng, H., and Zhang, H. (2025b). Pre-trained language models and few-shot learning for medical entity extraction.
Zilio, L., Braga Paraguassu, L., Leiva Hercules, L. A., Ponomarenko, G., Berwanger, L., and Bocorny Finatto, M. J. (2020). A lexical simplification tool for promoting health literacy. In Gala, N. and Wilkens, R., editors, Proceedings of the 1st Workshop on Tools and Resources to Empower People with REAding DIfficulties (READI), pages 70–76, Marseille, France. European Language Resources Association.
Zilio, L., Finatto, M. J. B., Vieira, R., and Quaresma, P. (2023). Uma abordagem de processamento de linguagem natural para avaliação de complexidade em literatura médica do século xviii. Domínios de Lingu@gem, 17:e1753.
Finatto, M. J. B. (2025). Coleta de dados em compreensão de leitura de textos médicos: Letramento em saúde e acessibilidade textual e terminológica. Domínios De Lingu@gem, 19:e019015.
García-Barragán, Á., González Calatayud, A., Solarte-Pabón, O., Provencio, M., Menasalvas, E., and Robles, V. (2024). Gpt for medical entity recognition in spanish. Multimedia Tools and Applications.
González-Márquez, R., Schmidt, L., Schmidt, B. M., Berens, P., and Kobak, D. (2024). The landscape of biomedical research. Patterns (N Y), 5(6):100968.
INAF 2024. Alfabetismo no brasil. [link]. Accessed: 2025-05-05.
Jiang, P., Rayan, J., Dow, S. P., and Xia, H. (2023). Graphologue: Exploring large language model responses with interactive diagrams. In Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology, UIST ’23, New York, NY, USA. Association for Computing Machinery.
Leal, S. E., Duran, M. S., Scarton, C. E., Hartmann, N. S., and Aluísio, S. M. (2023). Nilc-metrix: assessing the complexity of written and spoken language in brazilian portuguese. Lang Resources & Evaluation.
Lima, A. L. D. (2016). Estudo especial sobre alfabetismo e competências socioemocionais na população adulta brasileira, chapter Tópico 1: Estudo especial sobre alfabetismo e competências socioemocionais na população adulta brasileira. Instituto Paulo Montenegro; Instituto Ayrton Senna; eduLab21.
Makhmutova, L., Salton, G., Perez-Tellez, F., and Ross, R. (2024). Automated medical text simplification for enhanced patient access. In Proceedings of the 17th International Joint Conference on Biomedical Engineering Systems and Technologies - Volume 2: HEALTHINF, pages 208–218. INSTICC, SciTePress.
Paes, A., Vianna, D., and Rodrigues, J. (2024). Modelos de linguagem. In Caseli, H. M. and Nunes, M. G. V., editors, Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português, book chapter 17. BPLN, 3 edition.
Teixeira, E. M., Guaraciaba, A. P. B., dos Santos, A. C. A., Guedes, B. L. d. S., Terra, C. M. D., Campos, I. B., de Souza, L. M., Amaral, P., Dias, A. M. N., Mendes, N. B. d. E. S., and Corrêa, C. R. (2021). O impacto das informações médicas obtidas através da internet na relação médico-paciente. Brazilian Journal of Health Review, 4(6):25225–25239.
Villar, G. S. and Finatto, M. J. B. (2024). Acessibilidade textual e terminológica: novos glossários sobre oncologia para a ferramenta medsimples. Mandinga: Revista de Estudos Linguísticos, 7:23–42.
Wang, L., Wang, M.-C., Zhang, Y.-R., Ma, J., Shao, H.-Y., and Chang, Z.-X. (2025a). Automated identification and representation of system requirements based on large language models and knowledge graphs. Applied Sciences, 15(7).
Wang, X., Liu, G., Zhu, B., He, J., Zheng, H., and Zhang, H. (2025b). Pre-trained language models and few-shot learning for medical entity extraction.
Zilio, L., Braga Paraguassu, L., Leiva Hercules, L. A., Ponomarenko, G., Berwanger, L., and Bocorny Finatto, M. J. (2020). A lexical simplification tool for promoting health literacy. In Gala, N. and Wilkens, R., editors, Proceedings of the 1st Workshop on Tools and Resources to Empower People with REAding DIfficulties (READI), pages 70–76, Marseille, France. European Language Resources Association.
Zilio, L., Finatto, M. J. B., Vieira, R., and Quaresma, P. (2023). Uma abordagem de processamento de linguagem natural para avaliação de complexidade em literatura médica do século xviii. Domínios de Lingu@gem, 17:e1753.
Publicado
29/09/2025
Como Citar
WIVES, Leandro Krug; FINATTO, Maria José Bocorny.
Usando LLMs para simplificar e representar documentos médicos. In: LLMS, ANÁLISE DE GRAFOS E ONTOLOGIAS (LAGO) - SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 40. , 2025, Fortaleza/CE.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 415-425.
DOI: https://doi.org/10.5753/sbbd_estendido.2025.247730.
