A dependency-based study of medicine package inserts in Brazilian Portuguese


This paper reports on a study of medicine package inserts (MPIs) aimed at verifying to what extent texts addressing patients evidence different morphosyntactic patterns from those addressing HC professionals. To that end, we draw on a corpus of sentences manually retrieved and aligned, which were annotated for dependency syntax following the UD guidelines. Results point to clear distinctive patterns in both sets of MPIs, which are in line with guidelines on simplified language for Brazilian Portuguese.

Palavras-chave: treebank annotation, Brazilian Portuguese, medicine package inserts, text simplification


Aluísio, S.M., Specia, L., Pardo, T.A., Maziero, E.G., & Fortes, R.P. (2008a) Towards Brazilian Portuguese Automatic Text Simplification Systems. In: Proceedings of The Eight ACM Symposium on Document Engineering (DocEng 2008), pages 240-248, São Paulo, Brazil. https://doi.org/10.1145/1410140.1410191.

Aluísio, S.M., Specia, L., Pardo, T.A., Maziero, E.G., Caseli, H. & Fortes, R.P. (2008b) A Corpus Analysis of Simple Account Texts and the Proposal of Simplification Strategies: First Steps towards Text Simplification Systems In: Proceedings of The 26th ACM Symposium on Design of Communication (SIGDOC 2008), pages 15-22.

Aluísio, S.M., & Gasperin, C. (2010). Fostering Digital Inclusion and Accessibility: The PorSimples project for Simplification of Portuguese Texts. North American Chapter of the Association for Computational Linguistics.

Amorim, C. M. da S., Rocha, L. H. P. da, & Costa, M. J. (2015) A linguagem da bula: um estudo de estruturas linguísticas do gênero. Letrônica, 8(2), pages 467–479. https://doi.org/10.15448/1984-4301.2015.2.20401.

Angrosh, M., Nomoto, T., and Siddharthan, A. (2014) Lexico-syntactic text simplification and compression with typed dependencies. In Proceedings of the 25th International Conference on Computational Linguistics: Technical Papers (COLING 2014), Dublin, Ireland, pages 1996–2006..

ANVISA - Agência Nacional de Vigilância Sanitária. (2009a) Resolution RDC nº 47. Brasil: Agência Nacional de Vigilância Sanitária. Available at: [link]. Access on 29 June 2023.

ANVISA - Agência Nacional de Vigilância Sanitária. (2009b) Guia de Redação de Bula Gerência-geral de Medicamentos. GGMED. Brasília. Available at: [link]. Access on 29 June 2023.

Duran, M. S. (2021) Manual de anotação de PoS tags. Relatório Técnico, n. 434. NILC-ICMC/USP. Available at: [link]. Access on 29 June 2023.

Duran, M. S. (2022) Manual de Anotação de Relações de Dependência: Orientações para anotação de relações de dependência sintática em Língua Portuguesa, seguindo as diretrizes da abordagem Universal Dependencies (UD). Relatório Técnico do ICMC 440. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. Available at: [link]. Access on 25 June 2023.

Leal, S.; Duran, M.; Scarton, C.; Hartmann, N.; Aluísio, S. (2022) NILC-Metrix: assessing the complexity of written and spoken language in Brazilian Portuguese. CoRR abs/2201.03445. Available at: [link]. Access on 14 August 2023.

Pires, C., Vigário, M., & Cavaco, A. (2015) Readability of medicinal package leaflets: a systematic review. Revista De Saúde Pública, 49. Available at: https://doi.org/10.1590/S0034-8910.2015049005559. Access on 29 June 2023.

Pizzol, T. da S. D., Moraes, C. G., Arrais, P. S. D., Bertoldi, A. D., Ramos, L. R., Farias, M. R., Oliveira, M. A., Tavares, N. U. L., Luiza, V. L., & Mengue, S. S. (2019) Medicine package inserts from the users’ perspective: are they read and understood?. Revista Brasileira De Epidemiologia, 22, e190009. https://doi.org/10.1590/1980-549720190009.

Siddharthan, A. (2011) Text Simplification using Typed Dependencies: A Comparison of the Robustness of Different Generation Strategies. In Proceedings of the 13th European Workshop on Natural Language Generation, pages 2–11, Nancy, France. Association for Computational Linguistics. Available at: [link]. Access on 14 August 2023.
PAGANO, Adriana S.; CONEGLIAN, André V. Lopes; SILVA E OLIVEIRA, Lucas Emanuel. A dependency-based study of medicine package inserts in Brazilian Portuguese. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 14. , 2023, Belo Horizonte/MG. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 463-472. DOI: https://doi.org/10.5753/stil.2023.25487.