Classificação de Linguagem Simples: uma abordagem baseada em Leiturabilidade e Legibilidade

  • Victor I. S. Silveira UFOPA
  • Pedro H. C. Menezes UFOPA
  • Marcelino S. Silva UFOPA
  • Fabrício A. Carmo UEMA
  • Fábio M. F. Lobato UFOPA

Resumo


São inegáveis os esforços das agências de governo em adotar a linguagem simples. Não obstante, ainda é evidente a necessidade de ampliar esses esforços para outras esferas, uma vez que a linguagem simples é fundamental para permitir o entendimento claro da informação, promovendo a inclusão de cidadãos que não possuem o letramento suficiente. Na literatura, há diversos trabalhos dedicados à mensuração da linguagem simples e da complexidade textual, alguns utilizam métodos automáticos utilizando aprendizado de máquina, os quais carecem de explicabilidade sobre como é possível melhorar no texto; outros utilizam métodos semi-automáticos baseados na avaliação humana, o que impede a adoção do método para grandes conjuntos de dados. No presente trabalho, investigou-se o uso de métodos analíticos para classificação de Linguagem Simples à luz da Leiturabilidade e Legibilidade. Os resultados obtidos permitem concluir que é possível utilizar medidas de Leiturabilidade e Legibilidade para classificar a Linguagem Simples. O trabalho contribui para o estado da arte por meio do estudo de seis métricas de complexidade textual para classificação de Linguagem Simples. Para o estado da prática, o trabalho contribui com insumos para a construção de sistemas de classificação de Linguagem Simples, indicando aspectos de melhoria ao usuário final.

Referências

Almeida do Carmo, F., Figueira da Silva Junior, J. L., Geraldeli Rossi, R., and França Lobato, F. M. (2023). Text representations for lyric-based identification of musical subgenres. IEEE Latin America Transactions, 21(6):737–744.

Aló, C. C. and Leite, J. d. P. (2009). Uma abordagem para transparência em processos organizacionais utilizando aspectos. Rio de Janeiro.

Bailin, A. and Grafstein, A. (2016). Readability: Text and context. Springer.

Cappelli, C., Nunes, V., and Oliveira, R. (2021). Transparência e transformaçao digital: O uso da técnica da linguagem simples. Sociedade Brasileira de Computação.

Cappelli, C., Oliveira, R., and Nunes, V. (2023). Linguagem simples como pilar da transparência. Humanidades & Inovação, 10(9):32–45.

Dressler, N., Souza, A. C., Costa, L. M., Souza, F. C., and Mantovani, R. (2023). Classificação de textos escolares com aprendizado de máquina. Anais do Computer on the Beach, 14:432–438.

Fung, A., Graham, M., and Weil, D. (2007). Full disclosure: The perils and promise of transparency. Cambridge University Press.

Hansen-Schirra, S. and Maass, C. (2020). Easy language, plain language, easy language plus: perspectives on comprehensibility and stigmatisation. Easy language research: text and user perspectives, 2:17.

Hildenbrand, G. M., Perrault, E. K., and Keller, P. E. (2020). Evaluating a health literacy communication training for medical students: Using plain language. Journal of health communication, 25(8):624–631.

Kamandhari, H. H. (2020). The definitions and the measurement of legibility and readability in instructional text design: an integrated literature review. Information, Medium and Society, 18(2):1.

Lyu, Q., Tan, J., Zapadka, M. E., Ponnatapura, J., Niu, C., Myers, K. J., Wang, G., and Whitlow, C. T. (2023). Translating radiology reports into plain language using chatgpt and gpt-4 with prompt learning: results, limitations, and potential. Visual Computing for Industry, Biomedicine, and Art, 6(1):9.

Maass, C. (2020). Easy language–plain language–easy language plus: Balancing comprehensibility and acceptability. Frank & Timme.

Martínez-Plumed, F., Contreras-Ochando, L., Ferri, C., Hernández-Orallo, J., Kull, M., Lachiche, N., Ramírez-Quintana, M. J., and Flach, P. (2019). Crisp-dm twenty years later: From data mining processes to data science trajectories. IEEE transactions on knowledge and data engineering, 33(8):3048–3061.

Moreno, G. C. d. L., de Souza, M. P., Hein, N., and Hein, A. K. (2022). Alt: um software para análise de legibilidade de textos em língua portuguesa. arXiv preprint.

Moutinho, M. and Picanço, G. (2022). Índices de leiturabilidade e os textos didáticos: uma questão a ser discutida. Língu@ Nostr@, 10(2):124–147.

Murilo Gazzola, Sidney Evaldo Leal, S. M. A. (2019). Predição da complexidade textual de recursos educacionais abertos em português. In Proceedings of the Brazilian Symposium in Information and Human Language Technology.

Nadali, A., Kakhky, E. N., and Nosratabadi, H. E. (2011). Evaluating the success level of data mining projects based on crisp-dm methodology by a fuzzy expert system. In 2011 3rd International Conference on Electronics Computer Technology.

Nord, A. (2018). Plain language and professional writing: A research overview.

Petelin, R. (2010). Considering plain language: issues and initiatives. Corporate Communications: An International Journal, 15(2):205–216.

Rashid, D. A. and Rasheed, D. R. (2024). Logistics service quality and product satisfaction in e-commerce. SAGE Open, 14(1):21582440231224250.

Rodrigues, A. P., Marques, G. M., Rodrigues, L. B., Mattos, P. A. A., Nunes, V. T., Cappelli, C., Oliveira, R., and de Moraes, R. M. (2023). Uma proposta de automação para o índice nacional de avaliação de linguagem simples em serviços públicos. In Anais do XI Workshop de Computação Aplicada em Governo Eletrônico. SBC.

Schäfer, F., Zeiselmair, C., Becker, J., and Otten, H. (2018). Synthesizing crisp-dm and quality management: A data mining approach for production processes. In 2018 IEEE International Conference on Technology Management, Operations and Decisions.

Srisunakrua, T. and Chumworatayee, T. (2019). Readability of reading passages in english textbooks and the thai national education english test: A comparative study. Arab World English Journal (AWEJ) Volume, 10.

Tekfi, C. (1987). Readability formulas: An overview. Journal of documentation.

Wirth, R. and Hipp, J. (2000). Crisp-dm: Towards a standard process model for data mining. In Proceedings of the 4th international conference on the practical applications of knowledge discovery and data mining, volume 1, pages 29–39. Manchester.
Publicado
21/07/2024
SILVEIRA, Victor I. S.; MENEZES, Pedro H. C.; SILVA, Marcelino S.; CARMO, Fabrício A.; LOBATO, Fábio M. F.. Classificação de Linguagem Simples: uma abordagem baseada em Leiturabilidade e Legibilidade. In: WORKSHOP DE COMPUTAÇÃO APLICADA EM GOVERNO ELETRÔNICO (WCGE), 12. , 2024, Brasília/DF. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 37-48. ISSN 2763-8723. DOI: https://doi.org/10.5753/wcge.2024.2375.