Técnicas de sumarização de textos jurídicos para suporte à classificação de documentos de decisões judiciais

Resumo


Acórdãos são documentos de texto que contêm decisões judiciais referentes a um certo processo jurídico. No contexto de um Tribunal de Justiça, os acórdãos possuem uma classificação por temas bem definida, que auxilia juristas na organização e agilidade de suas tarefas diárias. Devido ao alto volume diário de novos acórdãos produzidos, faz-se necessária a adoção de técnicas capazes de automatizar a classificação temática de um novo acórdão. Algoritmos de aprendizado de máquina supervisionado, para tarefas de classificação, não têm se saído bem diante de textos extensos, em português, com a linguagem usada no domínio jurídico. Este trabalho propõe a adoção de sumários de acórdãos para classificação temática. A hipótese levantada é que textos mais curtos, sumarizados, podem melhorar a classificação de tais documentos nos temas corretos. Este é um trabalho em andamento, que pretende desenvolver uma nova abordagem de classificação a partir de sumários. Resultados parciais indicam que algoritmos de sumarização melhoram a classificação de acórdãos.

Palavras-chave: Sumarização, Textos legais, Classificação judicial, Sumários extrativos

Referências

Chen, H., Wu, L., Chen, J., Lu, W., and Ding, J. (2022). A comparative study of automated legal text classification using random forests and deep learning. Inf. Process. Manage., 59(2). https://doi.org/10.1016/j.ipm.2021.102798

Du, Y., Ma, T., Wu, L., Xu, F., Zhang, X., and Ji, S. (2021). Constructing contrastive samples via summarization for text classification with limited annotations. In EMNLP. https://doi.org/10.48550/arXiv.2104.05094

El-Kassas, W. S., Salama, C. R., Rafea, A. A., and Mohamed, H. K. (2021). Automatic text summarization: A comprehensive survey. Expert Systems with Applications, 165:113679. https://doi.org/10.1016/j.eswa.2020.113679

Jeong, H., Ko, Y., and Seo, J. (2016). How to improve text summarization and classification by mutual cooperation on an integrated framework. Expert Syst. Appl., 60(C):222–233. https://doi.org/10.1016/j.eswa.2016.05.001

Klie, J.-C., Bugert, M., Boullosa, B., de Castilho, R. E., and Gurevych, I. (2018). The inception platform: Machine-assisted and knowledge-oriented interactive annotation. In Proceedings of the 27th International Conference on Computational Linguistics: System Demonstrations, pages 5–9. Association for Computational Linguistics. Event Title: The 27th International Conference on Computational Linguistics (COLING 2018). https://aclanthology.org/C18-2002

Rahamat Basha, S., Keziya Rani, J., and Prasad Yadav, J. J. C. (2019). A novel summarization-based approach for feature reduction enhancing text classification accuracy. Engineering, Technology amp; Applied Science Research, 9(6):5001–5005. https://doi.org/10.48084/etasr.3173

Wang, F., Zhang, J. L., Li, Y., Deng, K., and Liu, J. S. (2021). Bayesian text classification and summarization via a class-specified topic model. J. Mach. Learn. Res., 22(1).
Publicado
25/09/2023
HARADA, Hellen; PEREIRA, Fabíola; ALMEIDA, Alex; FREIRE, Daniela; DIAS, Márcio; SILVA, Nádia; ANDRADE, Pedro; CARVALHO, André. Técnicas de sumarização de textos jurídicos para suporte à classificação de documentos de decisões judiciais. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 14. , 2023, Belo Horizonte/MG. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 393-397. DOI: https://doi.org/10.5753/stil.2023.234627.