Aplicação de Modelos BERT Especializados para o Aprimoramento na Classificação de Sentenças Jurídicas
Resumo
Soluções baseadas em Processamento de Linguagem Natural (PLN) são adotadas com o objetivo de otimizar a gestão processual e garantir maior uniformidade e previsibilidade nas decisões judiciais. Modelos de linguagem, como o Bidirectional Encoder Representations from Transformers (BERT), são alternativas viáveis para capturar as particularidades da linguagem legal. Este trabalho investiga a aplicação de Parameter-Efficient Fine-Tuning (PEFT) com Low-Rank Adaptation (LoRA) aos modelos LegalBert-pt e BumbaBert, com abordagens de truncamento e agrupamento dos documentos para o aumento da precisão na classificação de temas de Incidentes de Resolução de Demandas Repetitivas (IRDRs) em sentenças jurídicas.
Referências
Hu, E. J., Shen, Y., Wallis, P., Allen-Zhu, Z., Li, Y., Wang, S., Wang, L., and Chen, W. (2021). LoRA: Low-Rank Adaptation of Large Language Models.
Melo, J. (2021). Sistema de precedentes garante segurança jurídica e decisões ágeis. [link].
Polo, F. M., Mendonça, G. C. F., Parreira, K. C. J., Gianvechio, L., Cordeiro, P., Ferreira, J. B., Lima, L. M. P. D., Maia, A. C. D. A., and Vicente, R. (2021). LegalNLP - Natural Language Processing methods for the Brazilian Legal Language. In Anais Do XVIII Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2021), pages 763–774, Brasil. Sociedade Brasileira de Computação.
Silveira, R., Ponte, C., Almeida, V., Pinheiro, V., and Furtado, V. (2023). LegalBert-pt: A Pretrained Language Model for the Brazilian Portuguese Legal Domain. In Naldi, M. C. and Bianchi, R. A. C., editors, Intelligent Systems, volume 14197, pages 268– 282. Springer Nature Switzerland, Cham.
Wirth, R. and Hipp, J. (2000). CRISP-DM: Towards a Standard Process Model for Data Mining.