Classificação de Páginas de Petições iniciais Utilizando Redes Neurais Convolucionais Multimodais

  • Caio Mota Universidade Federal Rural de Pernambuco
  • Andressa Lima Aiboxlab
  • André Nascimento Universidade Federal Rural de Pernambuco
  • Péricles Miranda Universidade Federal Rural de Pernambuco
  • Rafael de Mello Universidade Federal Rural de Pernambuco

Resumo


A classificação e separação de documentos é uma etapa de extrema importância na análise de processos judiciais. Algoritmos de aprendizado profundo têm alcançado resultados promissores nesta tarefa, extraindo informações relevantes a partir dos textos destes documentos. No entanto, os documentos de processos judiciais têm se tornado cada vez mais heterogêneos, i.e. fotos, recibos, documentos de texto, etc., impactando diretamente a precisão na classificação. Este trabalho investiga o uso de redes convolucionais multimodais, combinando características extraídas de textos e imagens, para classificação de páginas de processos. Duas abordagens multimodais foram comparadas com quatro monomodais. Todos os algoritmos foram avaliados, em termos em acurácia e kappa, em uma base de dados composta por 117 processos judiciais. Os resultados mostraram que a abordagem que atingiu o melhor desempenho é multimodal, apresentando eficácia e eficiência na classificação de páginas de processos.

Palavras-chave: redes neurais, classificação de textos, aprendizagem de máquina, aprendizado profundo

Referências

Audebert, N., Herold, C., Slimani, K., and Vidal, C. (2019). Multimodal deep networks for text and image-based document classification.

Chen, N. and Blostein, D. (2007). A survey of document image classification: problem statement, classifier architecture and performance evaluation. International Journal of Document Analysis and Recognition (IJDAR), 10(1):1–16.

Chollet, F. (2018). Deep Learning mit Python und Keras: Das Praxis-Handbuch vom Entwickler der Keras-Bibliothek. MITP-Verlags GmbH & Co. KG. de Araujo, P. H. L., de Campos, T. E., Braz, F. A., and da Silva, N. C. (2020). Victor: a dataset for brazilian legal documents classification. In Proceedings of The 12th Language Resources and Evaluation Conference, pages 1449–1458.

Frasconi, P., Soda, G., and Vullo, A. (2002). Hidden Markov models for text categorization in multi-page documents. Journal of Intelligent Information Systems, 18(2-3):195–217.

Gallo, I., Noce, L., Zamberletti, A., and Calefati, A. (2016). Deep Neural Networks for Page Stream Segmentation and Classification. 2016 International Conference on Digital Image Computing: Techniques and Applications, DICTA 2016, pages 1–7.

Hammami, E., Akermi, I., Faiz, R., and Boughanem, M. (2019). Deep learning for french legal data categorization. In International Conference on Model and Data Engineering, pages 96– 105. Springer.

Jain, R. and Wigington, C. (2019). Multimodal Document Image Classification. In 2019 International Conference on Document Analysis and Recognition (ICDAR), volume 91, pages 71–77. IEEE.

Kowsari, K., Jafari Meimandi, K., Heidarysafa, M., Mendu, S., Barnes, L., and Brown, D. (2019). Text classification algorithms: A survey. Information, 10(4):150.

Rusiñol, M., Frinken, V., Karatzas, D., Bagdanov, A. D., and Lladós, J. (2014). Multimodal page classification in administrative document image streams. International Journal on Document Analysis and Recognition, 17(4):331–341.

Toffoli, J. A. D. and Gusmão, B. G. (2019). Inteligência artificial na Justiça / Conselho Nacional de Justiça.

Undavia, S., Meyers, A., and Ortega, J. E. (2018). A comparative study of classifying legal documents with neural networks. In 2018 Federated Conference on Computer Science and Information Systems (FedCSIS), pages 515–522. IEEE.

Wiedemann, G. and Heyer, G. (2019). Multi-modal page stream segmentation with convolutional neural networks. Language Resources and Evaluation.

Zhang, X. and LeCun, Y. (2015). Text Understanding from Scratch. pages 1–9.
Publicado
20/10/2020
MOTA, Caio; LIMA, Andressa; NASCIMENTO, André; MIRANDA, Péricles; DE MELLO, Rafael. Classificação de Páginas de Petições iniciais Utilizando Redes Neurais Convolucionais Multimodais. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 17. , 2020, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2020 . p. 318-329. ISSN 2763-9061. DOI: https://doi.org/10.5753/eniac.2020.12139.