Sumarizacão Automática de Notícias Crime no Contexto da Polícia Federal

  • Thierry S. Barros Universidade Federal de Campina Grande (UFCG)
  • Carlos Eduardo S. Pires Universidade Federal de Campina Grande (UFCG)
  • Dimas C. N. Filho Universidade Federal do Agreste de Pernambuco (UFAPE)

Resumo


Redes neurais profundas foram aplicadas com sucesso a muitas tarefas diferentes de processamento de linguagem natural. Um modelo de rede neural que alavancou os resultados em uma ampla gama de tarefas de PNL foi o modelo BERT - uma sigla para Bidirectional Encoder Representations from Transformers. Nesta pesquisa, apresentamos como o modelo BERT pode ser utilizado para resumir documentos textuais da Polícia Federal Brasileira. Os documentos visam relatar um resumo das atividades investigativas. Devido ao tamanho e à complexidade dos documentos, é um trabalho exaustivo ler e compreender todo o seu conteúdo. Assim, objetivamos analisar a viabilidade da utilização do modelo BERT para extrair e sintetizar as informações mais importantes de documentos da Polícia Federal.
Palavras-chave: sumarização automática, noticias crime, bert

Referências

de Brito Gomes, L. B. and Oliveira, H. (2019). A multi-document summarization system for news articles in portuguese using integer linear programming.

Devlin, J., Chang, M.-W., Lee, K., and Toutanova, K. (2019). Bert: Pre-training of deep bidirectional transformers for language understanding.

Galassi, A., Lippi, M., and Torroni, P. (2019). Attention in natural language processing.

Jadhav, A., Jain, R., Fernandes, S., and Shaikh, S. (2019). Text summarization using neural networks. In 2019 International Conference on Advances in Computing, Communication and Control (ICAC3), pages 1–6.

Kiani, F. and Tas, O. (2017). A survey automatic text summarization. volume 5, pages 205–213.

Kieuvongngam, V., Tan, B., and Niu, Y. (2020). Automatic text summarization of covid19 medical research articles using bert and gpt-2.

Lin, C.-Y. (2004). Rouge: A package for automatic evaluation of summaries. page 10.

Liu, Y. (2019). Fine-tune bert for extractive summarization.

Moratanch, N. and Gopalan, C. (2017). A survey on extractive text summarization. pages 1–6.

Oliveira, M. A. d. and Mosca, L. d. L. S. (2014). As notícias de crime: uma análise retorico-argumentativa do discurso jornalístico online por antecipação ao discurso jurídico. Master’s thesis, Universidade de São Paulo.

Otter, D. W., Medina, J. R., and Kalita, J. K. (2019). A survey of the usages of deep learning in natural language processing.

Rino, L., Pardo, T., Silla, C., Kaestner, C., and Pombo, M. (2004). A comparison of automatic summarizers of texts in brazilian portuguese. volume 3171, pages 235–244.

Widyassari, A. P., Rustad, S., Shidik, G. F., Noersasongko, E., Syukur, A., Affandy, A., and Setiadi, D. R. I. M. (2020). Review of automatic text summarization techniques methods. Journal of King Saud University - Computer and Information Sciences.
Publicado
04/10/2021
BARROS, Thierry S.; PIRES, Carlos Eduardo S.; N. FILHO, Dimas C.. Sumarizacão Automática de Notícias Crime no Contexto da Polícia Federal. In: WORKSHOP DE TESES E DISSERTAÇÕES (WTDBD) - SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 36. , 2021, Rio de Janeiro. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 127-133. DOI: https://doi.org/10.5753/sbbd_estendido.2021.18174.