Anotação Enhanced Rhetorical Structure Theory em textos de User-Generated Content

  • Mateus Araújo Pereira UFBA
  • Jackson Wilke da Cruz Souza UFBA

Resumo


Este estudo analisa a aplicação da Enhanced Rhetorical Structure Theory (eRST) em textos de User-Generated Content (UGC), especificamente tweets relacionados ao mercado financeiro. Com o auxílio da ferramenta rstWeb, a anotação foi realizada a partir do corpus Dante-Stocks. Os resultados evidenciam a recorrência de determinadas relações eRST, a depender da estruturação semântico-sintática dos tweets, além de apontarem possíveis adaptações das diretrizes de anotação originalmente formuladas para a língua inglesa.

Referências

Felippo, A., Postali, C., Ceregatto, G., Gazana, L., Silva, E., Roman, N., & Pardo, T. (2021). “Descrição Preliminar do Corpus DANTEStocks: Diretrizes de Segmentação para Anotação segundo Universal Dependencies”. In Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, (pp. 335-343). Porto Alegre: SBC. DOI: 10.5753/stil.2021.17813

Krumm, J., Davies, N., & Narayanaswami, C. (2008). “User-generated content”. In IEEE Pervasive Computing, 7(4), 10–11. DOI: 10.1109/MPRV.2008.85

Mann, W. C. e Thompson, S. A. (1987). Rhetorical Structure Theory: A theory of text organization. University of Southern California, Information Sciences Institute Los Angeles

Pastor, M.,Oostdijk, N., & Larson, M. (2024). “The Contribution of Coherence Relations to Understanding Paratactic Forms of Communication in Social Media Comment Sections”. [link]

Pereira, M., & Souza, J. (2024). Subsídios Linguísticos para Classificação Automática de Textos de User-Generated Content. In Anais do XV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, (pp. 429-433). Porto Alegre: SBC. DOI: 10.5753/stil.2024.245132

Sanguinetti, M., Bosco, C., Cassidy, L., Çetinoğlu, Ö., Cignarella, A. T., et al. (2022). Treebanking user-generated content: A UD based overview of guidelines, corpora and unified recommendations. Language Resources and Evaluation, 57(2), 493–544. DOI: 10.1007/s10579-022-09581-9

Zeldes, A., Aoyama, T., Liu, Y. J., Peng, S., Das, D., & Gessler, L. (2025). eRST: A signaled graph theory of discourse relations and organization. Computational Linguistics, 51 (1), 23–72. Doi: DOI: 10.1162/coli_a_00538

Zeldes, A. (2016). “rstWeb a browser-based annotation interface for Rhetorical Structure Theory and discourse relations”. In Proceedings of NAACL-HLT 2016 System Demonstrations
Publicado
29/09/2025
PEREIRA, Mateus Araújo; SOUZA, Jackson Wilke da Cruz. Anotação Enhanced Rhetorical Structure Theory em textos de User-Generated Content. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 16. , 2025, Fortaleza/CE. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 713-717. DOI: https://doi.org/10.5753/stil.2025.37877.