Preliminary study on discursive flags for User Generated Content

Abstract


Rhetorical Structure Theory (RST) is a theory that points out the rhetorical structure present in the text. Descriptive RST works are mostly dedicated to formal textual genres, resulting in a scarcity of works that explore the theory in User-Generated Content (UGC) texts. Therefore, the objective of this work is to investigate discursive signals (SDs) of RST relationships in UGC texts, more specifically in tweets from the financial market. To this end, 180 tweets were randomly selected from the DANTE-stocks corpus, which were analyzed manually, identifying the flags of the RST relationships previously noted. As a result, the typology of flags for Portuguese was updated with SDs specific to UGC texts.
Keywords: RST, Flags, Posts, Corpus

References

Antonio, J. D. (2017) Mecanismos utilizados pelos destinatários do discurso para identificação de relações de coerência não sinalizadas por conectores. Delta, V. 33, pp. 79-108. DOI: 10.1590/0102-445025798334674077.

Cardoso, P. C., Maziero, E. G., Jorge, M. L. C., Seno, E. M., Di Felippo, A., Rino, L. H. M., ... Pardo, T. A. (2011, October). CSTnews-a discourse-annotated corpus for single and multi-document summarization of news texts in Brazilian Portuguese. In Proceedings of the 3rd RST Brazilian Meeting (pp. 88-105).

Dantas, E., Bárbara, L.J.S., Pereira, M.A., Gama, N.S., Almeida, T.J.A., Souza, J.W.C., Cardoso, P.C.F., Rodrigues, R. (2024). Manual de anotação de sinalizadores discursivos em textos jornalísticos. São Carlos: Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. [link]

Das, D., Taboada, M. (2018). RST Signalling Corpus: A corpus of signals of coherence relations. Language Resources and Evaluation, 52, 149-184.

Di Felippo, A., Postali, C., Ceregatto, G., Gazana, L. S., da Silva, E. H., Roman, N. T., Pardo, T. A. (2021). Descrição preliminar do corpus dantestocks: Diretrizes de segmentação para anotação segundo universal dependencies. In Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (pp. 335-343).

Fachada, B. (2019). "Mas" em artigos de opinião: valores e relações retóricas. elingUP: Revista Eletrónica de Linguística dos Estudantes da Universidade do Porto, 8(1), p. 108-122.

Liu, Y., Zeldes, A. (2019). Discourse relations and signaling information: Anchoring discourse signals in RST-DT. Society for Computation in Linguistics, 2(1), 314-317.

Mann, W.C., Thompson, S.A. (1988) Rhetorical Structure Theory: Toward a functional theory of text organization. Text-interdisciplinary Journal for the Study of Discourse, v.8, n.3, p. 243-281.

Pecuch, G. (2021). A relação retórica de elaboração sinalizada pelo marcador discursivo mas em aulas e em entrevistas orais. Letras Escreve, 11(1), 43-57.

Ramos, I.V.M., Souza, J.W.C. (2024). Classificação automática de textos de User-Generated Content utilizando Aprendizagem de Máquina Supervisionado. In Anais do XV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana. Porto Alegre: SBC.

Pereira, M.A., Souza, J.W.C. (2024). Subsídios Linguísticos para classificação automática de textos de User-Generated Content. In Anais do XV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana. Porto Alegre: SBC.

Rodrigues, R., Souza, J. W., Cardoso, P. C. F. (2023, September). Sinalizadores retórico-discursivos: revisitando a anotação RST no córpus CSTNews. In Anais do XIV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (pp. 249-257).

Taboada, M., & Das, D. (2013). Annotation upon annotation: Adding signalling information to a corpus of discourse relations. Dialogue & Discourse, 4(2), 249-281.

Zeldes, A. (2016). rstWeb-a browser-based annotation interface for Rhetorical Structure Theory and discourse relations. In Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Demonstrations (pp. 1-5).
Published
2024-11-17
GAMA, Naira Silva; SOUZA, Jackson Wilke da Cruz. Preliminary study on discursive flags for User Generated Content. In: BRAZILIAN SYMPOSIUM IN INFORMATION AND HUMAN LANGUAGE TECHNOLOGY (STIL), 15. , 2024, Belém/PA. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 418-423. DOI: https://doi.org/10.5753/stil.2024.245060.