A Linguagem em Foco: Anotação de Sinalizadores Discursivos em Textos Jornalísticos

Resumo


Por serem recursos que permitem a observação de comportamentos e usos linguísticos e sociais, os corpora anotados passaram a ser de interesse de diferentes areas do conhecimento. No contexto da Rhetorical Structure Theory (RST) apresentamos neste trabalho os processos metodológicos e práticos de anotação de sinalizadores discursivos em um corpus jornalístico do português do Brasil. Ainda, apresentamos as primeiras avaliações (quanti e qualitativa) sobre as decisões tomadas pelo grupo de anotadores.
Palavras-chave: Rhetorical structure theory, marcadores discursivos, sinalizadores discursivos

Referências

Cardoso, P. C., Maziero, E. G., Jorge, M. L. C., Seno, E. M., Di Felippo, A., Rino, L. H. M., Nunes, M. d. G. V., e Pardo, T. A. (2011). CSTNews - A discourse-annotated corpus for single and multi-document summarization of news texts in Brazilian Portuguese. In Proceedings of the 3rd RST Brazilian Meeting, pages 88–105

Dantas, E., Bárbara, L. d. J. S., Pereira, M. A., Gama, N. S., Almeida, T. J. A., Souza, J. W. d. C., Cardoso, P. C. F., e Rodrigues, R. (2024). Manual de anotação de sinalizadores discursivos em textos jornalísticos. Série de Relatórios Técnicos do Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo.

Das, D. e Taboada, M. (2018). RST signalling corpus: A corpus of signals of coherence relations. Language Resources and Evaluation, 52:149–184. DOI: 10.1007/s10579-017-9383-x

Duran, M. S., Nunes, M. d. G. V., Lopes, L., e Pardo, T. A. S. (2022). Manual de anotação como recurso de processamento de linguagem natural: o modelo universal dependencies em língua portuguesa. Domínios de Lingu@gem, 16(4):1608–1643. DOI: 10.14393/DL52-v16n4a2022-13

Hovy, E. e Lavid, J. (2010). Towards a ‘science’of corpus annotation: a new methodological challenge for corpus linguistics. International Journal of Translation, 22(1):13–36.

Krippendorff, K. (2011). Computing krippendorff’s alpha-reliability.

Liu, Y. (2019). Beyond the Wall Street Journal: Anchoring and comparing discourse signals across genres. arXiv preprint arXiv:1909.00516 DOI: 10.18653/v1/W19-2710

Liu, Y. e Zeldes, A. (2019). Discourse relations and signaling information: Anchoring discourse signals in RST-DT. Society for Computation in Linguistics, 2(1) DOI: 10.7275/vh3w-4240

Mann, W. C. e Thompson, S. A. (1987). Rhetorical Structure Theory: A theory of text organization. University of Southern California, Information Sciences Institute Los Angeles

Marcu, D. (2000). The rhetorical parsing of unrestricted texts: A surface-based approach. Computational linguistics, 26(3):395–448.

Maziero, E. G. (2016). Análise retórica com base em grande quantidade de dados. PhD thesis, Universidade de São Paulo. DOI: 10.11606/T.55.2017.tde-13012017-103446

Pardo, T. A. S. (2005). Métodos para análise discursiva automática. PhD thesis, Universidade de São Paulo DOI: 10.11606/T.55.2005.tde-29082005-172336

Pedro, W. e Vale, O. (2018). Comentcorpus: o uso de mecanismos linguísticos na detecção de ironia e sarcasmo para o português do Brasil em um corpus opinativo. Linguística de corpus: perspectivas. Porto Alegre: Instituto de Letras da Universidade Federal do Rio Grande do Sul, pages 19–40 DOI: 10.25189/2675-4916.2020.v1.n2.id207

Pustejovsky, J. e Stubbs, A. (2012). Natural Language Annotation for Machine Learning: A guide to corpus-building for applications. O’Reilly Media, Inc.

Rodrigues, R., Souza, J. W., e Cardoso, P. C. F. (2023). Sinalizadores retórico-discursivos: revisitando a anotação RST no córpus CSTnews. In Anais do XIV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, pages 249–257. SBC DOI: 10.5753/stil.2023.234120

Taboada, M. e Das, D. (2013). Annotation upon annotation: Adding signalling information to a corpus of discourse relations. Dialogue & Discourse, 4(2):249–281 DOI: 10.5087/dad.2013.211

Zeldes, A. (2016). rstWeb-a browser-based annotation interface for Rhetorical Structure Theory and discourse relations. In Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Demonstrations, pages 1–5.

Zeldes, A. (2016). rstWeb-a browser-based annotation interface for Rhetorical Structure Theory and discourse relations. In Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Demonstrations, pages 1–5. DOI: 10.18653/v1/N16-3001
Publicado
17/11/2024
CARDOSO, Paula et al. A Linguagem em Foco: Anotação de Sinalizadores Discursivos em Textos Jornalísticos. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 15. , 2024, Belém/PA. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 247-256. DOI: https://doi.org/10.5753/stil.2024.245329.