Summ-it: Um corpus anotado com informações discursivas visando à sumarização automática

  • Sandra Collovini UNISINOS
  • Thiago I. Carbonel UFSCar
  • Juliana Thiesen Fuchs UNISINOS
  • Jorge César Coelho UNISINOS
  • Lúcia Rino UFSCar
  • Renata Vieira UNISINOS

Resumo


Este artigo apresenta o corpus Summ-it, elaborado com o objetivo de embasar pesquisas de discurso envolvendo relações anafóricas e retóricas e a sumarização automática.

Referências

Bick, E. (2000). The Parsing System PALAVRAS: Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. PhD thesis, Arhus University.

Carlson, L. and Marcu, D. (2001). Discourse tagging reference manual. Technical Report ISI-TR-545.

Coelho, J. C. B., Collovini, S., and Vieira, R. (2006). Instruções para anotação de relações anafóricas e referência dêitica. Disponível em: [link].

Mann, W. C., Matthiessen, C. M. I. M., and Thompson, S. A. (1992). Rhetorical structure theory and text analysis. In Mann, W. C. and Thompson, S. A., editors, Discourse description: diverse linguistic analyses of a fund-raising text, Amsterdam. John Benjamins.

Mann, W. C. and Thompson, S. A. (1988). Rhethorical structure theory: toward a functional theory of text organization. Text, 8(3).

Marcu, D. (1997). The Rhetorical Parsing, Summarization, and Generation of Natural Language Texts. PhD thesis, Department of Computer Science, University of Toronto.

Marcu, D. (1999). Discourse trees are good indicators of importance in text. In Mani, I. and Maybury, M. T., editors, Advances in Automatic Text Summarization. The MIT Press.

Marcu, D. (2000). The Theory and Practice of Discourse Parsing and Summarization. The MIT Press, Cambridge, MA.

Müller, C., Rapp, S., and Strube, M. (2002). Applying co-training to reference resolution. In Proc. of the 40th Annual Meeting of the ACL, Philadelphia, PA.

Müller, C. and Strube, M. (2001). Mmax: A tool for the annotation of multi-modal corpora. In Proc. of the 2nd IJCAI Workshop on Knowledge and Reasoning in Practical Dialogue Systems, Seattle, Washington.

Ng, V. and Cardie, C. (2002). Identifying anaphoric and non-anaphoric noun phrases. In Proc. of the Nineteenth International Conference on Computational Linguistics (COLING), Taipei, Taiwan.

O’Donnell, M. (2000). Rsttool 2.4: A markup tool for rhetorical structure theory. In Proc. of the International Natural Language Generation Conference, Mitzpe Ramon, Israel.

Ono, K., Sumita, K., and Miike, S. (1994). Abstract generation based on rhetorical structure extraction. In Proc. of the International Conference on Computational Linguistic - Coling-94, Japan.

Pardo, T. A. S. (2005). Métodos para Análise Discursiva Automática. PhD thesis, ICMC-USP, São Carlos, SP.

Poesio, M. (2004). The mate/gnome scheme for anaphoric annotation, revisited. In Strube, M. and Sidner, C., editors, Proc. of the 5th SIGdial Workshop on Discourse and Dialogue, Cambridge, Massachusetts, USA.

Poesio, M., Alexandrov-Ksbadjov, M., Vieira, R., Goulart, R., and Uryupina, O. (2005). Does discourse-new detection help definite description resolution? In Proc. of the 6th International Workshop on Computational Semantics, Tiburg.

Rino, L. H. M. (1996). Modelagem de Discurso para o Tratamento da Concisão e Preservação da Idéia Central na Geração de Textos. PhD thesis, IFSC-USP, São Carlos, SP.
Publicado
30/06/2007
COLLOVINI, Sandra; CARBONEL, Thiago I.; FUCHS, Juliana Thiesen; COELHO, Jorge César; RINO, Lúcia; VIEIRA, Renata. Summ-it: Um corpus anotado com informações discursivas visando à sumarização automática. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 5. , 2007, Rio de Janeiro/RJ. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2007 . p. 1605-1614.