Validação Preliminar da Teoria das Veias para o Português e Lições Aprendidas

  • Thiago Ianez Carbonel UFCSPA
  • Jorge Marques Pelizzoni USP
  • Lucia Helena Machado Rino UFSCar

Resumo


Neste artigo, reportamos o primeiro esforço de validação da Conjectura 1 (C1) da Teoria das Veias para o português, a qual restringe a resolução anafórica em função da estrutura retórico-discursiva de um texto e cuja aplicabilidade à Sumarização Automática nos interessa. Trata-se de um experimento preliminar, considerando apenas sintagmas nominais definidos. Por meio dele, pudemos aperfeiçoar nossa metodologia e observar uma precisão bem menor que a reportada anteriormente para outras línguas. Como inovação metodológica, formulamos a Precisão Não-Trivial, um estimador mais realista para o poder preditivo da C1.

Referências

Carlson, L.; Marcu, D. (2001). Discourse Tagging Reference Manual. ISI Technical Report ISI-TR-545.

Collovini, S.; Carbonel, T. I.; Fuchs, J. T.; Coelho, J. C.; Rino, L.; Vieira, R. (2007). Summ-it: um córpus anotados com informações discursivas visando à sumarização automática. Anais do V Workshop em Tecnologia da Informação e da Linguagem Humana – TIL’2007. Rio do Janeiro-RJ. Julho.

Cristea, D.; Ide, N.; Romary, L. (1998). Veins Theory: A Model of Global Discourse Cohesion and Coherence. In the Proceedings of the Coling/ACL’ 1998, pp.281-285. Montreal, Canadá.

Grosz, B.; Joshi, A.; Weisten, S. (1995). Centering: A Framework for Modeling the Local Coherence of Discourse. Computational Linguistics, V. 21, N. 2, pp. 203-225.

Mann, W.C.; Thompson, S.A. (1987). Rhetorical Structure Theory: A Theory of Text Organization. Technical Report ISI/RS-87-190.

Marcu, D. (1997). The Rhetorical Parsing, Summarization, and Generation of Natural Language Texts. PhD Thesis, Department of Computer Science, University of Toronto.

Marcu, D. (1999). A formal and computational synthesis of Grosz and Sidner’s and Mann and Thompson’s theories. In the Proceedings of the Workshop on Levels of Representation in Discourse, pp. 101-108. Edinburgh, Scotland.

Müller, C.; Strube, M. (2001).Annotating anaphoric and bridging relations with mmax. In Proceedings of the 2nd SIGdialWorkshop on Discourse and Dialogue, Aalborg, Denmark, pp. 90-95.

O’Donnel, M. (1997). RSTTool: An RST Analysis Tool. In Proc. of the 6th European Workshop on Natural Language Generation, Gerhard-Mercator University, Duisburg, Alemanha.

Pardo, T.A.S. (2005). Métodos para Análise Discursiva Automática. Tese de Doutorado. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. São Carlos-SP, Junho, 211p.

Seno, E.R.M. (2005). Especificação de Heurísticas de Sumarização de Estruturas RST com Base na Preservação dos Elos Co-Referenciais. Dissertação de Mestrado. Departamento de Computação, UFSCar.

Seno, E.R.M., Rino, L.H.M. (2005). Co-referential chaining for coherent summaries through rhetorical and linguistic modeling. In: Proceedings of Workshop on Crossing Barriers in Text Summarization Research – RANLP'05. p.70-75.
Publicado
30/06/2007
CARBONEL, Thiago Ianez; PELIZZONI, Jorge Marques; RINO, Lucia Helena Machado. Validação Preliminar da Teoria das Veias para o Português e Lições Aprendidas. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 5. , 2007, Rio de Janeiro/RJ. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2007 . p. 1595-1604.