A methodology for automatic indexing using noun phrases

  • Renato Rocha Souza UFMG
  • K. S. Raghavan Indian Statistical Institute

Resumo


This paper presents a methodology that has been developed for extracting noun phrases from Portuguese texts. The results of an experiment carried out to test the adequacy of the methodology are also presented.

Referências

Baeza-yates, R. & Ribeiro-Neto, B. (1999). “Modern Information Retrieval”. New York: ACM Press, 511p.

Gasperin, C.V. et al (2003). “Extracting XML chunks from Portuguese corpora”. In: Proceedings of the Workshop on Traitement automatique des langues minoritaires.. Batz-sur-Mer.

Kuramoto, H. (1996). “Uma abordagem alternativa para o tratamento e a recuperação de informação textual: os sintagmas nominais”. Ciência da Informação, Brasília, v. 25, n. 2. Also available: [link]

Souza, R.R. (2005). “Uma proposta de metodologia para escolha automática de descritores utilizando sintagmas nominais”. Tese (Doutorado em Ciência da Informação) – Escola de Ciência de Informação, Universidade Federal de Minas Gerais, Belo Horizonte.

Sparck Jones, K. & Willett, P. Ed. (1997). “Readings in Information Retrieval”. San Francisco: Morgan Kaufmann.

Velumani, G. & Raghavan, K. S. (2005) “Automatic Extraction of Keywords from Web resources”. Information Studies, 11(3), 185-194

Velumani, G. & Raghavan, K. S. (2006). “Extraction of Keywords: A Noun Phrase-based Methodology” (In Knowledge Representation and Information Retrieval edited by K. S. Raghavan. – Bangalore: DRTC, Indian Statistical Institute, paper P.)

Woods, J.O.R.R. & Fox, E.A. (2005). “Multilingual Noun Phrase Extraction Using a Part-of-Speech Tagger”. Available at [link]
Publicado
30/06/2007
SOUZA, Renato Rocha; RAGHAVAN, K. S.. A methodology for automatic indexing using noun phrases. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 5. , 2007, Rio de Janeiro/RJ. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2007 . p. 1689-1698.