Subsídios para a Elaboração Automática de Taxonomias
Resumo
Neste trabalho, apresentamos subsídios lingüísticos para a construção automática de taxonomias a partir de corpus. Tais subsídios são aplicados em um corpus específico quanto ao domínio e em um corpus genérico. A comparação revela que, embora o cruzamento de relações de hiperonímia, capaz de produzir inferências e construir taxonomias, não seja uma técnica explorada freqüentemente, seus resultados são de grande valia para a elaboração de taxonomias de domínio.Referências
AIRES, R.V.X.; ALUÍSIO, S.M. Criação de um corpus com 1.000.000 de palavras etiquetado morfossintaticamente. Relatórios do NILC, NILC-TR-01-8, 2001.
BICK, E. The Parsing System PALAVRAS: Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. PhD Thesis. Aarhus University, 2000.
CEDERBERG, S. e WIDDOWS, D. Using LSA and Noun Coordination Information to Improve the Precision and Recall of Automatic Hyponymy Extraction. In: Seventh Conference on Computational Natural Language Learning (CoNLL-2003), Edmonton, Canadá, 111-118, 2003.
CRUSE, D. Lexical Semantics. Cambridge, Inglaterra: Cambridge University Press,1986.
HEARST, M. Automatic acquisition of hyponyms from large text corpora. In: Proceedings of the 14th International Conference on Computational Linguistics, Nantes, 1992.
HEARST, M. Automated discovery of WordNet relations. In: Fellbaum, Christiane, ed., WordNet: An Electronic Lexical Database. MIT Press, 1998.
KILGARRIFF, A. Thesauruses for Natural Language Processing. In: Proceedings of NLPKE, Beijing, China, p.5-1, 2003.
LYONS, J. Semântica. Martins Fontes, 1980.
MARQUES, M. H. D.. Léxico de alta freqüência na língua portuguesa. In: HEYE, J. (org). Flores verbais, uma homenagem lingüística e literária para Eneida do Rego Monteiro Bomfim no seu 70° aniversário. Rio de Janeiro: 34 Editora, p. 247-282, 1995.
MORIN, E. e JACQUEMIN, C. Automatic acquisition and expansion of hypernym links. In: Computer and the Humanities, vol. 38 (4), 343-362l, 2004.
OLIVEIRA, C.M. O Substantivo-suporte:Critérios Operacionais de Caracterização. Rio de Janeiro, 2006. 116p. Tese de Doutorado — Departamento de Letras, Pontifícia Universidade Católica do Rio de Janeiro, 2006.
SANTOS, C.N., OLIVEIRA, C.M. Aplicação de aprendizado baseado em transformações na identificação de sintagmas nominais. In: Anais do XXV Congresso da Sociedade Brasileira de Computação, Brasil, 2005.
SNOW, R., JURAFSKY, D., e NG, A. Y. Learning syntactic patterns for automatic hypernym discovery. In: Advances in Neural Information Processing Systems 17, 2005.
YAROWSKY D. Unsupervised word sense disambiguation rivaling supervised methods. In: Proceedings of the 33rd Annual Meeting of the Association for Computational Linguistics, Cambridge, MA, pp 189-196, 1995. Boulic, R. and Renault, O. (1991) “3D Hierarchies for Animation”, In: New Trends in Animation and Visualization, Edited by Nadia Magnenat-Thalmann and Daniel Thalmann, John Wiley & Sons ltd., England.
WITTGENSTEIN, L. Investigações Filosóficas. Coleção Os Pensadores, São Paulo: Abril Cultural, 1979.
BICK, E. The Parsing System PALAVRAS: Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. PhD Thesis. Aarhus University, 2000.
CEDERBERG, S. e WIDDOWS, D. Using LSA and Noun Coordination Information to Improve the Precision and Recall of Automatic Hyponymy Extraction. In: Seventh Conference on Computational Natural Language Learning (CoNLL-2003), Edmonton, Canadá, 111-118, 2003.
CRUSE, D. Lexical Semantics. Cambridge, Inglaterra: Cambridge University Press,1986.
HEARST, M. Automatic acquisition of hyponyms from large text corpora. In: Proceedings of the 14th International Conference on Computational Linguistics, Nantes, 1992.
HEARST, M. Automated discovery of WordNet relations. In: Fellbaum, Christiane, ed., WordNet: An Electronic Lexical Database. MIT Press, 1998.
KILGARRIFF, A. Thesauruses for Natural Language Processing. In: Proceedings of NLPKE, Beijing, China, p.5-1, 2003.
LYONS, J. Semântica. Martins Fontes, 1980.
MARQUES, M. H. D.. Léxico de alta freqüência na língua portuguesa. In: HEYE, J. (org). Flores verbais, uma homenagem lingüística e literária para Eneida do Rego Monteiro Bomfim no seu 70° aniversário. Rio de Janeiro: 34 Editora, p. 247-282, 1995.
MORIN, E. e JACQUEMIN, C. Automatic acquisition and expansion of hypernym links. In: Computer and the Humanities, vol. 38 (4), 343-362l, 2004.
OLIVEIRA, C.M. O Substantivo-suporte:Critérios Operacionais de Caracterização. Rio de Janeiro, 2006. 116p. Tese de Doutorado — Departamento de Letras, Pontifícia Universidade Católica do Rio de Janeiro, 2006.
SANTOS, C.N., OLIVEIRA, C.M. Aplicação de aprendizado baseado em transformações na identificação de sintagmas nominais. In: Anais do XXV Congresso da Sociedade Brasileira de Computação, Brasil, 2005.
SNOW, R., JURAFSKY, D., e NG, A. Y. Learning syntactic patterns for automatic hypernym discovery. In: Advances in Neural Information Processing Systems 17, 2005.
YAROWSKY D. Unsupervised word sense disambiguation rivaling supervised methods. In: Proceedings of the 33rd Annual Meeting of the Association for Computational Linguistics, Cambridge, MA, pp 189-196, 1995. Boulic, R. and Renault, O. (1991) “3D Hierarchies for Animation”, In: New Trends in Animation and Visualization, Edited by Nadia Magnenat-Thalmann and Daniel Thalmann, John Wiley & Sons ltd., England.
WITTGENSTEIN, L. Investigações Filosóficas. Coleção Os Pensadores, São Paulo: Abril Cultural, 1979.
Publicado
30/06/2007
Como Citar
FREITAS, Maria Cláudia de; QUENTAL, Violeta.
Subsídios para a Elaboração Automática de Taxonomias. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 5. , 2007, Rio de Janeiro/RJ.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2007
.
p. 1585-1594.
