Estrutura Ontológica e Unidades Lexicais: uma aplicação computacional no domínio da Ecologia

  • Claudia Zavaglia UNESP / USP
  • Leandro Henrique Mendonça de Oliveira USP / EMBRAPA
  • Maria das Graças Volpe Nunes USP
  • Sandra Maria Aluísio USP

Resumo


Ontologias são usadas para a representação de informações que contêm um entendimento semântico comum de situações variadas do mundo real. Para a sistematização do conjunto de informações terminológicas de um domínio, é fundamental o uso de ferramentas computacionais para a extração de termos. Este trabalho apresenta a avaliação de métodos de extração automática de termos (EAT) das abordagens estatística, lingüística e híbrida para a construção de ontologias. A avaliação é feita com uma lista de referência com termos do domínio da Ecologia, usando as métricas de precisão e revocação. A OntoEco prevê três subdomínios da Ecologia: Ecossistemas, Populações e Comunidades. Para a extração das unidades lexicais ontológicas, confeccionamos um córpus da Ecologia – o CórpusEco. Após a finalização do delineamento da ontologia, em classes, subclasses e instâncias os dados foram armazenados na ferramenta computacional Protégé-2000.

Referências

Almeida, G. M. B., Oliveira, L. H. M., Aluisio, S. M. “A Terminologia na era da Informática”. Ciência e Cultura (SBPC), v.58, p.42 - 45, 2006.

Bolshakova, E. “Recognition of Author’s Scientific and Technical Terms”. LNCS 2004, 2001 p. 281-90.

Bourigault, D. “Surface grammatical analysis for the extraction of terminological noun phrases”. In Proceedings of the 14th International Conference on Computational Linguistics, COLING 1992, 1992. p. 977-981.

Daille, B. “Combined approach for terminology extraction: lexical statistics and linguistic filtering”. PhD thesis, University of Paris 7, 1994.

Estopà Bagot, R. “Extracció de terminologia: elements per a la construcció d’un SEACUSE (Sistema d’Extracció Automàtica de Candidats a Unitats de Significació Especialitzada)”. Tese de Doutorado. Universidade Pompeu Fabra, 1999.

Ha, L.A. “Co-training applied in automatic term extraction: an experiment”. In: 7th Annual CLUK Research Colloquium, University of Birmingham, Jan 2004. Disponível em [link].

Heid, U.; Jau, S.; Krüger, K.; Hohmann, A. “Term extraction with standard tools for córpus exploration”. In: 4th International Congress on Terminology and Knowledge Engineering, Wien. August, 1996.

Klavans, J. L.; Muresan, S. “DEFINDER: Rule-Based Methods for the Extraction of Medical Terminology and their Associated Definitions from Online Text”. In: Proceedings of AMIA, 2000.

Klavans, J. L.; Muresan, S. “Evaluation of DEFINDER: A System to Mine Definitions from Consumer-oriented Medical Text”. In: Proceedings of JCDL, 2001a.

Klavans, J. L.; Muresan, S. “Evaluation of the DEFINDER System for Fully Automatic Glossary Construction”. In: Proceedings of AMIA, 2001 b.

Pantel, P.; Lin, D. A statistical corpus-based term extractor. In: E. Stroulia e S. Matwin (Ed.), AI 2001, Lecture Notes in Artificial Intelligence, Springer-Verlag, 2001. p. 36–46.

Pustejovsky, J. The Generative Lexicon. Cambridge: The MIT Press, 1995.
Publicado
30/06/2007
ZAVAGLIA, Claudia; OLIVEIRA, Leandro Henrique Mendonça de; NUNES, Maria das Graças Volpe; ALUÍSIO, Sandra Maria. Estrutura Ontológica e Unidades Lexicais: uma aplicação computacional no domínio da Ecologia. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 5. , 2007, Rio de Janeiro/RJ. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2007 . p. 1575-1584.