Estrutura Ontológica e Unidades Lexicais: uma aplicação computacional no domínio da Ecologia
Resumo
Ontologias são usadas para a representação de informações que contêm um entendimento semântico comum de situações variadas do mundo real. Para a sistematização do conjunto de informações terminológicas de um domínio, é fundamental o uso de ferramentas computacionais para a extração de termos. Este trabalho apresenta a avaliação de métodos de extração automática de termos (EAT) das abordagens estatística, lingüística e híbrida para a construção de ontologias. A avaliação é feita com uma lista de referência com termos do domínio da Ecologia, usando as métricas de precisão e revocação. A OntoEco prevê três subdomínios da Ecologia: Ecossistemas, Populações e Comunidades. Para a extração das unidades lexicais ontológicas, confeccionamos um córpus da Ecologia – o CórpusEco. Após a finalização do delineamento da ontologia, em classes, subclasses e instâncias os dados foram armazenados na ferramenta computacional Protégé-2000.Referências
Almeida, G. M. B., Oliveira, L. H. M., Aluisio, S. M. “A Terminologia na era da Informática”. Ciência e Cultura (SBPC), v.58, p.42 - 45, 2006.
Bolshakova, E. “Recognition of Author’s Scientific and Technical Terms”. LNCS 2004, 2001 p. 281-90.
Bourigault, D. “Surface grammatical analysis for the extraction of terminological noun phrases”. In Proceedings of the 14th International Conference on Computational Linguistics, COLING 1992, 1992. p. 977-981.
Daille, B. “Combined approach for terminology extraction: lexical statistics and linguistic filtering”. PhD thesis, University of Paris 7, 1994.
Estopà Bagot, R. “Extracció de terminologia: elements per a la construcció d’un SEACUSE (Sistema d’Extracció Automàtica de Candidats a Unitats de Significació Especialitzada)”. Tese de Doutorado. Universidade Pompeu Fabra, 1999.
Ha, L.A. “Co-training applied in automatic term extraction: an experiment”. In: 7th Annual CLUK Research Colloquium, University of Birmingham, Jan 2004. Disponível em [link].
Heid, U.; Jau, S.; Krüger, K.; Hohmann, A. “Term extraction with standard tools for córpus exploration”. In: 4th International Congress on Terminology and Knowledge Engineering, Wien. August, 1996.
Klavans, J. L.; Muresan, S. “DEFINDER: Rule-Based Methods for the Extraction of Medical Terminology and their Associated Definitions from Online Text”. In: Proceedings of AMIA, 2000.
Klavans, J. L.; Muresan, S. “Evaluation of DEFINDER: A System to Mine Definitions from Consumer-oriented Medical Text”. In: Proceedings of JCDL, 2001a.
Klavans, J. L.; Muresan, S. “Evaluation of the DEFINDER System for Fully Automatic Glossary Construction”. In: Proceedings of AMIA, 2001 b.
Pantel, P.; Lin, D. A statistical corpus-based term extractor. In: E. Stroulia e S. Matwin (Ed.), AI 2001, Lecture Notes in Artificial Intelligence, Springer-Verlag, 2001. p. 36–46.
Pustejovsky, J. The Generative Lexicon. Cambridge: The MIT Press, 1995.
Bolshakova, E. “Recognition of Author’s Scientific and Technical Terms”. LNCS 2004, 2001 p. 281-90.
Bourigault, D. “Surface grammatical analysis for the extraction of terminological noun phrases”. In Proceedings of the 14th International Conference on Computational Linguistics, COLING 1992, 1992. p. 977-981.
Daille, B. “Combined approach for terminology extraction: lexical statistics and linguistic filtering”. PhD thesis, University of Paris 7, 1994.
Estopà Bagot, R. “Extracció de terminologia: elements per a la construcció d’un SEACUSE (Sistema d’Extracció Automàtica de Candidats a Unitats de Significació Especialitzada)”. Tese de Doutorado. Universidade Pompeu Fabra, 1999.
Ha, L.A. “Co-training applied in automatic term extraction: an experiment”. In: 7th Annual CLUK Research Colloquium, University of Birmingham, Jan 2004. Disponível em [link].
Heid, U.; Jau, S.; Krüger, K.; Hohmann, A. “Term extraction with standard tools for córpus exploration”. In: 4th International Congress on Terminology and Knowledge Engineering, Wien. August, 1996.
Klavans, J. L.; Muresan, S. “DEFINDER: Rule-Based Methods for the Extraction of Medical Terminology and their Associated Definitions from Online Text”. In: Proceedings of AMIA, 2000.
Klavans, J. L.; Muresan, S. “Evaluation of DEFINDER: A System to Mine Definitions from Consumer-oriented Medical Text”. In: Proceedings of JCDL, 2001a.
Klavans, J. L.; Muresan, S. “Evaluation of the DEFINDER System for Fully Automatic Glossary Construction”. In: Proceedings of AMIA, 2001 b.
Pantel, P.; Lin, D. A statistical corpus-based term extractor. In: E. Stroulia e S. Matwin (Ed.), AI 2001, Lecture Notes in Artificial Intelligence, Springer-Verlag, 2001. p. 36–46.
Pustejovsky, J. The Generative Lexicon. Cambridge: The MIT Press, 1995.
Publicado
30/06/2007
Como Citar
ZAVAGLIA, Claudia; OLIVEIRA, Leandro Henrique Mendonça de; NUNES, Maria das Graças Volpe; ALUÍSIO, Sandra Maria.
Estrutura Ontológica e Unidades Lexicais: uma aplicação computacional no domínio da Ecologia. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 5. , 2007, Rio de Janeiro/RJ.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2007
.
p. 1575-1584.
