OntoLP: Engenharia de Ontologias em Língua Portuguesa
Resumo
O crescimento das bases digitais e fontes de dados de diversas naturezas (textos, imagens, vídeos, serviços) tem apontado para a necessidade de estruturas mais consistentes de representaçãao do conhecimento para modelar, armazenar, acessar, e comunicar sobre esses recursos. Nesse contexto, as ontologias aparecem como a tecnologia apropriada ao problema. A principal dificuldade na sua utilização em larga escala está no seu processo de construção extremamente custoso. Essa característica estimula pesquisas visando automatizar a tarefa, as quais, em sua maioria, consideram as bases textuais como fontes de conhecimento. As ferramentas e métodos são, nesse caso, dependentes de idioma, pois baseiam-se fortemente no uso de informações linguísticas. Sendo assim, para viabilizar a utilização de ontologias em larga escala, são necessários estudos específicos para cada língua. Este trabalho apresenta a ferramenta OntoLP, desenvolvida como um plug-in para o ambiente Protégé, que faz a análise de um corpus de domínio em língua portuguesa e sugere candidatos a conceitos e hierarquias ao engenheiro de ontologia com base no conhecimento representado nos textos.Referências
Aluísio, S. (2005). Desenvolvimento de uma estrutura conceitual (ontologia) para a área de nanociência e nanotecnologia. Technical Report 2004.1.34165.1.6, Universidade de São Paulo.
Baségio, T. (2006). Uma abordagem semi-automática para identificação de estruturas ontológicas a partir de textos na língua portuguesa do brasil. Master’s thesis, Pontifícia Universidade Católica do Rio Grande do Sul - PUCRS.
Bick, E. (2000). The Parsing System “Palavras”. Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. PhD thesis, Arhus University.
Buitelaar, P., Cimiano, P., and Magnini, B. (2005). Ontology learning from text: An overview. In P-Buitelaar, Cimiano, P., and Magnini, B., editors, Ontology Learning from Text: Methods, Evaluation and Applications, volume 123 of Frontiers in Artificial Intelligence and Applications. IOS Press.
Coulthard, R. J. (2005). The application of corpus methodology to translation: the jped parallel corpus and the pediatrics comparable corpus. Master’s thesis, Programa de Pós-Graduação em Estudos da Tradução, Universidade Federal de Santa Catarina.
Frantzi, K. T., Ananiadou, S., and ichi Tsujii, J. (1998). The c-value/nc-value method of automatic recognition for multi-word terms. In ECDL ’98: Proceedings of the Second European Conference on Research and Advanced Technology for Digital Libraries, pages 585–604, London, UK. Springer-Verlag.
Manning, C. D. and Schütze, H. (1999). Foundations of Statistical Natural Language Processing. The MIT Press, Cambridge, Massachusetts.
Ryu, P.-M. and Choi, K.-S. (2006). Taxonomy learning using term specificity and similarity. In Proceedings of the 2nd Workshop on Ontology Learning and Population: Bridging the Gap between Text and Knowledge, pages 41–48, Sydney, Australia. Association for Computational Linguistics.
Suchanek, F. M., Ifrim, G., and Weikum, G. (2006). Leila: Learning to extract information by linguistic analysis. In Proceedings of the 2nd Workshop on Ontology Learning and Population: Bridging the Gap between Text and Knowledge, pages 18–25, Sydney, Australia. Association for Computational Linguistics.
Zavaglia, C., Aluísio, S., das Graças Volpe Nunes, M., and de Oliveira, L. M. (2007). Estrutura ontológica e unidades lexicais: uma aplicação computacional no domínio da ecologia. In Anais do 5o Workshop em Tecnologia da Informação e da Linguagem Humana, TIL’2007, pages 1575–1584, Rio de Janeiro, Brasil.
Baségio, T. (2006). Uma abordagem semi-automática para identificação de estruturas ontológicas a partir de textos na língua portuguesa do brasil. Master’s thesis, Pontifícia Universidade Católica do Rio Grande do Sul - PUCRS.
Bick, E. (2000). The Parsing System “Palavras”. Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. PhD thesis, Arhus University.
Buitelaar, P., Cimiano, P., and Magnini, B. (2005). Ontology learning from text: An overview. In P-Buitelaar, Cimiano, P., and Magnini, B., editors, Ontology Learning from Text: Methods, Evaluation and Applications, volume 123 of Frontiers in Artificial Intelligence and Applications. IOS Press.
Coulthard, R. J. (2005). The application of corpus methodology to translation: the jped parallel corpus and the pediatrics comparable corpus. Master’s thesis, Programa de Pós-Graduação em Estudos da Tradução, Universidade Federal de Santa Catarina.
Frantzi, K. T., Ananiadou, S., and ichi Tsujii, J. (1998). The c-value/nc-value method of automatic recognition for multi-word terms. In ECDL ’98: Proceedings of the Second European Conference on Research and Advanced Technology for Digital Libraries, pages 585–604, London, UK. Springer-Verlag.
Manning, C. D. and Schütze, H. (1999). Foundations of Statistical Natural Language Processing. The MIT Press, Cambridge, Massachusetts.
Ryu, P.-M. and Choi, K.-S. (2006). Taxonomy learning using term specificity and similarity. In Proceedings of the 2nd Workshop on Ontology Learning and Population: Bridging the Gap between Text and Knowledge, pages 41–48, Sydney, Australia. Association for Computational Linguistics.
Suchanek, F. M., Ifrim, G., and Weikum, G. (2006). Leila: Learning to extract information by linguistic analysis. In Proceedings of the 2nd Workshop on Ontology Learning and Population: Bridging the Gap between Text and Knowledge, pages 18–25, Sydney, Australia. Association for Computational Linguistics.
Zavaglia, C., Aluísio, S., das Graças Volpe Nunes, M., and de Oliveira, L. M. (2007). Estrutura ontológica e unidades lexicais: uma aplicação computacional no domínio da ecologia. In Anais do 5o Workshop em Tecnologia da Informação e da Linguagem Humana, TIL’2007, pages 1575–1584, Rio de Janeiro, Brasil.
Publicado
12/07/2008
Como Citar
RIBEIRO JUNIOR, Luiz Carlos; VIEIRA, Renata.
OntoLP: Engenharia de Ontologias em Língua Portuguesa. In: SEMINÁRIO INTEGRADO DE SOFTWARE E HARDWARE (SEMISH), 35. , 2008, Belém/PA.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2008
.
p. 181-194.
ISSN 2595-6205.
