Um Método Não Supervisionado para o Povoamento de Ontologias a partir de Fontes Textuais na Web

  • Fábio Lima Universidade Federal da Bahia
  • Hilário Oliveira Universidade Federal de Pernambuco
  • Laís Salvador Universidade Federal da Bahia

Resumo


O crescimento na produção e disponibilização de informa- ções não estruturadas na Web aumenta diariamente. Essa abundância de informações desestruturadas representa um grande desafio para a aquisição de conhecimento que seja processado por seres humanos e também por máquinas. Nesse sentido, ao longo dos anos diversas abordagens têm sido propostas para a extração automática de informações a partir de textos escritos em linguagem natural. Contudo, ainda existem poucos estudos que investigam a extração de informações a partir de textos escritos em português. Diante disso, o objetivo deste trabalho é propor e avaliar um método não supervisionado para o povoamento de ontologias utilizando a Web como grande fonte de informações, no contexto da língua Portuguesa. Os resultados obtidos com os experimentos realizados foram encorajadores e demonstraram que a abordagem proposta obteve uma taxa de precisão média de 67% na extração de instâncias de classes ontológicas.

Palavras-chave: Ontologias, Povoamento de Ontologias, Extração de Informações

Referências

A. Carlson, J. Betteridge, B. Kisiel, B. Settles, E. R. Hruschka, and T. M. Mitchell. Toward an architecture for never-ending language learning. In In AAAI, 2010.

A. Maedche and S. Staab. Ontology learning for the semantic web. Intelligent Systems, IEEE, 16(2):72–79, Mar 2001.

C. C. a. Xavier and V. L. S. d. Lima. A Semi-Automatic Method for Domain Ontology Extraction from Portuguese Language Wikipedia’s Categories.

C. G. d. F. Alves. Um Processo Independente de Domínio para o Povoamento Automático de Ontologias a partir de Fontes Textuais. 2013.

D. C. Wimalasuriya. Ontology-based information extraction: An introduction and a survey of current approaches. Journal of Information Science, 36(3):306–323, Mar. 2010.

D. Maynard, Y. Li, and W. Peters. Nlp techniques for term extraction and ontology population. In Proceedings of the 2008 Conference on Ontology Learning and Population: Bridging the Gap Between Text and Knowledge, pages 107–127, Amsterdam, The Netherlands, The Netherlands, 2008. IOS Press.

E. N. Motta. Preenchimento Semi-automático de Ontologis de Domínio a Partir de Textos em Língua Portuguesa. Master’s thesis.

F. M. Zahra, D. R. Carvalho, and A. Malucelli. Poronto : ferramenta para construção semiautomática de ontologias em português Poronto : herramienta para construcción semiautomática de ontologías en portugués. journal of Health Informatics, 5(2):52–59, 2013.

G. Petasis, V. Karkaletsis, G. Paliouras, A. Krithara, and E. Zavitsanos. Ontology population and enrichment: State of the art. In G. Paliouras, C. Spyropoulos, and G. Tsatsaronis, editors, Knowledge-Driven Multimedia Information Extraction and Ontology Evolution, volume 6050 of Lecture Notes in Computer Science, pages 134–166. Springer Berlin Heidelberg, 2011.

H. Tomaz, R. Lima, J. Emanoel, and F. Freitas. An unsupervised method for ontology population from the web. In J. Pavón, N. Duque-Méndez, and R. Fuentes-Fernández, editors, Advances in Artificial Intelligence – IBERAMIA 2012, volume 7637 of Lecture Notes in Computer Science, pages 41–50. Springer Berlin Heidelberg, 2012.

L. Drumond and R. Girardi. Extracting ontology concept hierarchies from text using markov logic. In Proceedings of the 2010 ACM Symposium on Applied Computing, SAC ’10, pages 1354–1358, New York, NY, USA, 2010. ACM.

L. K. McDowell and M. Cafarella. Ontology-driven, unsupervised instance population. Web Semant., 6(3):218–236, Sept. 2008.

M. A. Hearst. Automatic Acquisition of Hyponyms from Large Text Corpora. pages 23–28, 1992.

O. Etzioni, S. Kok, S. Soderland, M. Cafarella, A. m. Popescu, D. S. Weld, D. Downey, T. Shaked, and A. Yates. Web-Scale Information Extraction in KnowItAll (Preliminary Results). pages 100–110, 2004.

P. Cimiano, S. Handschuh, and S. Staab. Towards the self-annotating web. Proceedings of the 13th conference on World Wide Web - WWW ’04, page 462, 2004.

P. Turney. Mining the web for synonyms: Pmi-ir versus lsa on toefl. 2001.

S. Studer, S. Rudi, H.-P. Schnurr, and Y. SURE. Knowledge processes and ontologies. IEEE Intelligent Systems, 1(16):26–34, 2001.

T. L. Baségio. Uma Abordagem Semi-automática para Identificação de Estruturas Ontológicas a partir de Textos na Língua Portuguesa do Brasil. pages 1–124, 2007.
Publicado
26/05/2015
Como Citar

Selecione um Formato
LIMA, Fábio; OLIVEIRA, Hilário; SALVADOR, Laís. Um Método Não Supervisionado para o Povoamento de Ontologias a partir de Fontes Textuais na Web. In: SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 11. , 2015, Goiânia. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2015 . p. 163-170. DOI: https://doi.org/10.5753/sbsi.2015.5813.