LLMs na Geração de Mapeamentos Semânticos: Experimento no domínio de Plantas Industriais
Resumo
A aplicação de Grafos de Conhecimento (KGs) tem ganhado destaque na implementação de soluções em diversas áreas. Na indústria de Óleo e Gás, seu uso é de interesse devido à heterogeneidade dos dados presentes nos softwares de apoio a plantas industrias. Como recursos de padronização desta industria, destaca-se Bibliotecas de dados de Referências disponibilizadas por organizações internacionais e o uso da Ontologia de Dados Industriais (IDO). No entanto, aplicar esses padrões exige estender a IDO com o mapeamento de conceitos específicos do domínio. Neste contexto, este trabalho propõe o estudo sobre o uso de Modelos de Linguagem de Grande Escala (LLMs) como assistente auxiliando a compreensão e sugerindo mapeamentos semânticos.
Referências
Brewton, B. (2023). How Using Knowledge Graphs can Optimize the Oil and Gas Industry. [link]. Acessado em 27/06/2025.
Cao, L., Sun, J., and Cross, A. (2024). An automatic and end-to-end system for rare disease knowledge graph construction based on ontologies-enhanced large language models. [link]. Acessado em 27/06/2025.
Carta, S., Giuliani, A., Manca, M. M., Piano, L., and Tiddia, S. G. (2024). Towards zero-shot knowledge graph building: Automated schema inference. In Adjunct Proceedings of the 32nd ACM Conference on User Modeling, Adaptation and Personalization, page 467–473. Association for Computing Machinery.
Cremaschi, M., D’Adda, F., and Maurino, A. (2025). steellm: An llm for generating semantic annotations of tabular data. ACM Trans. Intell. Syst. Technol. Just Accepted.
Ehrlinger, L. and Wöß, W. (2016). Towards a definition of knowledge graphs. In Martin, M., Cuquet, M., and Folmer, E., editors, Joint Proceedings of the Posters and Demos Track of the 12th International Conference on Semantic Systems - SEMANTiCS2016, volume 1695 of CEUR Workshop Proceedings.
Huang, S., Wang, Y., and Yu, X. (2020). Design and implementation of oil and gas information on intelligent search engine based on knowledge graph. Journal of Physics: Conference Series, 1621:012010.
Korinek, A. (2023). Language models and cognitive automation for economic research. Working Paper 30957, National Bureau of Economic Research. Acessado em 27/06/2025.
Moor, M., Banerjee, O., Abad, Z. S. H., Krumholz, H. M., Leskovec, J., Topol, E. J., and Rajpurkar, P. (2023). Foundation models for generalist medical artificial intelligence. Nature, 616(7956):259–265.
Sequeda, J., Allemang, D., and Jacob, B. (2025). Knowledge graphs as a source of trust for llm-powered enterprise question answering. Journal of Web Semantics, 85:100858.
Song, S., Yang, C., Xu, L., Shang, H., Li, Z., and Chang, Y. (2024). Travelrag: A tourist attraction retrieval framework based on multi-layer knowledge graph. ISPRS International Journal of Geo-Information, 13(11).
Tupayachi, J., Xu, H., Omitaomu, O. A., Camur, M. C., Sharmin, A., and Li, X. (2024). Towards next-generation urban decision support systems through ai-powered construction of scientific ontology using large language models—a case in optimizing intermodal freight transportation. Smart Cities, 7(5):2392–2421.
Zheng, T., Deng, Z., Tsang, H. T., Wang, W., Bai, J., Wang, Z., and Song, Y. (2025). From automation to autonomy: A survey on large language models in scientific discovery. [link]. Acessado em 27/06/2025.
