Arquitetura Automatizada de Data Warehouse para Acesso ao Conhecimento Tecnológico em Bases de Patentes

  • Rodrigo Ramos Nogueira UFSC
  • Alexandre Leopoldo Gonçalves UFSC
  • Tobias Felipe Kiefer UFSC

Resumo


Este artigo apresenta uma arquitetura automatizada de Data Warehouse voltada à análise de patentes técnicas da USPTO, estruturadas em arquivos XML. A proposta inclui um processo completo de ETL com enriquecimento semântico e modelagem multidimensional, permitindo consultas OLAP e integração com algoritmos de Inteligência Artificial. Mesmo com uma amostra reduzida de dados, foram realizadas análises de termos técnicos e previsões com redes neurais, evidenciando o potencial do modelo em apoiar a gestão do conhecimento tecnológico. Os resultados demonstram a aplicabilidade da solução para inteligência competitiva e identificação de tendências emergentes em ambientes de inovação.
Palavras-chave: Data Warehouse, ETL, Patentes, OLAP, Inteligência Artificial, Gestão do Conhecimento, Modelagem Dimensional, Análise Tecnológica

Referências

WIPO – World Intellectual Property Organization. World Intellectual Property Indicators 2023. Disponível em: [link]

R. R. Nogueira e A. L. G. Gonçalves, Aspectos técnicos e tecnológicos relacionados à análise de patentes: uma revisão integrativa. Anais do Simpósio de Pesquisa e Extensão (SIMPEX), SENAI, 2025.

S. Peng et al., Automated patent analysis: NLP for structured and unstructured patent data, Proceedings of the PatentSemTech Workshop at CLEF 2021, CEUR Workshop Proceedings, 2020.

R. Krestel, T. I. Bajwa, R. Drewes, Automated patent analysis: NLP for structured and unstructured patent data, CLEF 2021.

R. Kimball, M. Ross, The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 3rd ed., Wiley, 2013.

W. H. Inmon, Building the Data Warehouse, 4th ed., Wiley, 2005.

P. Gupta et al., Automatic Text Summarization Using Sequence-to-Sequence Model and Recurrent Neural Network, Computación y Sistemas, vol. 28, n. 4, 2024.

W. M. F. Zaini, D. T. C. Lai, R. Chong Lim, Identifying patent classification codes associated with specific search keywords using machine learning, World Patent Information, vol. 71, 2022.

Y. Zhao et al., Keyword extraction techniques for patent text analysis, 2019.

S. Björkqvist, J. Kallio, Building a graph-based patent search engine, Proc. of the 46th Int. ACM SIGIR Conf., 2023, pp. 3300–3304.

Y. Zhou et al., Forecasting emerging technologies with deep learning and data augmentation: convergence emerging technologies vs non-convergence emerging technologies, Proc. of 6th Int. Conf. on Future-Oriented Technology Analysis (FTA), 2019.

S. M. González, T. C. Sakata, R. R. Nogueira, Newsminer: Enriched Multidimensional Corpus for Text-Based Applications, ICAISC 2020, Part II, Springer, 2020, pp. 231–242.

R. M. Almeida, Ferramentas de Business Intelligence Open Source aplicadas à gestão do conhecimento em instituições de ensino superior, Revista GUAL, vol. 4, n. 2, pp. 145–164, 2011.

P. Vyas, Demystifying Dimensional Modeling for Modern Data Warehousing, Journal of Computer Science and Technology Studies, vol. 7, n. 2, pp. 174–180, 2025.
Publicado
22/10/2025
NOGUEIRA, Rodrigo Ramos; GONÇALVES, Alexandre Leopoldo; KIEFER, Tobias Felipe. Arquitetura Automatizada de Data Warehouse para Acesso ao Conhecimento Tecnológico em Bases de Patentes. In: CONGRESSO LATINO-AMERICANO DE SOFTWARE LIVRE E TECNOLOGIAS ABERTAS (LATINOWARE), 22. , 2025, Foz do Iguaçu/PR. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 902-905. DOI: https://doi.org/10.5753/latinoware.2025.16559.