Uma estratégia para a identificação e extração de dados de patentes brasileiras

  • Raulivan Rodrigo da Silva CEFET-MG
  • Thiago Magela Rodrigues Dias CEFET-MG
  • Washington Luís Ribeiro de Carvalho Segundo IBICT

Resumo


Este artigo tem como principal objetivo apresentar uma estratégia para a identificação e extração de dados de patentes brasileiras, tais como título, resumo, data de depósito, data de publicação, inventores, proprietários dentre outras. Viabilizando assim a construção de uma base de dados local da produção técnica brasileira, possibilitando análises do grande volume de dados em um menor tempo, uma vez que a análise será local e não em repositórios online de patentes. Bem como a solução para diversos limites impostos por repositórios online, dentre eles podemos citar o limite no volume de acesso à dados e conectividade com a internet. Utilizando como principais fontes o Instituto Nacional da Propriedade Industrial (INPI) e o repositório internacional de patentes Espacenet, de reconhecida relevância internacional.

Palavras-chave: Coleta, Patente, INP, Espacenet

Referências

BRANDÃO, F. G. Democratização da informação a partir do uso de repositórios digitais institucionais: da comunicação científica à s informações tecnológicas de patentes. Dissertação (Mestrado) - Universidade Regional Integrada do Alto Uruguai e das Missões, sep 2016. Disponível em: <https://lume.ufrgs.br/handle/10183/179853>. Acesso em: 24 mar. 2021

ESPECENET. Espacenet patent search. 2021. Disponível em: <https://worldwide.espacenet.com/patent/>.

MITCHELL, R.Web Scraping com Python: Coletando mais dados da web moderna. second. [S.l.]: Novatec Editora., 2019.

SERRANO, B. P.; JUNIOR, J. A. G. Redes de inovação: mapeamento de inventores de patentes em uma empresa do setor de cosméticos. Revista GEPROS, v. 09, n. 1, p. 101,jan 2014.

UECE, U. F. do C.INPI - Saiba mais sobre a nova numeração nos pedidos da DIRPA e da DICIG. 2011. Acessado em 11 de maio de 2021. Disponível em: [link].

ZHAO, B. Web scraping.Springer International Publishing, p. 1-3, may 2017. Disponível em: <https://www.researchgate.net/publication/317177787_Web_Scraping>. Acesso em: 07 mai. 2021.
Publicado
13/10/2021
SILVA, Raulivan Rodrigo da; DIAS, Thiago Magela Rodrigues; CARVALHO SEGUNDO, Washington Luís Ribeiro de. Uma estratégia para a identificação e extração de dados de patentes brasileiras. In: CONGRESSO LATINO-AMERICANO DE SOFTWARE LIVRE E TECNOLOGIAS ABERTAS (LATINOWARE), 18. , 2021, Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 31-36. DOI: https://doi.org/10.5753/latinoware.2021.19902.