Uma estratégia para a identificação e extração de dados de patentes brasileiras
Resumo
Este artigo tem como principal objetivo apresentar uma estratégia para a identificação e extração de dados de patentes brasileiras, tais como título, resumo, data de depósito, data de publicação, inventores, proprietários dentre outras. Viabilizando assim a construção de uma base de dados local da produção técnica brasileira, possibilitando análises do grande volume de dados em um menor tempo, uma vez que a análise será local e não em repositórios online de patentes. Bem como a solução para diversos limites impostos por repositórios online, dentre eles podemos citar o limite no volume de acesso à dados e conectividade com a internet. Utilizando como principais fontes o Instituto Nacional da Propriedade Industrial (INPI) e o repositório internacional de patentes Espacenet, de reconhecida relevância internacional.
Referências
ESPECENET. Espacenet patent search. 2021. Disponível em: <https://worldwide.espacenet.com/patent/>.
MITCHELL, R.Web Scraping com Python: Coletando mais dados da web moderna. second. [S.l.]: Novatec Editora., 2019.
SERRANO, B. P.; JUNIOR, J. A. G. Redes de inovação: mapeamento de inventores de patentes em uma empresa do setor de cosméticos. Revista GEPROS, v. 09, n. 1, p. 101,jan 2014.
UECE, U. F. do C.INPI - Saiba mais sobre a nova numeração nos pedidos da DIRPA e da DICIG. 2011. Acessado em 11 de maio de 2021. Disponível em: [link].
ZHAO, B. Web scraping.Springer International Publishing, p. 1-3, may 2017. Disponível em: <https://www.researchgate.net/publication/317177787_Web_Scraping>. Acesso em: 07 mai. 2021.