Transparência pública automatizada a partir da gramática do diário oficial

  • Fernando Antonio D. G. Pinto PUC-Rio
  • Edward Hermann Haeusler PUC-Rio
  • Sérgio Lifschitz PUC-Rio

Resumo


Múltiplas fontes e o crescente volume de dados levam à necessidade por novos modelos de gestão da informação. Uma das principais fontes está nos diários oficiais e sua extração, bem como sua interpretação, se apresentam como uma interessante alternativa. Geralmente, estes diários são disponibilizados em formato fechado, o que dificulta a extração das informações. Este artigo apresenta DO2RDF, um novo mecanismo que auxilia a transparência ao construir uma base de conhecimento de dados públicos de acordo com a gramática do diário oficial. O escopo ficou restrito às publicações que envolvem movimentações de pessoal nos últimos 9 anos. O resultado foi uma Base de Conhecimento RDF de 24.745 atos públicos para consultas SPARQL
Palavras-chave: Transparência, RDF, Base de Conhecimento

Referências

Aho, A. V., Lam, M. S., Sethi, R., and Ullman, J. D. (2006). Compilers: Principles, Techniques, and Tools (2nd Edition). Addison-Wesley Longman Publishing Co., Inc., USA.

AllegroGraph (2019). Allegrograph - The Enterprise Knowledge Graph.https://allegrograph.com. Acessado: 11-12-2019.

Amato, F., Mazzeo, A., Penta, A., and Picariello, A. (2008). Building rdf ontologiesfrom semi-structured legal documents. In2008 International Conference on Complex,Intelligent and Software Intensive Systems, pages 997–1002.

Baader, F., Horrocks, I., and Sattler, U. (2008). Chapter 3 description logics. In vanHarmelen, F., Lifschitz, V., and Porter, B., editors,Handbook of Knowledge Represen-tation, volume 3 ofFoundations of Artificial Intelligence, pages 135–179. Elsevier.

Barman, R., Deshpande, S., Agarwal, S., Inamdar, U., Devare, M., and Patil, A. (2019).Transfer learning for small dataset. InProceedings of National Conference on MachineLearning, pages 132–137.

Barzdins, G., Gosko, D., Barzdins, P. F., Lavrinovics, U., Bernans, G., and Celms, E.(2019). Rdf* graph database as interlingua for the textworld challenge. In2019 IEEEConference on Games (CoG), pages 1–2.

Brasil (1995). Emenda Constitucional nº 9, de 9 de novembro de 1995. Diário Oficial [da] República Federativa do Brasil, 59:1966.

Brasil (2011). Lei nº. 12.527. Lei de Acesso à Informação. Diário Oficial [da] República Federativa do Brasil.

Brasil (2018). Lei nº. 13.709. Lei Geral de Proteção de Dados pessoais. Diário Oficial [da] República Federativa do Brasil

Brasil (2019). Lei nº. 13.853. Lei Geral de Proteção de Dados pessoais. Diário Oficial [da] República Federativa do Brasil.

Brickley, D. and Miller, L. (2014). FOAF Vocabulary Specification 0.99.http://www.foaf-project.org/. Acessado: 03-12-2019.

Buil-Aranda, C., Hogan, A., Umbrich, J., and Vandenbussche, P.-Y. (2013). Sparql web-querying infrastructure: Ready for action? In Alani, H., Kagal, L., Fokoue, A., Groth,P., Biemann, C., Parreira, J. X., Aroyo, L., Noy, N., Welty, C., and Janowicz, K.,editors,The Semantic Web – ISWC 2013, pages 277–293, Berlin, Heidelberg. SpringerBerlin Heidelberg.

Delfino, P., Cuconato, B., Haeusler, E. H., and Rademaker, A. (2017). Passing the brazi-lian OAB exam: Data preparation and some experiments. In Wyner, A. Z. and Casini,G., editors,Legal Knowledge and Information Systems - JURIX 2017: The ThirtiethAnnual Conference, Luxembourg, 13-15 December 2017, volume 302 ofFrontiers inArtificial Intelligence and Applications, pages 89–94. IOS Press.

Douglas, K. and Douglas, S. (2003).PostgreSQL. New Riders Publishing, USA.

Friedman, C., Rindflesch, T. C., and Corn, M. (2013). Natural language processing: Stateof the art and prospects for significant progress, a workshop sponsored by the nationallibrary of medicine.Journal of Biomedical Informatics, 46(5):765–773.

Group, R. W. (2014). Resource Description Framework (RDF).https://www.w3.org/RDF/. Acessado: 11-10-2019.

Haeusler, E. H., d. Paiva, V., and Rademaker, A. (2010). Intuitionistic logic and legalontologies.Conference: Legal Knowledge and Information Systems - JURIX 2010.

Haeusler, E. H., d. Paiva, V., and Rademaker, A. (2011). Intuitionistic description logicand legal reasoning. In 2011 22nd International Workshop on Database and ExpertSystems Applications, pages 345–349.

Isotani, S. and Bittencourt, I. (2015).Dados Abertos Conectados: em Busca da Web do Conhecimento. Novatec

Junior, R., Melo, W., Fagundes, R., and Maciel, A. (2018). Extração de informação e mineração de dados no diário oficial de pernambuco. Revista de Engenharia e Pesquisa Aplicada, 3.

Najmi, E., Malik, Z., Hashmi, K., and Rezgui, A. (2016). Conceptrdf: An rdf presentationof conceptnet knowledge base. In2016 7th International Conference on Informationand Communication Systems (ICICS), pages 145–150.

Rodríguez, M., Dantas Bezerra, B (2019). Processamento de linguagem natural parareconhecimento de entidades nomeadas em textos jurídicos de atos administrativos (portarias). Revista de Engenharia e Pesquisa Aplicada, 5(1):67–77.

Team, R. (2013). RDFLib.https://rdflib.readthedocs.io/en/stable/#.Acessado: 13-11-2019.
Publicado
18/07/2021
Como Citar

Selecione um Formato
PINTO, Fernando Antonio D. G.; HAEUSLER, Edward Hermann; LIFSCHITZ, Sérgio. Transparência pública automatizada a partir da gramática do diário oficial. In: WORKSHOP DE COMPUTAÇÃO APLICADA EM GOVERNO ELETRÔNICO (WCGE), 9. , 2021, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 59-70. ISSN 2763-8723. DOI: https://doi.org/10.5753/wcge.2021.15977.