Big Data e Transparência: Utilizando Funções de Mapreduce para incrementar a transparência dos Gastos Públicos

  • Eduardo de Paiva Universidade Federal do Estado do Rio de Janeiro - UNIRIO
  • Kate Revoredo Universidade Federal do Estado do Rio de Janeiro - UNIRIO

Resumo


Atualmente todos os entes governamentais devem manter portais de transparência que evidenciem a arrecadação de receitas e as despesas executadas diariamente. No entanto, a mera disponibilização dessas informações em portais governamentais não assegura um aumento efetivo do grau de transparência desses entes, pois o grande volume de dados aliado à falta de padrões torna inviável qualquer tipo de acompanhamento sistemático desses dados. Este artigo sugere a aplicação de técnicas de programação paralela baseadas no paradigma de programação mapreduce para fazer a identificação de um conjunto prédeterminado de produtos comprados pela Administração Pública, além de propor uma forma de consolidação dessas informações de maneira que permita a fácil visualização de disparidades encontradas no grande volume de dados apresentados. A solução proposta foi testada em um estudo de caso executado no Portal da Transparência do Governo Federal. Os resultados obtidos apontaram que tais técnicas se constituem promissoras ferramentas para questões ligadas às áreas de transparência, que normalmente tratam grandes volumes de dados, mas que nem sempre apresentam informações de qualidade.

Palavras-chave: Transparência pública, Big data, Mineração de texto

Referências

Agner L. Governo eletrônico e transparência do Estado. Revista Webinsider, Brasília. 2008;

BRASIL. CONSTITUIÇÃO DA REPÚBLICA FEDERATIVA DO BRASIL DE 1988 [Internet]. Constituição Federal, de 5 de outubro de 1988. Recuperado de: http://www.planalto.gov.br/ccivil_03/constituicao/constituicaocompilado.htm

BRASIL. Disponibilização em tempo real de Informações [Internet]. Lei Complementa no 131 de 27 de maio de 2009. Recuperado de: https://www.planalto.gov.br/ccivil_03/leis/lcp/lcp131.htm

BRASIL. Lei 4320 [Internet]. Lei no 4320, de 18 março de 1964. Recuperado de: http://www.planalto.gov.br/ccivil_03/leis/l4320.htm

Carvalho RN, Sales L, Da Rocha HA, Mendes GL. Using Bayesian Networks to Identify and Prevent Split Purchases in Brazil. In: BMA@ UAI. 2014. p. 70–8.

Cloud AEC. Amazon web services. Retrieved November. 2011;9:2011.

Controladoria Geral da União. Portal da Transparência nos Recursos Públicos Federais [Internet]. 2004 [citado 18 de abril de 2015]. Recuperado de: http://transparencia.gov.br/

Dean J, Ghemawat S. Mapreduce: Simplified data processing on large clusters, osdi’04: Sixth symposium on operating system design and implementation, san francisco, ca, december, 2004. S Dill, R Kumar, K McCurley, S Rajagopalan, D Sivakumar, ad A Tomkins, Self-similarity in the Web, Proc VLDB. 2001;

Dean J, Ghemawat S. MapReduce: simplified data processing on large clusters. Communications of the ACM. 2008;51(1):107–13.

Etzioni O, Cafarella M, Downey D, Popescu A-M, Shaked T, Soderland S, et al. Unsupervised named-entity extraction from the web: An experimental study. Artificial intelligence. 2005;165(1):91–134.

Feijó. Curso de SIAFI: uma abordagem prática da execução orçamentária e financeira. 2006.

Gupta R, Gupta H, Mohania M. Cloud computing and big data analytics: what is new from databases perspective? In: Big Data Analytics. Springer; 2012. p. 42–61.

Lin J, Dyer C. Data-intensive text processing with MapReduce. Synthesis Lectures on Human Language Technologies. 2010;3(1):1–177.

Manyika J, Chui M, Bughin J, Dobbs R, Bisson P, Marrs A. McKinsey Global Institute D. 2013;

Marzagão T. Using SVM to pre-classify government purchases. arXiv preprint arXiv:160102680. 2015;

Ministério do Planejamento. Portal de Dados Abertos do Governo Brasileiro [Internet]. 2012 [citado 15 de janeiro de 2016]. Recuperado de: http://dados.gov.br/

Munková D, Munk M, Vozár M. Data pre-processing evaluation for text mining: Transaction/sequence model. Procedia Computer Science. 2013;18:1198–207.

Rommel, Carvalho, de Paiva E, da Rocha H, Mendes G. Methodology for Creating the Brazilian Government Reference Price Database. 2013; Recuperado de: http://www.lbd.dcc.ufmg.br/colecoes/eniac/2013/0033.pdf

Rommel Carvalho, Eduardo de Paiva, Henrique da Rocha, Gilson Mendes. Using Clustering and Text Mining to Create a Reference Price Database. Learning and NonLinear Models. 2014;12:38–52.

Taurion C. Big data. Brasport; 2013.

White T. Hadoop: The definitive guide. O’Reilly Media, Inc.; 2012.
Publicado
17/05/2016
DE PAIVA, Eduardo; REVOREDO, Kate. Big Data e Transparência: Utilizando Funções de Mapreduce para incrementar a transparência dos Gastos Públicos. In: SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 12. , 2016, Florianópolis. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2016 . p. 025-032. DOI: https://doi.org/10.5753/sbsi.2016.5942.