CandiDATA: um dataset para análise das eleições no Brasil

  • Felipe F. Vasconcelos Universidade Federal de Alagoas (UFAL)
  • João V. S. Tavares Universidade Federal de Alagoas (UFAL)
  • Murilo U. Ribeiro Universidade Federal de Alagoas (UFAL)
  • Fabio J. Coutinho Universidade Federal de Alagoas (UFAL) https://orcid.org/0000-0002-9892-023X
  • João Paulo Clarindo Universidade de São Paulo (USP)

Resumo


O Tribunal Superior Eleitoral (TSE), responsável pelas eleições no Brasil, disponibiliza dados acerca de candidatos e partidos que disputaram o pleito eleitoral desde 1933. Esses dados constituem um importante acervo, sendo utilizados como base por trabalhos em diferentes áreas de pesquisa. Entretanto, os dados disponibilizados pelo TSE possuem diversos problemas relacionados à falta de padronização e inconsistência, dificultando a análise e a integração com bases externas. Este trabalho apresenta CandiDATA, um dataset padronizado com dados das eleições brasileiras. CandiDATA é disponibilizado em formato aberto e abrange o período eleitoral entre 1945 e 2020, incluindo informações adicionais, além dos dados do TSE.
Palavras-chave: coleção de dados, dados de eleições, transformação de dados, padronização, inferência

Referências

Araújo, C. (2009). Gênero e acesso ao poder legislativo no Brasil: as cotas entre as instituições e a cultura. Revista Brasileira de Ciência Política, 2:23.

Barbosa, C. d. F., Cavalcanti, V. R. S., et al. (2009). Mulher na política: uma avaliação contemporânea. SEMOC-Semana de Mobilização Científica-Segurança: A paz é o fruto da justiça.

Camargo, A., Silva, R., Amaral, E., Heinen, M., and Pereira, F. (2016). Mineração de dados eleitorais: descoberta de padrões de candidatos a vereador na região da campanha do rio grande do sul. Revista Brasileira de Computação Aplicada, 8(1):64–73.

CEPESP, F. (2020). Cepespdata - banco de dados políticos. https://empregabrasil.mte.gov.br/76/cbo/. [Online; acesso em ago. 12].

Clarindo, J. P., Fontes, W., and Coutinho, F. (2019). Qualisus: um dataset sobre dados da saúde pública no Brasil. In Proceedings of the Sattelite Events of 34h Brazilian Symposium on Databases.

Economist, T. (2021). Global democracy has a very bad year.

Filho, R. M. and Pappa, G. L. (2015). pg. 137-142. In PROCEEDINGS OF SATELLITE EVENTS OF THE 30TH BRAZILIAN SYMPOSIUM ON DATABASES, page 1–320.

MTE (2020). Classificação brasileira de ocupações. https://empregabrasil.mte.gov.br/76/cbo/. [Online; acesso em ago. 11].

Shafranovich, Y. (2005). Common Format and MIME Type for Comma-Separated Values (CSV) Files. RFC 4180, RFC Editor.

Speck, B. and Speck, B. (2012). A filiação partidária no Brasil. uma análise exploratória a partir de dados do TSE e do wvs. In Anais do 8º encontro da Associação Brasileira de Ciência Política, page 21.

Tribunal Superior Eleitoral (2016). Urna eletrônica: 20 anos a favor da democracia. Tribunal Superior Eleitoral, pages 1–41.

TSE (2020). Repositório de dados eleitorais. https://www.tse.jus.br/eleicoes/estatisticas/repositorio-de-dados-eleitorais-1. [Online; acesso em ago. 11].
Publicado
04/10/2021
Como Citar

Selecione um Formato
VASCONCELOS, Felipe F.; TAVARES, João V. S.; RIBEIRO, Murilo U.; COUTINHO, Fabio J.; CLARINDO, João Paulo. CandiDATA: um dataset para análise das eleições no Brasil. In: DATASET SHOWCASE WORKSHOP (DSW), 3. , 2021, Rio de Janeiro. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 160-168. DOI: https://doi.org/10.5753/dsw.2021.17424.