Sistema Inteligente de Apoio à Análise Crítica da Atuação do Corpo Parlamentar
Resumo
Neste trabalho é proposto um método para análise e processamento das notícias divulgadas pelo sítio Web da Assembleia Legislativa do Estado de Sergipe utilizando um processo de mineração de texto e sendo re-aplicável a câmaras de outros estados da federação. O objetivo é facilitar ao eleitor a documentação dessas notícias e fornecer apoio à decisão sobre qual candidato a deputado estadual depositar seu voto. A análise consiste na categorização automática das notícias em rótulos pré-determinados que, alinhado a outros dados, medem a atuação do parlamentar ao longo do seu mandato através da formalização de um índice de avaliação, denominado de QoP (Quality of Parlamentarian). Diferentes técnicas de categorização foram utilizadas e o algoritmo Naive Bayes Multinomial com frequência mínima de corte igual a 0 (zero) obteve a maior taxa de acerto, na ordem de 84%. O índice QoP mostrou-se eficaz para o ranqueamento dinâmico de deputados de acordo com a aferição de sua qualidade em termos quantitativos e qualitativos. Uma aplicação Web foi desenvolvida e permite que eleitores visualizem o ranqueamento padrão, bem como gerar ranqueamentos alternativos e personalizados através de uma interface para modificação de pesos da fórmula de cálculo do índice
Referências
KONCHADY, Manu. Text Mining Application Programming. Boston: Ed. Thomson, 2006. 412 p. 95
LEHAL, Gurppreet S. GUPTA, Vishal. A Survey of Text Mining Techniques and Applications. Journal of Emerging Technologies in Web Intelligence, Vol 1, No 1, 60-76, 2009.
PAK, Albert Frederico de Menezes Il. Aplicação de Técnicas de Mineração de Texto para Categorização de Eventos de Segurança no CTIR Gov. 2010. Xi, 71 f. Dissertação (Mestrado em Informática) – Universidade Federal de Brasília, Brasília, 2010.
RIZZI, Claudia Brandelero (2000). et al. Fazendo uso da categorização de textos em atividades empresariais. Disponível em: <http://leandro.wives.nom.br/ptbr/publicacoes/iskmdm2000-2.pdf>. Acesso em: 29 mar. 2011.
OLIVEIRA, C. J. S. & ARAÚJO, A. de A. Classificando Imagens Coletadas na World Wide Web em duas Classes Semânticas: Imagens Gráficas e Imagens Fotográficas, Relatório Técnico RT.DCC.006/2002, DCC/ICEx/UFMG, Belo Horizonte, MG, Brasil, Dezembro, 2002, 29p.
STEINBRUCH, David. Um estudo de Algoritmos para Classificação Automática de Textos Utilizando naive-Bayes. Pontifícia Universidade Católica, Rio de Janeiro, RJ, 2006.
TOMAZELA, Maria das Graças J. M.; DANIEL, Luiz Antônio. Uma Estratégia de Preparação de Dados para Aumento de Precisão de Modelos de Classificação da Produtividade de Cana-de-açucar. Faculdade de Tecnologia de Indaiatuba, Indaiatuba, SP, 2011.
WITTEN, Ian H.; FRANK, Eibe; HALL, Mark A. Data Mining: Practical Machine Learning Tools and Techniques. 3rd edition. Hamilton, New Zealand: Ed. Morgan 2011. Kaupmann,