Descoberta de conhecimento a partir de uma base de indicadores de desenvolvimento social utilizando WEKA

  • Carlos M. Murasse UFPR / SERPRO
  • Denise F. Tsunoda UFPR

Resumo


A partir de um banco de dados com indicadores de desenvolvimento social, foi aplicado um processo de descoberta de conhecimento (KDD) com uso de técnicas de mineração de dados e a ferramenta open source de data mining Weka. Três hipóteses de correlação entre indicadores de economia, demografia e saúde com indicadores de taxa de mortalidade foram testadas. Para um dos casos, foi identificada uma correlação confiável com relação causa-efeito, o que representa uma contribuição concreta para a tomada de decisão e direcionamento de ações futuras do programa de desenvolvimento social ODM.

Referências

AGRAWAL, R.; IMIELIŃSKI,T.; SWAMI, A. Mining association rules between sets of items in large databases, Proceedings of the 1993 ACM SIGMOD international conference on Management of data, p.207-216, Washington, D.C., United States. May 25-28, 1993.

BRAGA, Luis Paulo Vieira. Introdução à Mineração de Dados. 2a edição. Rio de Janeiros:E-Papers, 2005.

FAYYAD, U. PIATETSKY-SHAPIRO, G. and SMYTH, P. From Data Mining to Knowledge Discovery in Databases. AI magazine. P 37-54, 1996.

MARKOV, Z.; RUSSELL, I. An Introduction to the WEKA Data Mining System. Proceedings of the 11th annual SIGCSE conference on Innovation and technology in computer science education. P. 367 - 368. Bologna, Italy, 2006.

MARTINHAGO, S. Descoberta de Conhecimento sobre o Processo Seletivo da UFPR. Dissertação de Mestrado. Curitiba, 2005.

NAVEGA, Sergio. Princípios essenciais do Data Mining. Anais do Infoimagem 2002. Cenadem, 2002.

PNUD. Objetivos de Desenvolvimento do Milênio. Disponível em: [link]. Acessado em: 16/12/2009.

QUINLAN, J. R. C4.5: Programs for Machine Learning. San Mateo, CA: Morgan Kaufmann Publishers, 1993.

ROMÃO, W. Descoberta de conhecimento relevante em banco de dados sobre ciência e tecnologia. Tese (Doutorado) - Curso de Pós-Graduação em Engenharia de Produção da Universidade Federal de Santa Catarina, Florianópolis, 2002.

SHANNON, C. E. A Mathematical Theory of Communication. Bell System Technical Journal. Vol. 27, pp. 379–423, 623–656, July, October, 1948.

SILVA, M.P. Mineração de Dados - Conceitos, Aplicações e Experimentos com Weka. Em Escola Regional de Informática RJ/ES, v. 1, pp. 19-21. Sociedade Brasileira de Computação, 2004.
Publicado
20/07/2010
MURASSE, Carlos M.; TSUNODA, Denise F.. Descoberta de conhecimento a partir de uma base de indicadores de desenvolvimento social utilizando WEKA. In: LATIN AMERICAN SYMPOSIUM ON DIGITAL GOVERNMENT (LASDIGOV), 2. , 2010, Belo Horizonte/MG. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2010 . p. 609-621. ISSN 2763-8723.