Experimentação na Indústria para Aumento da Efetividade da Construção de Procedimentos ETL em um Ambiente de Business Intelligence
Resumo
Aplicações de Business Intelligence (BI) efetivas dependem de um Data Warehouse (DW), um repositório histórico de dados projetado para dar suporte a processos de tomada de decisão. Sem um DW eficiente, as organizações não podem extrair, em um tempo aceitável, os dados que viabilizam ações estratégicas, táticas e operacionais mais eficazes. Ambientes de BI possuem um processo de Engenharia de Software particular, baseado em dados, para desenvolver programas de Extração, Transformação e Carga (ETL) de informações para o DW. Este artigo apresenta um método e uma ferramenta de Desenvolvimento Rápido de Aplicações (RAD) para aumentar a eficiência do desenvolvimento de programas ETL. A avaliação experimental da abordagem foi realizada em um experimento controlado feito na indústria para analisar a efetividade da ferramenta neste tipo de ambiente. Os resultados indicaram que a nossa abordagem pode ser usada como método para acelerar e melhorar o desenvolvimento de processos ETL.
Referências
Basili, V. and Weiss, D. 1984. A Methodology for Collecting Valid Software Engineering Data. In: IEEE Transactions on Software Engineering. vol.10(3): 728-738. November.
CLOVERETL, Data Integration Software. Retrieved November 6, 2014 from www.cloveretl.com.
Colaço Jr., M.. 2004. Projetando Sistemas de Apoio à Decisão Baseados em Data Warehouse. Rio de Janeiro: Axcel Books.
DATACLEANER, The premier data quality solution. Retrieved November 7, 2014 from www.datacleaner.org.
IBM, Information Server (Data Stage). Retrieved November 6, 2014 from http://goo.gl/H4j8v1.
Kimball, R., Ross, M. and Thomthwaite, W.. 2008. The data warehouse lifecycle toolkit. 2. ed. Indianapolis, Indiana: Wiley Publishing Inc..
Marshall, Jr., I. et al. 2006. Gestão de qualidade. R.J.: FGV.
Mazanec, M. and Macek, O. 2012. On General-purpose Textual Modeling Languages. In: 12th Annual International Workshop - DATESO. April.
Munoz, L., Mazon, J. and Trujillo, J.. 2009. Automatic generation of ETL processes from conceptual models. In: Proceedings of the ACM Twelfth International Workshop on Data Warehousing and Olap. Hong Kong, China.
ORACLE, Oracle Warehouse Builder. Retrieved November 10, 2014 from http://goo.gl/Md4hjn.
Orne, M. T. 1962. Sobre a psicologia social da experiência psicológica: Com referência particular para exigir características e suas implicações.
PENTAHO, Open Source Business Intelligence. Retrieved November 6, 2014 from http://goo.gl/aRzFVl.
REDHAT, Application Development and Integration. Retrieved November 6, 2014 from http://www.redhat.com.
Santos, I. P. O., Costa, J. K. G., Nascimento, A. V. R. P. and Colaço Jr., M.. 2012 Desenvolvimento e Avaliação de uma Ferramenta de Geração Automática de Código para Ambientes de Apoio à Decisão. In: XII WTICG, 2012, Juazeiro. XII ERBASE.
Santos, V. and Belo, O.. 2011. Slowly Changing Dimensions Specification a Relational Algebra Approach. In: PROC. Of Int. Conf. on Advances in Communication and Information Technology.
Singh, R. and Singh, K.. 2010. A Descriptive Classification of Causes of Data Quality Problems in Data Warehouse. In: IJCSI International Journal of Computer Science Issues. Vol. 7, Issue 3, No 2.
SPSS, IBM software. Retrieved December 5, 2014 from http://goo.gl/eXfcT3.
TALEND, Open Integration Solutions. Retrieved November 6, 2014 from www.talend.com.
Thomsen, C. and Pedersen, T. B.. 2009. Pygrametl: a powerful programming framework for extract-transformload programmers. In: Proceedings of the ACM Twelfth International Workshop on Data Warehousing and Olap, China, Hong Kong.
Wohlin, C. et al.2000. Experimentation in Software Engineering: An introduction. USA : Kluwer Academic Publishers.