Uma introdução à análise de dados usando pandas, matplotlib e seaborn

  • Vitor Moreira Casagrande UFMT
  • Thiago Pereira da Silva UFMT

Resumo


Com a digitalização acelerada, a Ciência de Dados evoluiu ao combinar estatística e programação, permitindo análises complexas de grandes volumes de dados. Ferramentas como Python e R, junto a bibliotecas específicas, facilitam o uso de técnicas de análise de dados e a construção de modelos preditivos aplicáveis em diversas áreas, como por exemplo, educação e saúde. Na educação, a análise de dados é usada para personalizar o ensino e identificar alunos em risco de evasão, enquanto na saúde foi fundamental para monitorar e conter a Covid-19. Esta oficina oferece uma introdução a essas ferramentas e métodos, capacitando os alunos a realizar análises iniciais e comunicar insights relevantes.

Referências

CAVANILLAS, José María; CURRY, Edward; WAHLSTER, Wolfgang. New horizons for a data-driven economy: a roadmap for usage and exploitation of big data in Europe. 1. ed. Berlin: Springer, 2016.

DATABRICKS, Jupyter Notebook, Disponível em: [link]. Acesso em: 30, out. 2024.

GOOGLE COLAB, Google Colaboratory, Disponível em: [link]. Acesso em 30, out. 2024.

GROUPLENS. MovieLens, Disponível em: [link]. Acesso em: 30 out. 2024

HASTIE, Trevor; TIBSHIRANI, Robert; FRIEDMAN, Jerome. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2. ed. New York: Springer, 2009.

KEAGLE, TMDB 500 Movie Dataset, Disponível em: [link]. Acesso em: 30 out. 2024.

LANEY, Doug. 3D Data Management: Controlling Data Volume, Variety, and Velocity. Application Delivery Strategies, 2001.

PROVOST, Foster; FAWCETT, Tom. Data science for business: what you need to know about data mining and data-analytic thinking. 1. ed. Sebastopol, CA: O'Reilly Media, 2013.

ROMERO, Cristóbal; VENTURA, Sebastián. Educational data mining: a review of the state of the art. IEEE Transactions on Systems, Man, and Cybernetics, Part C (applications and reviews) 40.6 (2010): 601-618.

SIMPLILEARN. Data Science vs Data Analytics vs Machine Learning: What’s the Difference? Disponível em: [link]. Acesso em: 30 out. 2024.

ZHANG, Jin; WOLFRAM, Dietmar; MA, Feicheng. The impact of big data on research methods in information science. Data and Information Management, v. 7, n. 2, 2023.
Publicado
07/11/2024
CASAGRANDE, Vitor Moreira; SILVA, Thiago Pereira da. Uma introdução à análise de dados usando pandas, matplotlib e seaborn. In: ESCOLA REGIONAL DE INFORMÁTICA DE MATO GROSSO (ERI-MT), 13. , 2024, Alto Araguaia/MT. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 196-203. ISSN 2447-5386. DOI: https://doi.org/10.5753/eri-mt.2024.245927.