Uma introdução à análise de dados usando pandas, matplotlib e seaborn
Resumo
Com a digitalização acelerada, a Ciência de Dados evoluiu ao combinar estatística e programação, permitindo análises complexas de grandes volumes de dados. Ferramentas como Python e R, junto a bibliotecas específicas, facilitam o uso de técnicas de análise de dados e a construção de modelos preditivos aplicáveis em diversas áreas, como por exemplo, educação e saúde. Na educação, a análise de dados é usada para personalizar o ensino e identificar alunos em risco de evasão, enquanto na saúde foi fundamental para monitorar e conter a Covid-19. Esta oficina oferece uma introdução a essas ferramentas e métodos, capacitando os alunos a realizar análises iniciais e comunicar insights relevantes.Referências
CAVANILLAS, José María; CURRY, Edward; WAHLSTER, Wolfgang. New horizons for a data-driven economy: a roadmap for usage and exploitation of big data in Europe. 1. ed. Berlin: Springer, 2016.
DATABRICKS, Jupyter Notebook, Disponível em: [link]. Acesso em: 30, out. 2024.
GOOGLE COLAB, Google Colaboratory, Disponível em: [link]. Acesso em 30, out. 2024.
GROUPLENS. MovieLens, Disponível em: [link]. Acesso em: 30 out. 2024
HASTIE, Trevor; TIBSHIRANI, Robert; FRIEDMAN, Jerome. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2. ed. New York: Springer, 2009.
KEAGLE, TMDB 500 Movie Dataset, Disponível em: [link]. Acesso em: 30 out. 2024.
LANEY, Doug. 3D Data Management: Controlling Data Volume, Variety, and Velocity. Application Delivery Strategies, 2001.
PROVOST, Foster; FAWCETT, Tom. Data science for business: what you need to know about data mining and data-analytic thinking. 1. ed. Sebastopol, CA: O'Reilly Media, 2013.
ROMERO, Cristóbal; VENTURA, Sebastián. Educational data mining: a review of the state of the art. IEEE Transactions on Systems, Man, and Cybernetics, Part C (applications and reviews) 40.6 (2010): 601-618.
SIMPLILEARN. Data Science vs Data Analytics vs Machine Learning: What’s the Difference? Disponível em: [link]. Acesso em: 30 out. 2024.
ZHANG, Jin; WOLFRAM, Dietmar; MA, Feicheng. The impact of big data on research methods in information science. Data and Information Management, v. 7, n. 2, 2023.
DATABRICKS, Jupyter Notebook, Disponível em: [link]. Acesso em: 30, out. 2024.
GOOGLE COLAB, Google Colaboratory, Disponível em: [link]. Acesso em 30, out. 2024.
GROUPLENS. MovieLens, Disponível em: [link]. Acesso em: 30 out. 2024
HASTIE, Trevor; TIBSHIRANI, Robert; FRIEDMAN, Jerome. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2. ed. New York: Springer, 2009.
KEAGLE, TMDB 500 Movie Dataset, Disponível em: [link]. Acesso em: 30 out. 2024.
LANEY, Doug. 3D Data Management: Controlling Data Volume, Variety, and Velocity. Application Delivery Strategies, 2001.
PROVOST, Foster; FAWCETT, Tom. Data science for business: what you need to know about data mining and data-analytic thinking. 1. ed. Sebastopol, CA: O'Reilly Media, 2013.
ROMERO, Cristóbal; VENTURA, Sebastián. Educational data mining: a review of the state of the art. IEEE Transactions on Systems, Man, and Cybernetics, Part C (applications and reviews) 40.6 (2010): 601-618.
SIMPLILEARN. Data Science vs Data Analytics vs Machine Learning: What’s the Difference? Disponível em: [link]. Acesso em: 30 out. 2024.
ZHANG, Jin; WOLFRAM, Dietmar; MA, Feicheng. The impact of big data on research methods in information science. Data and Information Management, v. 7, n. 2, 2023.
Publicado
07/11/2024
Como Citar
CASAGRANDE, Vitor Moreira; SILVA, Thiago Pereira da.
Uma introdução à análise de dados usando pandas, matplotlib e seaborn. In: ESCOLA REGIONAL DE INFORMÁTICA DE MATO GROSSO (ERI-MT), 13. , 2024, Alto Araguaia/MT.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2024
.
p. 196-203.
ISSN 2447-5386.
DOI: https://doi.org/10.5753/eri-mt.2024.245927.