https://github.com/mgckaled/rs_data-analytics
Repositório agregador do conteúdo da formação Data Analytics desenvolvido pelo Rocketseat.
https://github.com/mgckaled/rs_data-analytics
data-analytics data-visualization python sql statistics
Last synced: 9 months ago
JSON representation
Repositório agregador do conteúdo da formação Data Analytics desenvolvido pelo Rocketseat.
- Host: GitHub
- URL: https://github.com/mgckaled/rs_data-analytics
- Owner: mgckaled
- Created: 2025-06-30T23:57:55.000Z (12 months ago)
- Default Branch: main
- Last Pushed: 2025-09-26T14:52:39.000Z (9 months ago)
- Last Synced: 2025-09-26T16:29:24.038Z (9 months ago)
- Topics: data-analytics, data-visualization, python, sql, statistics
- Homepage:
- Size: 970 KB
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Formação Rocketseat - Data Analytics
## Sobre
Repositório agregador do conteúdo da formação **Data Analytics** desenvolvido pelo Rocketseat.
## Objetivo
Vivemos em um mundo cada vez mais orientado por dados, onde tomar boas decisões depende de interpretar corretamente os sinais escondidos nas informações. A formação Data Analytics foi criada para capacitar você a dominar esse processo de ponta a ponta — desde a coleta e tratamento dos dados até a construção de visualizações e geração de insights estratégicos.
Ao longo da formação, você vai aprender fundamentos estatísticos, programação em Python, SQL, técnicas de limpeza, análise e visualização de dados, além de desenvolver habilidades essenciais para apresentar resultados de forma clara, persuasiva e com impacto nos negócios. A trilha combina teoria aplicada, estudos de caso e projetos reais para preparar você para os desafios do mercado.
Se você quer se tornar um analista de dados completo, capaz de unir pensamento analítico, domínio técnico e visão de negócio, essa formação é o seu ponto de partida.
## Nível 1 - Primeiros Passos
### Bloco A - O Trabalho de um Analista de Dados
Este módulo introdutório apresenta os fundamentos essenciais da área, começando pela definição e importância da análise de dados. Em seguida, explora o conceito de personas de dados, destacando os perfis envolvidos no ecossistema analítico. Também aborda as principais metodologias de dados utilizadas para extrair insights e tomar decisões baseadas em evidências. Por fim, oferece uma visão estruturada da base conceitual de dados.
> Acesso ao [Conteúdo das Aulas](./.github/docs/content/n1/n1.md#bloco-a---o-trabalho-de-um-analista-de-dados)
>
> Acesso às [avaliações](./.github/docs/assessments/q1.md#bloco-a---o-trabalho-de-um-analista-de-dados)
### Bloco B - Entendendo o Problema
Este módulo foca na etapa de compreensão do problema na análise de dados, abordando os principais tipos de demandas (exploratória, descritiva, diagnóstica, preditiva e prescritiva) e como traduzi-las em perguntas de dados. Também explora a identificação de stakeholders e técnicas de priorização, preparando o analista para alinhar as necessidades do negócio com análises relevantes e bem direcionadas.
> Acesso ao [Conteúdo das Aulas](./.github/docs/content/n1/n1.md#bloco-b---entendendo-o-problema)
>
> Acesso às [avaliações](./.github/docs/assessments/q1.md#bloco-b---entendendo-o-problema)
## Nível 2 - Matemática para Dados
Este nível oferece uma base sólida e aplicada nos principais tópicos matemáticos e estatísticos utilizados na análise e ciência de dados. Ao longo dos módulos, o aluno desenvolve competências fundamentais para interpretar, manipular e extrair informações relevantes de conjuntos de dados, com foco na clareza, precisão e aplicabilidade.
Este nível está estruturado em cinco blocos complementares:
- **Estatística Descritiva**: apresenta os conceitos iniciais de análise de dados, como média, mediana e moda, preparando o terreno para avaliações mais profundas.
- **Medidas de Dispersão**: aprofunda a análise com variância, desvio padrão e amplitude, importantes para compreender a variabilidade dos dados.
- **Medidas de Posição**: ensina como segmentar e interpretar dados a partir de quartis, percentis e BoxPlots, fundamentais para diagnósticos estatísticos mais refinados.
- **Análise Combinatória e Probabilidade**: introduz o pensamento probabilístico, essencial para modelagens, inferências e algoritmos preditivos.
- **Algebra Linear**: fornece a linguagem matemática para manipular vetores, matrizes e transformações, servindo de suporte para algoritmos de machine learning e operações em múltiplas dimensões.
Com uma abordagem prática e contextualizada, este nível visa tornar o aluno apto a aplicar ferramentas matemáticas com confiança, favorecendo a análise crítica e a construção de soluções baseadas em dados.
> Acesso ao [Índice de Aulas](./.github/docs/content/n2/n2_index-aulas.md)
>
> Acesso aos [Questionários Avaliativos](./.github/docs/assessments/q2.md)
## Nível 3 - Fundamentos de Python para Dados
> Acesso às [avaliações](./.github/docs/assessments/q3.md)
### Bloco A - Fundamentos de Python para Dados
Nesse módulo, você aprenderá os principais fundamentos da linguagem Python — como variáveis, tipos de dados, operadores, estruturas de controle e manipulação de strings. Esses conceitos são essenciais, pois o Python será amplamente utilizado nos próximos módulos em aplicações práticas de análise de dados.
> Acesso ao [Conteúdo das Aulas](./n3/m1/)
### Bloco B - Estrutura de Dados
Este módulo apresenta as principais estruturas de dados em Python, como listas, tuplas, dicionários e conjuntos. Explora seus métodos, percursos e formas de manipulação, fornecendo uma base essencial para organização e análise de dados.
### Bloco C - Funções e Módulos
Este módulo aborda de forma prática e progressiva os principais conceitos sobre funções em Python. Inicia com a introdução ao tema, passa pela definição de parâmetros, utilização de funções com retorno e uso de funções lambda, até chegar na criação e organização de módulos, incluindo o uso no Colab e no Google Drive. Finaliza com a aplicação de List Comprehension, tornando o código mais limpo e eficiente.
### Bloco D - Numpy
Neste módulo, você vai aprender a combinar, dividir, gerar e ordenar arrays, além de trabalhar com números aleatórios, escolhas aleatórias e verificações booleanas, dominando operações essenciais para manipulação de dados em Python.
### Bloco E - Pandas
Nesse módulo vamos aprender a utilizar o Pandas para análise de dados em Python. Abordaremos estruturas como Séries e DataFrames, métodos de seleção, filtragem, ordenação, agregação e combinação de dados, além de manipulação de tipos e tratamento de valores ausentes.