An open API service indexing awesome lists of open source software.

https://github.com/andredarcie/my-data-science-notebooks

Notebooks para aprender Ciência de Dados
https://github.com/andredarcie/my-data-science-notebooks

aprendizado-de-maquina ciencia-de-dados estatistica processamento-de-linguagem python

Last synced: 8 months ago
JSON representation

Notebooks para aprender Ciência de Dados

Awesome Lists containing this project

README

          

# 📔 My Data Science Notebooks

## Pós Graduação em Ciência de Dados Aplicada

### Table of contents
1. [Programação em Python](#programacao-em-python)
2. [Análise e Visualização de Dados]()
3. [Estatística e Aplicações]()
4. [Análise e Visualização de Dados]()
5. [Banco de Dados Relacionais e Não Relacionais]()
6. [Aprendizado de Máquina I]()
7. [Processamento de Linguagem Natural]()
8. [Aprendizado de Máquina II]()
9. [Análise e Classificação de Imagens]()
10. [Sistemas de Recomendação]()
11. [Big Data & Processamento Distribuído]()

[⭐ Python in one Page](https://github.com/andredarcie/python-in-one-page/blob/master/python_in_one_page.ipynb)

### Programação em Python

🛠️ Ferramentas: Python, Jupyter Notebook, NumPy, Matplotlib e Pandas
- [Notebook](programacao-em-python/pos-programacao-em-python.ipynb)

### Análise e Visualização de Dados

🛠️ Ferramentas: Python, Jupyter Notebook, Pandas, Matplotlib, Seaborn e Bokeh
- [Notebook](analise-visualizacao-de-dados/analise-de-dados.ipynb)
- [Treinamento com Pandas](analise-visualizacao-de-dados/Treinamento_pandas_2.ipynb)
- [Análise casos de Covid](analise-visualizacao-de-dados/tarefa-01.ipynb)
- [Análise reclamações sobre internet](analise-visualizacao-de-dados/tarefa-02.ipynb)
- [Análise mercado de trabalho para Ciência de dados](analise-visualizacao-de-dados/data_hackers_survey_2019.ipynb)

### Estatística e Aplicações
🛠️ Ferramentas: Python, Jupyter Notebook, Pandas, Matplotlib

- [Exercicios 01](estatistica-e-aplicacoes/aula01_pratica.ipynb) (Minimo, Maximo, Amplitude, Intervalo, Frequencia, Frequencia Relativa, Tipos de Variaveis, Pandas)
- [Exercicios 02](estatistica-e-aplicacoes/exercicios_aula02.ipynb) (Média, Mediana e Moda)
- [Exercicios 03](estatistica-e-aplicacoes/aula03_pratica.ipynb) (Quartis, Percentis, Desvio Padrão, Variância e Coeficiente de variação)
- [Exercicios 04](estatistica-e-aplicacoes/aula04_pratica.ipynb) (Correção linear, Séries temporais e Regressão e correção)
- [Exercicios 05](estatistica-e-aplicacoes/aula05_pratica.ipynb) (Polulação e amostra, Representavidade)
- [Exercicios 06](estatistica-e-aplicacoes/aula06_pratica.ipynb) (Matplotlib, Correlação, Scatter)
- [Exercicios 07](estatistica-e-aplicacoes/aula_07_pratica.ipynb) (Probablidades)
- [Exercicios 08 - teorica](estatistica-e-aplicacoes/aula_08_teorica.ipynb) (Variável Aleatória, Curva de Gauss, Distribuição Normal e da Média e Erro padrão da média)
- [Exercicios 08](estatistica-e-aplicacoes/aula_08_pratica.ipynb) (Web Scraping, Folium, GeoPy)

### Banco de Dados Relacionais e Não Relacionais
🛠️ Ferramentas: MariaDB, MongoDB, Cassandra

- [SQL](banco-de-dados/sql.md) - Criação de tabelas e consultas em MariaDb/MySQL
- [NoSQL MongoDB](banco-de-dados/mongodb.md) - Criação das tabelas e consultas
- [NoSQL Cassandra](banco-de-dados/cassandra.md) - Criação das tabelas e consultas

### Aprendizado de Máquina I
🛠️ Ferramentas: Python, Anaconda, Sklearn

#### Supervisionado
- [Modelagem Preditor de Espécies da Flor Íris](aprendizado-de-maquina-i/iris-predictor-app/notebooks/modelagem.ipynb)
- [Iris Predictor App](https://github.com/andredarcie/iris-predictor-app)
- [Sommelier Inteligente App](https://github.com/andredarcie/sommelier-inteligente-app)
- [Classificação - Cifose](aprendizado-de-maquina-i/analise-de-classificadores/kyphosis_make_model.ipynb) (DecisionTreeClassifier, RandomForestClassifier)
- [Classificação - Diabetes - Comparação entre diferentes classificadores](aprendizado-de-maquina-i/analise-de-classificadores/modelagem_v2.ipynb) (KNeighborsClassifier, LogisticRegression, SVC, DecisionTreeClassifier, RandomForestClassifier)
- [Classificação - Vinho - Comparação entre diferentes classificadores](aprendizado-de-maquina-i/classificadores/wine_classifier.ipynb) (KNeighborsClassifier, LogisticRegression, SVC, DecisionTreeClassifier, RandomForestClassifier)
- [Classificação - Aprovação de crédito - Comparação entre diferentes classificadores](aprendizado-de-maquina-i/classificadores/credit_classifier.ipynb) (KNeighborsClassifier, LogisticRegression, SVC, DecisionTreeClassifier, RandomForestClassifier)
- [ Regressão - Linear Simples ](aprendizado-de-maquina-i/regressao/regressao_linear_simples.ipynb)
- [ Regressão - Linear Multipla ](aprendizado-de-maquina-i/regressao/regressao_linear_multipla.ipynb)
- [ Regressão - Comparação entre métricas de avaliação ](aprendizado-de-maquina-i/regressao/salaries.ipynb)
- [ Regressão - Standard Scaler ](aprendizado-de-maquina-i/regressao/regressao_com_svr.ipynb)
- [ Regressão - Temperaturas ](aprendizado-de-maquina-i/regressao/temps.ipynb)

#### Não Supervisionado
- [ Clustering - Eurovision ](aprendizado-de-maquina-i/clustering/eurovision_vh.ipynb)
- [ Clustering - Iris KMeans ](aprendizado-de-maquina-i/clustering/iris_kmeans.ipynb)

#### Projetos
- [ Avaliação de algoritmos de Regressão - Bike Sharing](aprendizado-de-maquina-i/projetos/bike_sharing.ipynb)
- [ Clustering K-Means e DBSCAN - Heart Disease](aprendizado-de-maquina-i/projetos/heart_disease.ipynb)

### Processamento de Linguagem Natural
🛠️ Ferramentas: Python, NLTK, Goose

- [ Hello World ](processamento-de-linguagem-natural/hello-world.ipynb)
- [ Básico de NLTK (Stemização, Lematização, Gerar Resumo Automáticamente) ](processamento-de-linguagem-natural/aula1.ipynb)
- [ Resumo Stemização e Lematização ](processamento-de-linguagem-natural/aula2.ipynb)
- [ Identificador de Tags ](processamento-de-linguagem-natural/aula4.ipynb)
- [ Calcula Similaridade - CountVectorizer, TfidfVectorizer, BigramCollocationFinder ](processamento-de-linguagem-natural/Aula05_parte01.ipynb)
- [ Uso da lib goose3 ](processamento-de-linguagem-natural/CodigoSala.ipynb)
- [ Projeto Final - Chatbot ](https://github.com/andredarcie/chatbot-tensorflow)

### Aprendizado de Máquina II
🛠️ Ferramentas: Tensorflow, Keras

- [ Pre Processamento ](aprendizado-de-maquina-ii/pre-processamento.ipynb)
- [ Acesso às bases de dados ](aprendizado-de-maquina-ii/acesso-base-de-dados.ipynb)
- [ Predição de diabetes - Salvando o modelo ](aprendizado-de-maquina-ii/NN_Indians_Diabetes_save.ipynb)
- [ Predição de diabetes - Carregando o modelo ](aprendizado-de-maquina-ii/NN_Indians_Diabetes_load.ipynb)
- [ KNN x Regressão Logística x SVM x MLP - Breast cancer ](aprendizado-de-maquina-ii/Breast_cancer_dataset_KNN_x_Reg_Log_x_SVM_x_MLP_v1.ipynb)
- [ NN - Predição politica ](aprendizado-de-maquina-ii/NN_Predicao_politica.ipynb)
- [ Previsão de preços de habitação na Califórnia ](aprendizado-de-maquina-ii/Tarefa_4_1.ipynb)
- [ Predição sonar (rocha ou mina) ](aprendizado-de-maquina-ii/Tarefa_4_3.ipynb)
- [ Predição Chrun ](aprendizado-de-maquina-ii/predicao_churn.ipynb)
- [ Previsão de Salários ](aprendizado-de-maquina-ii/previsao-de-salarios.ipynb)
- [ Controle de Overfitting ](aprendizado-de-maquina-ii/controle_de_overfitting.ipynb)

### Análise e Classificação de Imagens
### Sistemas de Recomendação
### Big Data & Processamento Distribuído

- [Comandos principais em Hadoop](big-data-processamento-distribuido/comandos-principais-hadoop.txt)

## Outros notebooks
- [YouTube](outros-notebooks/youtube.ipynb)
- [Wikipedia Crawler](outros-notebooks/video-game-considered-the-best.ipynb)