https://github.com/andredarcie/my-data-science-notebooks
Notebooks para aprender Ciência de Dados
https://github.com/andredarcie/my-data-science-notebooks
aprendizado-de-maquina ciencia-de-dados estatistica processamento-de-linguagem python
Last synced: 8 months ago
JSON representation
Notebooks para aprender Ciência de Dados
- Host: GitHub
- URL: https://github.com/andredarcie/my-data-science-notebooks
- Owner: andredarcie
- License: mit
- Created: 2020-09-03T00:28:32.000Z (about 5 years ago)
- Default Branch: master
- Last Pushed: 2022-01-15T20:26:46.000Z (over 3 years ago)
- Last Synced: 2025-01-09T20:09:22.768Z (9 months ago)
- Topics: aprendizado-de-maquina, ciencia-de-dados, estatistica, processamento-de-linguagem, python
- Language: Jupyter Notebook
- Homepage:
- Size: 46.5 MB
- Stars: 1
- Watchers: 2
- Forks: 1
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# 📔 My Data Science Notebooks
## Pós Graduação em Ciência de Dados Aplicada
### Table of contents
1. [Programação em Python](#programacao-em-python)
2. [Análise e Visualização de Dados]()
3. [Estatística e Aplicações]()
4. [Análise e Visualização de Dados]()
5. [Banco de Dados Relacionais e Não Relacionais]()
6. [Aprendizado de Máquina I]()
7. [Processamento de Linguagem Natural]()
8. [Aprendizado de Máquina II]()
9. [Análise e Classificação de Imagens]()
10. [Sistemas de Recomendação]()
11. [Big Data & Processamento Distribuído]()[⭐ Python in one Page](https://github.com/andredarcie/python-in-one-page/blob/master/python_in_one_page.ipynb)
🛠️ Ferramentas: Python, Jupyter Notebook, NumPy, Matplotlib e Pandas
- [Notebook](programacao-em-python/pos-programacao-em-python.ipynb)### Análise e Visualização de Dados
🛠️ Ferramentas: Python, Jupyter Notebook, Pandas, Matplotlib, Seaborn e Bokeh
- [Notebook](analise-visualizacao-de-dados/analise-de-dados.ipynb)
- [Treinamento com Pandas](analise-visualizacao-de-dados/Treinamento_pandas_2.ipynb)
- [Análise casos de Covid](analise-visualizacao-de-dados/tarefa-01.ipynb)
- [Análise reclamações sobre internet](analise-visualizacao-de-dados/tarefa-02.ipynb)
- [Análise mercado de trabalho para Ciência de dados](analise-visualizacao-de-dados/data_hackers_survey_2019.ipynb)### Estatística e Aplicações
🛠️ Ferramentas: Python, Jupyter Notebook, Pandas, Matplotlib- [Exercicios 01](estatistica-e-aplicacoes/aula01_pratica.ipynb) (Minimo, Maximo, Amplitude, Intervalo, Frequencia, Frequencia Relativa, Tipos de Variaveis, Pandas)
- [Exercicios 02](estatistica-e-aplicacoes/exercicios_aula02.ipynb) (Média, Mediana e Moda)
- [Exercicios 03](estatistica-e-aplicacoes/aula03_pratica.ipynb) (Quartis, Percentis, Desvio Padrão, Variância e Coeficiente de variação)
- [Exercicios 04](estatistica-e-aplicacoes/aula04_pratica.ipynb) (Correção linear, Séries temporais e Regressão e correção)
- [Exercicios 05](estatistica-e-aplicacoes/aula05_pratica.ipynb) (Polulação e amostra, Representavidade)
- [Exercicios 06](estatistica-e-aplicacoes/aula06_pratica.ipynb) (Matplotlib, Correlação, Scatter)
- [Exercicios 07](estatistica-e-aplicacoes/aula_07_pratica.ipynb) (Probablidades)
- [Exercicios 08 - teorica](estatistica-e-aplicacoes/aula_08_teorica.ipynb) (Variável Aleatória, Curva de Gauss, Distribuição Normal e da Média e Erro padrão da média)
- [Exercicios 08](estatistica-e-aplicacoes/aula_08_pratica.ipynb) (Web Scraping, Folium, GeoPy)### Banco de Dados Relacionais e Não Relacionais
🛠️ Ferramentas: MariaDB, MongoDB, Cassandra- [SQL](banco-de-dados/sql.md) - Criação de tabelas e consultas em MariaDb/MySQL
- [NoSQL MongoDB](banco-de-dados/mongodb.md) - Criação das tabelas e consultas
- [NoSQL Cassandra](banco-de-dados/cassandra.md) - Criação das tabelas e consultas### Aprendizado de Máquina I
🛠️ Ferramentas: Python, Anaconda, Sklearn#### Supervisionado
- [Modelagem Preditor de Espécies da Flor Íris](aprendizado-de-maquina-i/iris-predictor-app/notebooks/modelagem.ipynb)
- [Iris Predictor App](https://github.com/andredarcie/iris-predictor-app)
- [Sommelier Inteligente App](https://github.com/andredarcie/sommelier-inteligente-app)
- [Classificação - Cifose](aprendizado-de-maquina-i/analise-de-classificadores/kyphosis_make_model.ipynb) (DecisionTreeClassifier, RandomForestClassifier)
- [Classificação - Diabetes - Comparação entre diferentes classificadores](aprendizado-de-maquina-i/analise-de-classificadores/modelagem_v2.ipynb) (KNeighborsClassifier, LogisticRegression, SVC, DecisionTreeClassifier, RandomForestClassifier)
- [Classificação - Vinho - Comparação entre diferentes classificadores](aprendizado-de-maquina-i/classificadores/wine_classifier.ipynb) (KNeighborsClassifier, LogisticRegression, SVC, DecisionTreeClassifier, RandomForestClassifier)
- [Classificação - Aprovação de crédito - Comparação entre diferentes classificadores](aprendizado-de-maquina-i/classificadores/credit_classifier.ipynb) (KNeighborsClassifier, LogisticRegression, SVC, DecisionTreeClassifier, RandomForestClassifier)
- [ Regressão - Linear Simples ](aprendizado-de-maquina-i/regressao/regressao_linear_simples.ipynb)
- [ Regressão - Linear Multipla ](aprendizado-de-maquina-i/regressao/regressao_linear_multipla.ipynb)
- [ Regressão - Comparação entre métricas de avaliação ](aprendizado-de-maquina-i/regressao/salaries.ipynb)
- [ Regressão - Standard Scaler ](aprendizado-de-maquina-i/regressao/regressao_com_svr.ipynb)
- [ Regressão - Temperaturas ](aprendizado-de-maquina-i/regressao/temps.ipynb)#### Não Supervisionado
- [ Clustering - Eurovision ](aprendizado-de-maquina-i/clustering/eurovision_vh.ipynb)
- [ Clustering - Iris KMeans ](aprendizado-de-maquina-i/clustering/iris_kmeans.ipynb)#### Projetos
- [ Avaliação de algoritmos de Regressão - Bike Sharing](aprendizado-de-maquina-i/projetos/bike_sharing.ipynb)
- [ Clustering K-Means e DBSCAN - Heart Disease](aprendizado-de-maquina-i/projetos/heart_disease.ipynb)### Processamento de Linguagem Natural
🛠️ Ferramentas: Python, NLTK, Goose- [ Hello World ](processamento-de-linguagem-natural/hello-world.ipynb)
- [ Básico de NLTK (Stemização, Lematização, Gerar Resumo Automáticamente) ](processamento-de-linguagem-natural/aula1.ipynb)
- [ Resumo Stemização e Lematização ](processamento-de-linguagem-natural/aula2.ipynb)
- [ Identificador de Tags ](processamento-de-linguagem-natural/aula4.ipynb)
- [ Calcula Similaridade - CountVectorizer, TfidfVectorizer, BigramCollocationFinder ](processamento-de-linguagem-natural/Aula05_parte01.ipynb)
- [ Uso da lib goose3 ](processamento-de-linguagem-natural/CodigoSala.ipynb)
- [ Projeto Final - Chatbot ](https://github.com/andredarcie/chatbot-tensorflow)
### Aprendizado de Máquina II
🛠️ Ferramentas: Tensorflow, Keras- [ Pre Processamento ](aprendizado-de-maquina-ii/pre-processamento.ipynb)
- [ Acesso às bases de dados ](aprendizado-de-maquina-ii/acesso-base-de-dados.ipynb)
- [ Predição de diabetes - Salvando o modelo ](aprendizado-de-maquina-ii/NN_Indians_Diabetes_save.ipynb)
- [ Predição de diabetes - Carregando o modelo ](aprendizado-de-maquina-ii/NN_Indians_Diabetes_load.ipynb)
- [ KNN x Regressão Logística x SVM x MLP - Breast cancer ](aprendizado-de-maquina-ii/Breast_cancer_dataset_KNN_x_Reg_Log_x_SVM_x_MLP_v1.ipynb)
- [ NN - Predição politica ](aprendizado-de-maquina-ii/NN_Predicao_politica.ipynb)
- [ Previsão de preços de habitação na Califórnia ](aprendizado-de-maquina-ii/Tarefa_4_1.ipynb)
- [ Predição sonar (rocha ou mina) ](aprendizado-de-maquina-ii/Tarefa_4_3.ipynb)
- [ Predição Chrun ](aprendizado-de-maquina-ii/predicao_churn.ipynb)
- [ Previsão de Salários ](aprendizado-de-maquina-ii/previsao-de-salarios.ipynb)
- [ Controle de Overfitting ](aprendizado-de-maquina-ii/controle_de_overfitting.ipynb)### Análise e Classificação de Imagens
### Sistemas de Recomendação
### Big Data & Processamento Distribuído- [Comandos principais em Hadoop](big-data-processamento-distribuido/comandos-principais-hadoop.txt)
## Outros notebooks
- [YouTube](outros-notebooks/youtube.ipynb)
- [Wikipedia Crawler](outros-notebooks/video-game-considered-the-best.ipynb)