Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/pizzadedados/datascience-pizza

🍕 Repositório para juntar informações sobre materiais de estudo em análise de dados e áreas afins, empresas que trabalham com dados e dicionário de conceitos
https://github.com/pizzadedados/datascience-pizza

dados data-science data-scientists hacktoberfest machine-learning

Last synced: about 2 months ago
JSON representation

🍕 Repositório para juntar informações sobre materiais de estudo em análise de dados e áreas afins, empresas que trabalham com dados e dicionário de conceitos

Awesome Lists containing this project

README

        

# Guia do Cientista de Dados das Galáxias

![neil](https://media.giphy.com/media/3o7TKSjRrfIPjeiVyM/giphy.gif)

--

**DISCLAIMER**: *Este repositório foi feito pela e para a comunidade. Existem opiniões divergentes sobre o que é básico e o que é avançado entre outros temas.
Caso discorde de alguma coisa que está escrita aqui, fique à vontade para fazer um pull request melhorando as descrições feitas.*

O intuito é agregar o conhecimento que se espalha em diversos grupos e iniciativas. Muitas vezes esse conhecimento fica espalhado em drives, pockets e outros meios...
Dessa forma, esse repositório visa ajudar os iniciantes e servir como referência para os experientes.

Se possuir material interessante, por favor compartilhe com a comunidade. Estamos aqui para crescermos juntos.

Dessa iniciativa também nasceu o [Pizza de Dados](https://pizzadedados.com/), um podcast brasileiro
focado em ciência de dados. Se tiver um tempinho, prestigie esse trabalho 100% brasileiro.

Se você gosta desse repositório e quer ajudar, considere [apoiar o Pizza de Dados](https://apoia.se/pizzadedados) com qualquer quantia :)

No mais, é isso. Bem vinda(o), pequena(o) padawan :)

## Sumário

> Algumas dicas sobre o que estudar para ser um cientista de dados hoje:

* [Recomendações](#recomendacoes)
* [Iniciante](#iniciante)
* [Intermediário](#intermediario)
* [Grandes projetos (big data)](#grandesprojetos)
* [Em Python](#empython)
* [Em R](#emr)
* [Em Julia](#emjulia)
* [Vídeos](#videos)
* [Datasets](#datasets)
* [Dicionário de termos em português](https://github.com/PizzaDeDados/datascience-pizza/blob/master/dicionario.md)
* [Empresas no Brasil que trabalham com DS](https://github.com/PizzaDeDados/datascience-pizza/blob/master/empresas.md)
* [Grupos](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/grupos.md)
* [Metodologias Ágeis](#metodologiasageis)
* [Dados em Imagens](#imagens)
* Tópicos específicos:
* [Aprendizado de Máquina/Machine Learning](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/aprendizado-de-maquina.md)
* [Banco de dados](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/banco-de-dados.md)
* [Big Data](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/big-data.md)
* [Blogs e Jornais](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/blogs-jornais.md)
* [Carreira](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/carreira.md)
* [Cursos](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/cursos.md)
* [Deep Learning](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/deep-learning.md)
* [Estatística e Matemática](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/estatistica-e-matematica.md)
* [Geociências](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/geociencias.md)
* [Inteligência Artificial](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/inteligencia-artificial.md)
* [Linguagens](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/linguagens.md)
* [Livros](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/livros.md)
* [Meetups e Eventos](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/meetups-e-eventos.md)
* [Neurociência](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/neurociência.md)
* [Notícias Legais](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/noticias-legais.md)
* [Podcasts](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/podcasts.md)
* [Processamento de Linguagem Natural](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/processamento-de-linguagem-natural.md)
* [Raspagem de Dados](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/raspagem-de-dados.md)
* [Reportagens relevantes](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/noticias-legais.md)
* [Visualização de dados](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/visualizacao-de-dados.md)

--------------------------------------------------

Recomendações

![](https://media.giphy.com/media/Lq3ueCSWjnQPu/giphy.gif)

Iniciante

- [Python](https://www.python.org/) (lib [Pandas](https://pandas.pydata.org/)) ou [R](https://cloud.r-project.org/) | [R Studio](https://www.rstudio.com/products/rstudio/download/#download). [Qual aprender? Dicas Udacity](https://blog.udacity.com/2015/01/python-vs-r-learn-first.html)
- [SQL](https://pt.khanacademy.org/computing/computer-programming/sql#sql-basics)
- [Jupyter Notebook](http://jupyter.org/)
- [Estatística Descritiva](https://br.udacity.com/course/intro-to-descriptive-statistics--ud827)
- [Ferramentas básicas de desenvolvimento](https://medium.com/pizzadedados/ferramentas-desenvolvimento-ciencia-dados-c54d112871d8) | [**pt-br**]

Intermediário

- [Cálculo](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/calculo.md)
- [Álgebra Linear](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/algebra-linear.md)
- [Machine Learning](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/aprendizado-de-maquina.md)
- [Deep Learning](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/deep-learning.md)
- [Visualização de Dados](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/visualizacao-de-dados.md)
- [Processamento de Linguagem Natural](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/processamento-de-linguagem-natural.md)

Grandes projetos (big data)

- NoSQL
- Scala
- Spark
- Estatística Bayesiana
- Hive
- Hadoop
- Julia
- Computação distribuída com AWS e Google Cloud

### O que estudar em cada linguagem - dicas e tutoriais

Ver [este link](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/linguagens.md)

--------------------------------------------------

Vídeos

### Estudos
- [Lista de cursos online](http://www.kdnuggets.com/education/online.html) by KDnuggets
- [Playlist de Treinamento](https://www.youtube.com/playlist?list=PL9ooVrP1hQOGR57Y4g1LFhn1JXVgn1lkX) by Edureka!
- [Curso de análise de dados em Python para iniciantes](https://www.youtube.com/playlist?list=PLqiFjCF_dtcymXtdjwAP4s7tRoW4CYwnH) by LabHacker Câmara dos Deputados [**pt-br**]

### Webcasts & Webinars
- [Lista dos próximos](http://www.kdnuggets.com/webcasts/index.html) by KDnuggets

--------------------------------------------------

Datasets

- [Datasets for Machine Learning](https://docs.google.com/spreadsheets/d/1AQvZ7-Kg0lSZtG1wlgbIsrm90HaTZrJGQMz-uKRRlFw/edit#gid=0)
- [Datasets for Data Mining and Data Science](http://www.kdnuggets.com/datasets/index.html)
- [Datasets - Kaggle](https://www.kaggle.com/datasets)
- [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/datasets.html)
- [data.world](https://data.world/)
- [Registry of Open Data on AWS](https://registry.opendata.aws)
- [brasil.io](https://brasil.io/datasets)
- [Microsoft Research Open Data](https://msropendata.com/)
- [Datasets for Recommender Systems](https://github.com/caserec/Datasets-for-Recommneder-Systems)
- [Google Dataset Search](https://toolbox.google.com/datasetsearch)
- [Information is beautiful](https://informationisbeautiful.net/data/)
- [Dados do Governo Brasileiro](http://dados.gov.br)
- [Instituto de Pesquisa Econômica Aplicada](http://www.ipeadata.gov.br)
- [Banco Central do Brasil](https://www3.bcb.gov.br)
- [Dados do Governo dos Estados Unidos](http://data.gov)
- [Dados sobre as cidades dos EUA](http://datasf.org)
- [Dados do Governo do Canadá (em inglês e francês)](http://open.canada.ca)
- [Dados do Governo do Reino Unido](https://data.gov.uk)
- [Dados da União Europeia](http://open-data.europa.eu/en/data)
- [Dados do Censo dos EUA (dados da população americana e mundial)](http://www.census.gov)
- [Banco de Dados da NASA](https://data.nasa.gov)
- [Dados do Banco Mundial](http://data.worldbank.org)
- [Dados sobre a saúde](http://www.healthdata.gov)
- [Dados sobre diversos países (incluindo o Brasil)](http://knoema.com)
- [Dados sobre diversas áreas de negócio e finanças](https://www.quandl.com)
- [Google Trends](https://www.google.com/trends)
- [Google Finance](https://www.google.com/finance)
- [Gapminder](http://www.gapminder.org/data)
- [Dados com milhões de músicas](https://aws.amazon.com/datasets/million-song-dataset)
- [Dados sobre os mais diversos assuntos](http://www.freebase.com)
- [DBpedia](http://wiki.dbpedia.org/)
- [Open Data Monitor](http://opendatamonitor.eu)
- [Open Data Network](http://www.opendatanetwork.com)
- [R Datasets](http://www.stats4stem.org/data-sets.html)
- [Stasci](http://www.statsci.org/datasets.html)
- [Portal de Estatística](http://www.statista.com)
- [Data 360](http://www.data360.org)
- [Reconhecimento de Faces](http://www.face-rec.org/databases)
- [Stanford Large Network Dataset Collection](http://snap.stanford.edu/data)
- [Datahub](http://datahub.io/dataset)
- [TeraData](teradata.com/Portuguese/Banco_de_Dados_da_Teradata)
- [Oracle Exadata](oracle.com/exadata)
- [Food And Agriculture Organization of the United Nations](http://www.fao.org/faostat/en/#home)

--------------------------------------------------

Metodologias ágeis

- [CRISP-DM](https://pt.wikipedia.org/wiki/Cross_Industry_Standard_Process_for_Data_Mining) [**pt-br**]

--------------------------------------------------

Dados em Imagens

infographic