Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/pizzadedados/datascience-pizza
🍕 Repositório para juntar informações sobre materiais de estudo em análise de dados e áreas afins, empresas que trabalham com dados e dicionário de conceitos
https://github.com/pizzadedados/datascience-pizza
dados data-science data-scientists hacktoberfest machine-learning
Last synced: about 2 months ago
JSON representation
🍕 Repositório para juntar informações sobre materiais de estudo em análise de dados e áreas afins, empresas que trabalham com dados e dicionário de conceitos
- Host: GitHub
- URL: https://github.com/pizzadedados/datascience-pizza
- Owner: PizzaDeDados
- License: mpl-2.0
- Created: 2017-07-18T20:37:32.000Z (over 7 years ago)
- Default Branch: master
- Last Pushed: 2024-04-05T17:42:33.000Z (10 months ago)
- Last Synced: 2024-05-19T07:26:10.163Z (8 months ago)
- Topics: dados, data-science, data-scientists, hacktoberfest, machine-learning
- Homepage: https://guia.pizzadedados.com
- Size: 861 KB
- Stars: 2,312
- Watchers: 253
- Forks: 483
- Open Issues: 11
-
Metadata Files:
- Readme: README.md
- Funding: .github/FUNDING.yml
- License: LICENSE
Awesome Lists containing this project
README
# Guia do Cientista de Dados das Galáxias
![neil](https://media.giphy.com/media/3o7TKSjRrfIPjeiVyM/giphy.gif)
--
**DISCLAIMER**: *Este repositório foi feito pela e para a comunidade. Existem opiniões divergentes sobre o que é básico e o que é avançado entre outros temas.
Caso discorde de alguma coisa que está escrita aqui, fique à vontade para fazer um pull request melhorando as descrições feitas.*O intuito é agregar o conhecimento que se espalha em diversos grupos e iniciativas. Muitas vezes esse conhecimento fica espalhado em drives, pockets e outros meios...
Dessa forma, esse repositório visa ajudar os iniciantes e servir como referência para os experientes.Se possuir material interessante, por favor compartilhe com a comunidade. Estamos aqui para crescermos juntos.
Dessa iniciativa também nasceu o [Pizza de Dados](https://pizzadedados.com/), um podcast brasileiro
focado em ciência de dados. Se tiver um tempinho, prestigie esse trabalho 100% brasileiro.Se você gosta desse repositório e quer ajudar, considere [apoiar o Pizza de Dados](https://apoia.se/pizzadedados) com qualquer quantia :)
No mais, é isso. Bem vinda(o), pequena(o) padawan :)
## Sumário
> Algumas dicas sobre o que estudar para ser um cientista de dados hoje:
* [Recomendações](#recomendacoes)
* [Iniciante](#iniciante)
* [Intermediário](#intermediario)
* [Grandes projetos (big data)](#grandesprojetos)
* [Em Python](#empython)
* [Em R](#emr)
* [Em Julia](#emjulia)
* [Vídeos](#videos)
* [Datasets](#datasets)
* [Dicionário de termos em português](https://github.com/PizzaDeDados/datascience-pizza/blob/master/dicionario.md)
* [Empresas no Brasil que trabalham com DS](https://github.com/PizzaDeDados/datascience-pizza/blob/master/empresas.md)
* [Grupos](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/grupos.md)
* [Metodologias Ágeis](#metodologiasageis)
* [Dados em Imagens](#imagens)
* Tópicos específicos:
* [Aprendizado de Máquina/Machine Learning](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/aprendizado-de-maquina.md)
* [Banco de dados](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/banco-de-dados.md)
* [Big Data](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/big-data.md)
* [Blogs e Jornais](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/blogs-jornais.md)
* [Carreira](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/carreira.md)
* [Cursos](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/cursos.md)
* [Deep Learning](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/deep-learning.md)
* [Estatística e Matemática](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/estatistica-e-matematica.md)
* [Geociências](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/geociencias.md)
* [Inteligência Artificial](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/inteligencia-artificial.md)
* [Linguagens](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/linguagens.md)
* [Livros](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/livros.md)
* [Meetups e Eventos](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/meetups-e-eventos.md)
* [Neurociência](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/neurociência.md)
* [Notícias Legais](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/noticias-legais.md)
* [Podcasts](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/podcasts.md)
* [Processamento de Linguagem Natural](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/processamento-de-linguagem-natural.md)
* [Raspagem de Dados](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/raspagem-de-dados.md)
* [Reportagens relevantes](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/noticias-legais.md)
* [Visualização de dados](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/visualizacao-de-dados.md)--------------------------------------------------
Recomendações
![](https://media.giphy.com/media/Lq3ueCSWjnQPu/giphy.gif)
Iniciante
- [Python](https://www.python.org/) (lib [Pandas](https://pandas.pydata.org/)) ou [R](https://cloud.r-project.org/) | [R Studio](https://www.rstudio.com/products/rstudio/download/#download). [Qual aprender? Dicas Udacity](https://blog.udacity.com/2015/01/python-vs-r-learn-first.html)
- [SQL](https://pt.khanacademy.org/computing/computer-programming/sql#sql-basics)
- [Jupyter Notebook](http://jupyter.org/)
- [Estatística Descritiva](https://br.udacity.com/course/intro-to-descriptive-statistics--ud827)
- [Ferramentas básicas de desenvolvimento](https://medium.com/pizzadedados/ferramentas-desenvolvimento-ciencia-dados-c54d112871d8) | [**pt-br**]Intermediário
- [Cálculo](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/calculo.md)
- [Álgebra Linear](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/algebra-linear.md)
- [Machine Learning](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/aprendizado-de-maquina.md)
- [Deep Learning](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/deep-learning.md)
- [Visualização de Dados](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/visualizacao-de-dados.md)
- [Processamento de Linguagem Natural](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/processamento-de-linguagem-natural.md)Grandes projetos (big data)
- NoSQL
- Scala
- Spark
- Estatística Bayesiana
- Hive
- Hadoop
- Julia
- Computação distribuída com AWS e Google Cloud### O que estudar em cada linguagem - dicas e tutoriais
Ver [este link](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/linguagens.md)
--------------------------------------------------
Vídeos
### Estudos
- [Lista de cursos online](http://www.kdnuggets.com/education/online.html) by KDnuggets
- [Playlist de Treinamento](https://www.youtube.com/playlist?list=PL9ooVrP1hQOGR57Y4g1LFhn1JXVgn1lkX) by Edureka!
- [Curso de análise de dados em Python para iniciantes](https://www.youtube.com/playlist?list=PLqiFjCF_dtcymXtdjwAP4s7tRoW4CYwnH) by LabHacker Câmara dos Deputados [**pt-br**]### Webcasts & Webinars
- [Lista dos próximos](http://www.kdnuggets.com/webcasts/index.html) by KDnuggets--------------------------------------------------
Datasets
- [Datasets for Machine Learning](https://docs.google.com/spreadsheets/d/1AQvZ7-Kg0lSZtG1wlgbIsrm90HaTZrJGQMz-uKRRlFw/edit#gid=0)
- [Datasets for Data Mining and Data Science](http://www.kdnuggets.com/datasets/index.html)
- [Datasets - Kaggle](https://www.kaggle.com/datasets)
- [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/datasets.html)
- [data.world](https://data.world/)
- [Registry of Open Data on AWS](https://registry.opendata.aws)
- [brasil.io](https://brasil.io/datasets)
- [Microsoft Research Open Data](https://msropendata.com/)
- [Datasets for Recommender Systems](https://github.com/caserec/Datasets-for-Recommneder-Systems)
- [Google Dataset Search](https://toolbox.google.com/datasetsearch)
- [Information is beautiful](https://informationisbeautiful.net/data/)
- [Dados do Governo Brasileiro](http://dados.gov.br)
- [Instituto de Pesquisa Econômica Aplicada](http://www.ipeadata.gov.br)
- [Banco Central do Brasil](https://www3.bcb.gov.br)
- [Dados do Governo dos Estados Unidos](http://data.gov)
- [Dados sobre as cidades dos EUA](http://datasf.org)
- [Dados do Governo do Canadá (em inglês e francês)](http://open.canada.ca)
- [Dados do Governo do Reino Unido](https://data.gov.uk)
- [Dados da União Europeia](http://open-data.europa.eu/en/data)
- [Dados do Censo dos EUA (dados da população americana e mundial)](http://www.census.gov)
- [Banco de Dados da NASA](https://data.nasa.gov)
- [Dados do Banco Mundial](http://data.worldbank.org)
- [Dados sobre a saúde](http://www.healthdata.gov)
- [Dados sobre diversos países (incluindo o Brasil)](http://knoema.com)
- [Dados sobre diversas áreas de negócio e finanças](https://www.quandl.com)
- [Google Trends](https://www.google.com/trends)
- [Google Finance](https://www.google.com/finance)
- [Gapminder](http://www.gapminder.org/data)
- [Dados com milhões de músicas](https://aws.amazon.com/datasets/million-song-dataset)
- [Dados sobre os mais diversos assuntos](http://www.freebase.com)
- [DBpedia](http://wiki.dbpedia.org/)
- [Open Data Monitor](http://opendatamonitor.eu)
- [Open Data Network](http://www.opendatanetwork.com)
- [R Datasets](http://www.stats4stem.org/data-sets.html)
- [Stasci](http://www.statsci.org/datasets.html)
- [Portal de Estatística](http://www.statista.com)
- [Data 360](http://www.data360.org)
- [Reconhecimento de Faces](http://www.face-rec.org/databases)
- [Stanford Large Network Dataset Collection](http://snap.stanford.edu/data)
- [Datahub](http://datahub.io/dataset)
- [TeraData](teradata.com/Portuguese/Banco_de_Dados_da_Teradata)
- [Oracle Exadata](oracle.com/exadata)
- [Food And Agriculture Organization of the United Nations](http://www.fao.org/faostat/en/#home)--------------------------------------------------
Metodologias ágeis
- [CRISP-DM](https://pt.wikipedia.org/wiki/Cross_Industry_Standard_Process_for_Data_Mining) [**pt-br**]
--------------------------------------------------
Dados em Imagens