{"id":15031831,"url":"https://github.com/pizzadedados/datascience-pizza","last_synced_at":"2025-05-14T21:09:44.058Z","repository":{"id":39614844,"uuid":"97641654","full_name":"PizzaDeDados/datascience-pizza","owner":"PizzaDeDados","description":"🍕 Repositório para juntar informações sobre materiais de estudo em análise de dados e áreas afins, empresas que trabalham com dados e dicionário de conceitos","archived":false,"fork":false,"pushed_at":"2024-04-05T17:42:33.000Z","size":882,"stargazers_count":2396,"open_issues_count":11,"forks_count":485,"subscribers_count":253,"default_branch":"master","last_synced_at":"2025-04-13T02:03:39.206Z","etag":null,"topics":["dados","data-science","data-scientists","hacktoberfest","machine-learning"],"latest_commit_sha":null,"homepage":"https://guia.pizzadedados.com","language":null,"has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"mpl-2.0","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/PizzaDeDados.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":".github/FUNDING.yml","license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null},"funding":{"custom":["https://apoia.se/pizzadedados"]}},"created_at":"2017-07-18T20:37:32.000Z","updated_at":"2025-04-04T10:17:27.000Z","dependencies_parsed_at":"2024-07-30T21:38:12.795Z","dependency_job_id":"35e82e4f-33f9-4e71-b39b-a048590e7f9f","html_url":"https://github.com/PizzaDeDados/datascience-pizza","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/PizzaDeDados%2Fdatascience-pizza","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/PizzaDeDados%2Fdatascience-pizza/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/PizzaDeDados%2Fdatascience-pizza/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/PizzaDeDados%2Fdatascience-pizza/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/PizzaDeDados","download_url":"https://codeload.github.com/PizzaDeDados/datascience-pizza/tar.gz/refs/heads/master","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":249038413,"owners_count":21202694,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["dados","data-science","data-scientists","hacktoberfest","machine-learning"],"created_at":"2024-09-24T20:16:42.229Z","updated_at":"2025-04-15T08:37:03.274Z","avatar_url":"https://github.com/PizzaDeDados.png","language":null,"funding_links":["https://apoia.se/pizzadedados"],"categories":[],"sub_categories":[],"readme":"# Guia do Cientista de Dados das Galáxias\n\n![neil](https://media.giphy.com/media/3o7TKSjRrfIPjeiVyM/giphy.gif)\n\n--\n\n**DISCLAIMER**: *Este repositório foi feito pela e para a comunidade. Existem opiniões divergentes sobre o que é básico e o que é avançado entre outros temas.\nCaso discorde de alguma coisa que está escrita aqui, fique à vontade para fazer um pull request melhorando as descrições feitas.*\n\nO intuito é  agregar o conhecimento que se espalha em diversos grupos e iniciativas. Muitas vezes esse conhecimento fica espalhado em drives, pockets e outros meios...\nDessa forma, esse repositório visa ajudar os iniciantes e servir como referência para os experientes.\n\nSe possuir material interessante, por favor compartilhe com a comunidade. Estamos aqui para crescermos juntos.\n\nDessa iniciativa também nasceu o [Pizza de Dados](https://pizzadedados.com/), um podcast brasileiro\nfocado em ciência de dados. Se tiver um tempinho, prestigie esse trabalho 100% brasileiro.\n\nSe você gosta desse repositório e quer ajudar, considere [apoiar o Pizza de Dados](https://apoia.se/pizzadedados) com qualquer quantia :)\n\nNo mais, é isso. Bem vinda(o), pequena(o) padawan :)\n\n## Sumário\n\n\u003e Algumas dicas sobre o que estudar para ser um cientista de dados hoje:\n\n\u003c!-- toc --\u003e\n  * [Recomendações](#recomendacoes)\n      * [Iniciante](#iniciante)\n      * [Intermediário](#intermediario)\n      * [Grandes projetos (big data)](#grandesprojetos)\n      * [Em Python](#empython)\n      * [Em R](#emr)\n      * [Em Julia](#emjulia)\n  * [Vídeos](#videos)\n  * [Datasets](#datasets)\n  * [Dicionário de termos em português](https://github.com/PizzaDeDados/datascience-pizza/blob/master/dicionario.md)\n  * [Empresas no Brasil que trabalham com DS](https://github.com/PizzaDeDados/datascience-pizza/blob/master/empresas.md)\n  * [Grupos](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/grupos.md)\n  * [Metodologias Ágeis](#metodologiasageis)\n  * [Dados em Imagens](#imagens)\n  * Tópicos específicos:\n      * [Aprendizado de Máquina/Machine Learning](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/aprendizado-de-maquina.md)\n      * [Banco de dados](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/banco-de-dados.md)\n      * [Big Data](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/big-data.md)\n      * [Blogs e Jornais](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/blogs-jornais.md)\n      * [Carreira](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/carreira.md)\n      * [Cursos](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/cursos.md)\n      * [Deep Learning](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/deep-learning.md)\n      * [Estatística e Matemática](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/estatistica-e-matematica.md)\n      * [Geociências](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/geociencias.md)\n      * [Inteligência Artificial](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/inteligencia-artificial.md)\n      * [Linguagens](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/linguagens.md)\n      * [Livros](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/livros.md)\n      * [Meetups e Eventos](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/meetups-e-eventos.md)\n      * [Neurociência](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/neurociência.md)\n      * [Notícias Legais](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/noticias-legais.md)\n      * [Podcasts](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/podcasts.md)\n      * [Processamento de Linguagem Natural](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/processamento-de-linguagem-natural.md)\n      * [Raspagem de Dados](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/raspagem-de-dados.md)\n      * [Reportagens relevantes](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/noticias-legais.md)\n      * [Visualização de dados](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/visualizacao-de-dados.md)\n\n--------------------------------------------------\n\u003ch2 id=\"recomendacoes\"\u003eRecomendações\u003c/h2\u003e\n\n![](https://media.giphy.com/media/Lq3ueCSWjnQPu/giphy.gif)\n\n\n\u003ch3 id=\"iniciante\"\u003eIniciante\u003c/h3\u003e\n\n  - [Python](https://www.python.org/) (lib [Pandas](https://pandas.pydata.org/)) ou [R](https://cloud.r-project.org/) | [R Studio](https://www.rstudio.com/products/rstudio/download/#download). [Qual aprender? Dicas Udacity](https://blog.udacity.com/2015/01/python-vs-r-learn-first.html)\n  - [SQL](https://pt.khanacademy.org/computing/computer-programming/sql#sql-basics)\n  - [Jupyter Notebook](http://jupyter.org/)\n  - [Estatística Descritiva](https://br.udacity.com/course/intro-to-descriptive-statistics--ud827)\n  - [Ferramentas básicas de desenvolvimento](https://medium.com/pizzadedados/ferramentas-desenvolvimento-ciencia-dados-c54d112871d8) | [**pt-br**]\n\n\u003ch3 id=\"intermediario\"\u003eIntermediário\u003c/h3\u003e\n\n  - [Cálculo](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/calculo.md)\n  - [Álgebra Linear](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/algebra-linear.md)\n  - [Machine Learning](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/aprendizado-de-maquina.md)\n  - [Deep Learning](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/deep-learning.md)\n  - [Visualização de Dados](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/visualizacao-de-dados.md)\n  - [Processamento de Linguagem Natural](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/processamento-de-linguagem-natural.md)\n\n\u003ch3 id=\"grandesprojetos\"\u003eGrandes projetos (big data)\u003c/h3\u003e\n\n  - NoSQL\n  - Scala\n  - Spark\n  - Estatística Bayesiana\n  - Hive\n  - Hadoop\n  - Julia\n  - Computação distribuída com AWS e Google Cloud\n\n### O que estudar em cada linguagem - dicas e tutoriais\n\nVer [este link](https://github.com/PizzaDeDados/datascience-pizza/blob/master/topicos/linguagens.md)\n\n--------------------------------------------------\n\u003ch2 id=\"videos\"\u003eVídeos\u003c/h2\u003e\n\n### Estudos\n  - [Lista de cursos online](http://www.kdnuggets.com/education/online.html) by KDnuggets\n  - [Playlist de Treinamento](https://www.youtube.com/playlist?list=PL9ooVrP1hQOGR57Y4g1LFhn1JXVgn1lkX) by Edureka!\n  - [Curso de análise de dados em Python para iniciantes](https://www.youtube.com/playlist?list=PLqiFjCF_dtcymXtdjwAP4s7tRoW4CYwnH) by LabHacker Câmara dos Deputados [**pt-br**]\n\n### Webcasts \u0026 Webinars\n  - [Lista dos próximos](http://www.kdnuggets.com/webcasts/index.html) by KDnuggets\n\n\n--------------------------------------------------\n\u003ch2 id=\"datasets\"\u003eDatasets\u003c/h2\u003e\n\n - [Datasets for Machine Learning](https://docs.google.com/spreadsheets/d/1AQvZ7-Kg0lSZtG1wlgbIsrm90HaTZrJGQMz-uKRRlFw/edit#gid=0)\n - [Datasets for Data Mining and Data Science](http://www.kdnuggets.com/datasets/index.html)\n - [Datasets - Kaggle](https://www.kaggle.com/datasets)\n - [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/datasets.html)\n - [data.world](https://data.world/)\n - [Registry of Open Data on AWS](https://registry.opendata.aws)\n - [brasil.io](https://brasil.io/datasets)\n - [Microsoft Research Open Data](https://msropendata.com/)\n - [Datasets for Recommender Systems](https://github.com/caserec/Datasets-for-Recommneder-Systems)\n - [Google Dataset Search](https://toolbox.google.com/datasetsearch)\n - [Information is beautiful](https://informationisbeautiful.net/data/)\n - [Dados do Governo Brasileiro](http://dados.gov.br)\n - [Instituto de Pesquisa Econômica Aplicada](http://www.ipeadata.gov.br)\n - [Banco Central do Brasil](https://www3.bcb.gov.br)\n - [Dados do Governo dos Estados Unidos](http://data.gov)\n - [Dados sobre as cidades dos EUA](http://datasf.org)\n - [Dados do Governo do Canadá (em inglês e francês)](http://open.canada.ca)\n - [Dados do Governo do Reino Unido](https://data.gov.uk)\n - [Dados da União Europeia](http://open-data.europa.eu/en/data)\n - [Dados do Censo dos EUA (dados da população americana e mundial)](http://www.census.gov)\n - [Banco de Dados da NASA](https://data.nasa.gov)\n - [Dados do Banco Mundial](http://data.worldbank.org)\n - [Dados sobre a saúde](http://www.healthdata.gov)\n - [Dados sobre diversos países (incluindo o Brasil)](http://knoema.com)\n - [Dados sobre diversas áreas de negócio e finanças](https://www.quandl.com)\n - [Google Trends](https://www.google.com/trends)\n - [Google Finance](https://www.google.com/finance)\n - [Gapminder](http://www.gapminder.org/data)\n - [Dados com milhões de músicas](https://aws.amazon.com/datasets/million-song-dataset)\n - [Dados sobre os mais diversos assuntos](http://www.freebase.com)\n - [DBpedia](http://wiki.dbpedia.org/)\n - [Open Data Monitor](http://opendatamonitor.eu)\n - [Open Data Network](http://www.opendatanetwork.com)\n - [R Datasets](http://www.stats4stem.org/data-sets.html)\n - [Stasci](http://www.statsci.org/datasets.html)\n - [Portal de Estatística](http://www.statista.com)\n - [Data 360](http://www.data360.org)\n - [Reconhecimento de Faces](http://www.face-rec.org/databases)\n - [Stanford Large Network Dataset Collection](http://snap.stanford.edu/data)\n - [Datahub](http://datahub.io/dataset)\n - [TeraData](teradata.com/Portuguese/Banco_de_Dados_da_Teradata)\n - [Oracle Exadata](oracle.com/exadata)\n - [Food And Agriculture Organization of the United Nations](http://www.fao.org/faostat/en/#home)\n\n--------------------------------------------------\n\u003ch2 id=\"metodologiasageis\"\u003eMetodologias ágeis\u003c/h2\u003e\n\n- [CRISP-DM](https://pt.wikipedia.org/wiki/Cross_Industry_Standard_Process_for_Data_Mining) [**pt-br**]\n\n--------------------------------------------------\n\u003ch2 id=\"imagens\"\u003eDados em Imagens\u003c/h2\u003e\n\n\u003ca href=\"https://www.domo.com/blog/data-never-sleeps-5/\"\u003e\u003cimg src=\"https://web-assets.domo.com/blog/wp-content/uploads/2017/07/17-blog-featured-data-never-sleeps-675x400-1.jpg\" alt=\"infographic\" /\u003e\u003c/a\u003e\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fpizzadedados%2Fdatascience-pizza","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fpizzadedados%2Fdatascience-pizza","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fpizzadedados%2Fdatascience-pizza/lists"}