{"id":28331817,"url":"https://github.com/tuliosg/cdp","last_synced_at":"2026-03-03T20:33:26.561Z","repository":{"id":292719881,"uuid":"958851174","full_name":"tuliosg/CDP","owner":"tuliosg","description":"Repositório do curso \"Ciência de Dados para Pesquisa\".","archived":false,"fork":false,"pushed_at":"2025-05-15T23:30:29.000Z","size":877,"stargazers_count":5,"open_issues_count":0,"forks_count":1,"subscribers_count":1,"default_branch":"main","last_synced_at":"2026-01-12T19:25:14.796Z","etag":null,"topics":["data-analysis","data-manipulation","data-science","data-visualization","google-colab","jupyter-notebook","python"],"latest_commit_sha":null,"homepage":"","language":"Jupyter Notebook","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"mit","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/tuliosg.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE-CODE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":"CITATION.cff","codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null,"zenodo":null}},"created_at":"2025-04-01T21:40:12.000Z","updated_at":"2025-09-24T20:08:20.000Z","dependencies_parsed_at":"2025-05-11T19:38:35.701Z","dependency_job_id":"718279f6-f70e-47f5-a65e-2eb5ed66e310","html_url":"https://github.com/tuliosg/CDP","commit_stats":null,"previous_names":["tuliosg/cdp"],"tags_count":1,"template":false,"template_full_name":null,"purl":"pkg:github/tuliosg/CDP","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/tuliosg%2FCDP","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/tuliosg%2FCDP/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/tuliosg%2FCDP/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/tuliosg%2FCDP/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/tuliosg","download_url":"https://codeload.github.com/tuliosg/CDP/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/tuliosg%2FCDP/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":30058301,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-03-03T18:21:05.932Z","status":"ssl_error","status_checked_at":"2026-03-03T18:20:59.341Z","response_time":61,"last_error":"SSL_connect returned=1 errno=0 peeraddr=140.82.121.5:443 state=error: unexpected eof while reading","robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":false,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["data-analysis","data-manipulation","data-science","data-visualization","google-colab","jupyter-notebook","python"],"created_at":"2025-05-26T18:57:20.919Z","updated_at":"2026-03-03T20:33:26.529Z","avatar_url":"https://github.com/tuliosg.png","language":"Jupyter Notebook","funding_links":[],"categories":[],"sub_categories":[],"readme":"# Ciência de Dados para Pesquisa\n\u003e Edição especial: Ciências Humanas\n\n## Sobre o curso\nEste curso é destinado a pesquisadores das Ciências Humanas que desejam aprender conceitos fundamentais de Ciência de Dados aplicados à pesquisa acadêmica. Utilizando uma abordagem prática e acessível, o curso trata das bases da ciência de dados, desde definições e conceitos teóricos até exercícios e implementações de código, através da linguagem de programação Python. \n\n## Objetivos\n* Introduzir conceitos fundamentais de Ciência de Dados;\n* Desenvolver habilidades práticas de organização, tabulação e limpeza de dados;\n* Apresentar noções básicas de programação em Python focadas na solução de problemas reais de pesquisa;\n* Explicar conceitos estatísticos comumente utilizados em pesquisa;\n* Criar visualizações para comunicar resultados.\n  \n## Estrutura do curso\nO curso está organizado em três módulos principais:\n\n### Módulo 1: Introdução à ciência de dados e Python\n* Conceitos fundamentais sobre dados e sua importância na pesquisa;\n* O que é Ciência de Dados e como pode beneficiar pesquisas;\n* Introdução à programação e conceitos básicos (variáveis, tipos de dados, estruturas);\n* Programação interativa com Google Colab;\n* Primeiros passos com Python.\n\n### Módulo 2: Organização e pré-processamento\n* Princípios de organização de dados em planilhas;\n* Importação e exportação de dados com pandas;\n* Exploração inicial de conjuntos de dados;\n* Limpeza e transformação de dados.\n\n### Módulo 3: Análise e visualização\n* Análise exploratória de dados;\n* Estatística descritiva;\n* Medidas de correlação;\n* Princípios de visualização de dados;\n* Criação de gráficos básicos;\n* União entre análise e visualização.\n  \n## Ferramentas e recursos\n### Ambientes de trabalho\n* **Google Colab**;\n* **Google Planilhas**.\n\n### Bibliotecas Python\n* **pandas**;\n* **matplotlib/seaborn**;\n* **scipy**.\n\n## Navegação pelo repositório\n* Cada módulo está contido em uma pasta. Clique na pasta correspondente para acessar o material completo;\n* Os materiais contidos em cada módulo estão em pastas com suas respectivas descrições: os Jupyter Notebooks na **📁notebooks** de cada módulo, os conjuntos de dados na **📁 dados** e as planilhas na **📁 planilhas**;\n* O arquivo `README` de cada pasta corresponde ao material escrito completo relacionado àquele módulo;\n* As referências citadas ao longo do material escrito e nos notebooks podem ser encontradas no arquivo `bibliography.bib`.\n\n## Agradecimentos\nAgradeço à Nayla Chagas ([@nhawlao](https://github.com/nhawlao)) por aceitar o convite para colaborar neste projeto e por contribuir de forma brilhante no Módulo de Organização e pré-processamento. Sua expertise em engenharia de dados foi essencial para a qualidade do material.\n\nEste trabalho faz parte da minha atuação como Embaixador da Rede Brasileira de Reprodutibilidade (RBR) e só se tornou realidade graças ao apoio e à infraestrutura do Laboratório Multiusuário de Informática e Documentação Linguística ([LAMID](https://github.com/lamid-ufs)).\n\n\n## Atribuição e Citação\n\nSe você utilizar este material, agradecemos a atribuição adequada. Você pode fazê-lo das seguintes maneiras, dependendo do contexto:\n\n* **Link para o repositório e menção aos autores**\n\n```\nMaterial baseado no curso \"Ciência de Dados para Pesquisa\" por Túlio Sousa de Gois e Nayla Sahra Santos das Chagas\nDisponível em: https://github.com/tuliosg/CDP\n```\n\n* **Citação formal**\n\n```\n@software{gois_2025_15384287,\n  author       = {Gois, Túlio Sousa and\n                  Chagas, Nayla Sahra Santos},\n  title        = {Ciência de Dados para Pesquisa},\n  month        = may,\n  year         = 2025,\n  publisher    = {Zenodo},\n  version      = {v1.0},\n  doi          = {10.5281/zenodo.15384287},\n  url          = {https://doi.org/10.5281/zenodo.15384287},\n  swhid        = {swh:1:dir:9aef7b4d4b890b410cc8e51b565bd15ea30e46c7\n                   ;origin=https://doi.org/10.5281/zenodo.15384286;vi\n                   sit=swh:1:snp:56371c28e746ab411ad408be706b32a0fae7\n                   f449;anchor=swh:1:rel:981843493a81f2b30c524b963522\n                   0754bbdf30d1;path=tuliosg-CDP-1e0d845\n                  },\n}\n```\n\n## Licença\n\n- **Conteúdo textual** (arquivos `*.md`) está licenciado sob [Creative Commons Attribution 4.0 (CC BY 4.0)](https://creativecommons.org/licenses/by/4.0/).\n- **Código-fonte** (Jupyter Notebooks) está licenciado sob a [Licença MIT](https://opensource.org/licenses/MIT).\n\n\n\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Ftuliosg%2Fcdp","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Ftuliosg%2Fcdp","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Ftuliosg%2Fcdp/lists"}