{"id":20120263,"url":"https://github.com/kalelmartinho/7daysofcode","last_synced_at":"2025-11-27T08:03:16.938Z","repository":{"id":158339439,"uuid":"486700980","full_name":"kalelmartinho/7daysOfCode","owner":"kalelmartinho","description":"Esse projeto tem como objetivo experienciar o dia a dia de um cientista de dados. É um desafio com duração de uma semana, proposto pela Alura. ","archived":false,"fork":false,"pushed_at":"2022-04-28T18:23:06.000Z","size":10994,"stargazers_count":1,"open_issues_count":0,"forks_count":0,"subscribers_count":1,"default_branch":"master","last_synced_at":"2025-03-02T20:16:14.952Z","etag":null,"topics":["7daysofcode","alura","data-cleaning","data-science","data-visualization","forecasting","machine-learning"],"latest_commit_sha":null,"homepage":"","language":"Jupyter Notebook","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"mit","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/kalelmartinho.png","metadata":{"files":{"readme":"README.MD","changelog":null,"contributing":null,"funding":null,"license":"LICENSE.md","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null}},"created_at":"2022-04-28T18:10:38.000Z","updated_at":"2023-01-25T13:12:25.000Z","dependencies_parsed_at":"2023-09-22T07:18:39.320Z","dependency_job_id":null,"html_url":"https://github.com/kalelmartinho/7daysOfCode","commit_stats":{"total_commits":2,"total_committers":1,"mean_commits":2.0,"dds":0.0,"last_synced_commit":"b589d901f10e31c292900498547a30cbfbec48b5"},"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/kalelmartinho/7daysOfCode","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/kalelmartinho%2F7daysOfCode","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/kalelmartinho%2F7daysOfCode/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/kalelmartinho%2F7daysOfCode/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/kalelmartinho%2F7daysOfCode/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/kalelmartinho","download_url":"https://codeload.github.com/kalelmartinho/7daysOfCode/tar.gz/refs/heads/master","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/kalelmartinho%2F7daysOfCode/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286079811,"owners_count":27282121,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","status":"online","status_checked_at":"2025-11-27T02:00:05.795Z","response_time":58,"last_error":null,"robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":true,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["7daysofcode","alura","data-cleaning","data-science","data-visualization","forecasting","machine-learning"],"created_at":"2024-11-13T19:19:26.700Z","updated_at":"2025-11-27T08:03:16.922Z","avatar_url":"https://github.com/kalelmartinho.png","language":"Jupyter Notebook","readme":"![](https://github.com/kalelmartinho/7daysOfCode/blob/master/7daysOfCode.png?raw=true)\n\n---\n\nProjeto por *Kalel Leonardo Martinho*\n\n#  [#7DaysOfCode - Ciência de Dados](https://7daysofcode.io/)\n\n---\n\n### 📝 Introdução do projeto:\n\nOs 7 Days de Ciência de Dados é projeto para passar por todo ciclo de coleta, limpeza, tratamento, exploração e análise de dados. Explorando uma base de dados do governo, trazer esses dados para o ambiente de análise utilizar SQL, Python, Pandas, Plotly entre outra ferramentas comuns no dia a dia de alguém que trabalha na área. No final, você vai ter uma visão ampla de diversos processos dentro da área e conseguirá entender como cada uma das etapas se encaixa no processo de análise de dados.\n\n---\n\n### Tecnologias utilizadas\n\n- Python 3\n- Jupyter Notebook\n- Pandas\n- Sci-kit Learn\n- Matplotlib\n- Seaborn\n- SciPy\n- NumPy\n- Flask\n\n---\n\n### Etapas:\n\n| Dias | Etapas | Dados |\n:---:|:----|:----|\n| Dia 1 | [Data Cleaning](https://github.com/kalelmartinho/7daysOfCode/blob/master/ceaps/data_cleaning.ipynb) | [CEAPS](https://www12.senado.leg.br/transparencia/dados-abertos-transparencia/dados-abertos-ceaps) |\n| Dia 2 | [Storytelling](https://github.com/kalelmartinho/7daysOfCode/blob/master/ceaps/data_visualization.ipynb) | [CEAPS](https://www12.senado.leg.br/transparencia/dados-abertos-transparencia/dados-abertos-ceaps) |\n| Dia 3 | [Forecasting](https://github.com/kalelmartinho/7daysOfCode/blob/master/ceaps/forecasting.ipynb) | [CEAPS](https://www12.senado.leg.br/transparencia/dados-abertos-transparencia/dados-abertos-ceaps) |\n| Dia 4 | [Machine Learning](https://github.com/kalelmartinho/7daysOfCode/blob/master/movie_lens/machine_learning.ipynb) | [MovieLens](https://grouplens.org/datasets/movielens/100k/) |\n| Dia 5 | [API](https://github.com/kalelmartinho/7daysOfCode/blob/master/movie_lens/api.py) | [MovieLens](https://grouplens.org/datasets/movielens/100k/) |\n| Dia 5 | [Split Testing](https://github.com/kalelmartinho/7daysOfCode/blob/master/test_ab/split_testing.ipynb) | [Test A/B](https://www.kaggle.com/datasets/zhangluyuan/ab-testing) |\n| Dia 7 | [Documentation](https://github.com/kalelmartinho/7daysOfCode/blob/master/README.MD) | N/A |\n\n---\n\n- [x] Aplicar técnicas de limpeza de dados\n- [x] Explorar e visualizar os dados limpos\n- [x] Construir um modelo de predição\n- [x] Criar um modelo para um sistema de recomendação\n- [x] Disponibilizar o sistema de recomendação\n- [x] Documentar e publicar o projeto\n\n---\n\n### Fonte / Referência\n\nEste projeto surgiu com o desafio [#7DaysOfCode](https://7daysofcode.io/) proposto pela [Alura](https://www.alura.com.br/) com a ideia de \"como praticar o que tenho aprendido?\".\n\n---\n\n### 📝 Descrição do projeto:\n\nOs dias 1, 2 e 3 do projeto teve como objetivo explorar o conjunto de dados abertos que está disponível no portal do [CEAPS](https://www12.senado.leg.br/transparencia/dados-abertos-transparencia/dados-abertos-ceaps) (Cota para Exercício da Atividade Parlamentar dos Senadores),\nque contém todos os gastos que senadores brasileiros declararam, divididos por ano. Esse conjunto de dados já criou várias iniciativas interessantes,\ncomo a [Operação Serenata de Amor](https://serenata.ai/), que aplica Inteligência Artificial para analisar gastos de deputados brasileiros, e que já foi capaz de identificar vários usos indevidos do dinheiro público.\n\nOs dias 4 e 5 teve como objetivo criar um sistema de recomendação a partir do [MovieLens](https://grouplens.org/datasets/movielens/100k/), que é um dataset clássico usado em problemas de sistema de recomendação. Ele é usado até em artigos científicos para validar novos tipos de algoritmos de recomendação.\n\nO dia 6 o desafio eras simular que já executei o Teste A/B no dataset entregue e que está com os resultados em mãos, executar um teste de hipótese nele para validar se a versão nova do site (com o sistema de recomendação) é melhor que a antiga.\n\nPor fim, no sétimo dia, o desafio era subir e documentar o projeto aqui, no GitHub e em meu portfólio.\n\n---\n\n### Dificuldades\n\nDado o nível de complexidade de algumas etapas do desafios, durante o desenvolvimento do projeto encontrei obstáculos. Como estou no processo familiarização e aprendizado com algumas ferramentas e tecnologias, constantamente me senti desafiado, em alguns momentos tendo que dedicar mais tempo para estudar a documentação de algumas bibliotecas e assistir video-aulas, em outros procurei por soluções de outros participantes no GitHub, que foram de grande ajuda para o resultado final desse projeto.\n\nPor isso, se você participou ou está participando desse desafio, sinta-se livre para utilizar esse projeto como referência.\n\n---\n\n### Minhas motivacões\n\nApós recém concluir cursos no campo de Data Science, me incentivei a consolidar meu aprendizado, optei então por procurar desafios e assim conheci o #7daysOfCode. \n\n---\n\n### Considerações finais\n\nAo longo dos meus estudos pretendo revisitar esse projeto, encontrar novas soluções e melhorias para algumas das etapas do projeto.\n\n---\n\n## 📊 [Kalel Leonardo Martinho](http://www.kalel.me/)\n\n---\n","funding_links":[],"categories":[],"sub_categories":[],"project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fkalelmartinho%2F7daysofcode","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fkalelmartinho%2F7daysofcode","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fkalelmartinho%2F7daysofcode/lists"}