{"id":44574755,"url":"https://github.com/pradelf/dsfs-ft-35","last_synced_at":"2026-02-14T04:15:56.710Z","repository":{"id":291940322,"uuid":"979249034","full_name":"pradelf/dsfs-ft-35","owner":"pradelf","description":"Jedha : Dépôt de Certification de Francis Pradel","archived":false,"fork":false,"pushed_at":"2026-02-02T23:06:09.000Z","size":68,"stargazers_count":0,"open_issues_count":0,"forks_count":0,"subscribers_count":1,"default_branch":"main","last_synced_at":"2026-02-03T12:14:05.547Z","etag":null,"topics":["data-science","formation","ia"],"latest_commit_sha":null,"homepage":"https://promotion.francispradel.fr","language":null,"has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"mit","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/pradelf.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null,"zenodo":null,"notice":null,"maintainers":null,"copyright":null,"agents":null,"dco":null,"cla":null}},"created_at":"2025-05-07T08:15:11.000Z","updated_at":"2026-02-02T23:06:12.000Z","dependencies_parsed_at":"2025-10-22T15:24:08.271Z","dependency_job_id":"f5794baf-e84a-4a15-a3b1-3dc126b72c00","html_url":"https://github.com/pradelf/dsfs-ft-35","commit_stats":null,"previous_names":["pradelf/dsfs-ft-35"],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/pradelf/dsfs-ft-35","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/pradelf%2Fdsfs-ft-35","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/pradelf%2Fdsfs-ft-35/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/pradelf%2Fdsfs-ft-35/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/pradelf%2Fdsfs-ft-35/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/pradelf","download_url":"https://codeload.github.com/pradelf/dsfs-ft-35/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/pradelf%2Fdsfs-ft-35/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":29435813,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-02-14T03:34:37.767Z","status":"ssl_error","status_checked_at":"2026-02-14T03:34:09.092Z","response_time":53,"last_error":"SSL_connect returned=1 errno=0 peeraddr=140.82.121.5:443 state=error: unexpected eof while reading","robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":false,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["data-science","formation","ia"],"created_at":"2026-02-14T04:15:55.994Z","updated_at":"2026-02-14T04:15:56.706Z","avatar_url":"https://github.com/pradelf.png","language":null,"funding_links":[],"categories":[],"sub_categories":[],"readme":"# Certification de Francis Pradel : cohorte DSFS-FT-35 chez [JEDHA](https://www.jedha.co/formations/formation-data-scientist)\n\n## Dépôt descriptif pour les projets de données du cursus Fullstack de Jedha (DSFS-FT-35)\n\n### pré requis pour lancer l'évaluation\n\nIl est necessaire d'avoir installer la version Python 3.12 sur sa machine.\nSe placer dans un répertoire propre et vide d'évaluation. Sous Linux ou Mac OS, saisir les commandes ci-dessous\n\n```bash\npython3.12 -m venv certification\nsource certification/bin/activate\npip install --upgrade pip\npip install -e git+https://github.com/pradelf/fpcia.git#egg=fpcia\n\n\n```\n\nà l'issue de ces opérations, vous aurez la libraire python nécessaire pour l'execution des projets : FPCIA [https://github.com/pradelf/fpcia](https://github.com/pradelf/fpcia)\n\n- Kayak : [https://github.com/pradelf/kayak](https://github.com/pradelf/kayak)\n- Speed Dating : [https://github.com/pradelf/speeddating](https://github.com/pradelf/speeddating)\n- Conversion Challenge : [https://github.com/pradelf/conversion-rate-challenge](https://github.com/pradelf/conversion-rate-challenge)\n- Walmart Sales : [https://github.com/pradelf/Walmart-sales](https://github.com/pradelf/Walmart-sales)\n- Uber Pickups : [https://github.com/pradelf/uberpickups](https://github.com/pradelf/uberpickups)\n- ATT Spam Detector : [https://github.com/pradelf/att](\u003chttps://github.com/pradelf/att\u003e)\n- Get Around : [https://github.com/pradelf/getaround](https://github.com/pradelf/getaround)\n- OASIS (projet collectif) : [https://github.com/pradelf/oasis](https://github.com/pradelf/oasis)\n\nLe projet [Steam](https://github.com/pradelf/steam) est particulier car il est nécessaire de la faire executer dans l'environnement [Databricks](https://www.databricks.com/fr)\nsi vous voulez exporter les dépendances des projets, vous pouvez utiliser la commande :\n\n```bash\npip freeze -l git+https://github.com/pradelf/fpcia.git@6d2560ca7e97f6aa67a97c89445da45907015b30#egg=fpcia\n```\n\nVous pouvez vérifer votre environnement local d'évaluation avec la commande ```pip config list -v``` qui vous donne votre configuration local de recherche de Python et des librairies utilisées.\n\n##  💾 Projets de Data Science \u0026 Machine Learning\n\n###  🧱 Bloc 1. Construction, alimentation et mise en place d'une infrastructure de gestion de données\n\n#### Kayak\n\n- Extraction automatisée des informations sur les hôtels et la météo pour une liste donnée de villes\n- Stockage des données nettoyées dans AWS S3, puis transfert vers une base AWS RDS\n- Requêtes SQL pour sélectionner les meilleures villes selon les conditions météo\n- Génération de cartes interactives illustrant les températures quotidiennes et les gammes de prix des hôtels.\n\n##### Tech Stack\n\nAPIs · Scrapy · Boto3 · AWS S3 · AWS RDS · SQL · SQLAlchemy · Plotly\n\n### 🔍 Bloc 2. Analyse exploratoire, descriptive et inférentielle de données (EDA)\n\n####  Speed Dating\n\n- Exploration d’un jeu de données de speed dating\n- Identification des facteurs influençant la probabilité d’obtenir un second rendez-vous.\n\n#####  Tech Stack\n\nPandas · Numpy · Plotly · Matplotlib\n\n### 🤖 Bloc 3. Analyse prédictive de données structurées par l'intelligence artificielle (IA \u0026 Machine Learning)\n\n#### Conversion Challenge\n\n- Modélisation du taux de conversion d’une newsletter à partir de variables déséquilibrées\n\n#### Walmart Sales\n\n- Estimation des ventes hebdomadaires des magasins\n- Interprétation des indicateurs économiques pour planifier les campagnes marketing\n\n####  Uber Pickups\n\n- Optimisation du temps d’attente des clients\n- Création d’algorithmes de détection de zones chaudes (hot-zones) selon l’heure de la journée\n\n##### Tech Stack\n\nScikit-learn · XGBoost · Régression linéaire / logistique · Arbres de décision · Forêts aléatoires · Boosting · GridSearch · Validation croisée · K-Means · DBSCAN · Mélange gaussien\n\n### 💬 Bloc 4. Analyse prédictive de données non-structurées par l'intelligence artificielle\n\n#### AT\u0026T Spam Detector\n\n- Développement d’un modèle de deep learning détectant automatiquement les spams selon le contenu textuel\n- Traitement complet du langage naturel (NLP) : tokenisation, lemmatisation, encodage, embedding\n\n##### Tech Stack\n\nPyTorch · Transformers · NLP\n\n### 🏭 Bloc 5 : Industrialisation d'un algorithme d'apprentissage automatique et automatisation des processus de décision\n\n### Get Around\n- Analyser les retards de restitution des véhicules afin de mesurer leur impact sur la satisfaction client et la planification des locations suivantes.\n- Déterminer le délai minimal optimal entre deux locations pour réduire les frictions tout en préservant les revenus des propriétaires et de la plateforme.\n- Développer un modèle de prédiction et une API /predict pour optimiser la tarification des locations grâce au Machine Learning.\n\n##### Tech Stack\n\nAPIs · Docker · MLFlow · Streamlit · Plotly\n\n### 🏝️ Bloc 6. Direction de projets de gestion de données (Projet collectif)\n\n#### Oasis\n\n- Ce projet vise à prédire les prix de l’immobilier, en se concentrant principalement sur l’impact des événements climatiques.\n- Notre objectif est d’identifier les zones sûres et rentables en analysant comment différents phénomènes météorologiques et climatiques influencent la valeur des biens.\n- À mesure que le projet évoluera, nous prévoyons d’intégrer d’autres événements majeurs susceptibles d’affecter les prix de l’immobilier.\n\n\n##### Tech Stack\n\nPandas · Numpy · Plotly · LightGBM · MLFlow · Streamlit · Hugging Face · Boto3 · AWS S3\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fpradelf%2Fdsfs-ft-35","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fpradelf%2Fdsfs-ft-35","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fpradelf%2Fdsfs-ft-35/lists"}