Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/hamzacham/data_set_projet-1
data_set
https://github.com/hamzacham/data_set_projet-1
business-analytics data-science data-science-portfolio data-visualization database project
Last synced: 3 days ago
JSON representation
data_set
- Host: GitHub
- URL: https://github.com/hamzacham/data_set_projet-1
- Owner: hamzacham
- Created: 2024-11-16T02:50:01.000Z (3 months ago)
- Default Branch: main
- Last Pushed: 2024-11-17T19:27:52.000Z (3 months ago)
- Last Synced: 2024-12-15T23:32:29.592Z (about 2 months ago)
- Topics: business-analytics, data-science, data-science-portfolio, data-visualization, database, project
- Language: Jupyter Notebook
- Homepage:
- Size: 12.9 MB
- Stars: 1
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
#jeux_donnée #data
# Projet d'Analyse de Données - Jeux de Données Cinéma 🎬## Description du Projet
Ce projet est une analyse exploratoire de données basée sur un jeu de données de films. Le dataset contient des informations détaillées sur les films, incluant des variables comme le titre, la date de sortie, le genre, la durée, les notes et le nombre de votes.L'objectif de ce projet est de répondre à plusieurs questions analytiques pour extraire des insights clés sur les films, tels que les genres les plus populaires, les pays produisant le plus de films, ou encore les corrélations entre les notes et d'autres facteurs.
## Données
Le jeu de données contient les informations suivantes :
-Titre : titre du film.
-Date parution : date de parution du film.
-Genre : genre du film.
-Durée : durée en minutes du film.
-Pays : pays d’origine du film.
-Langue : langue de la version originale du film.
-Réalisateur : réalisateur du film.
-Auteur : scénariste du film.
-Producteur : producteur du film.
-Acteurs : liste des acteurs ayant participé au film.
-Note : valeur moyenne de l’ensemble des notes attribuées par les utilisateurs du site. La valeur minimum possible est 0 et le maximum est 10.
-Votes : nombre de personnes ayant attribué une note au film.
-Note hommes1 : note moyenne des utilisateurs de genre masculin.
-Votes hommes1 : nombre d’utilisateurs masculins ayant attribué une note au film.
-Note femmes1 : note moyenne des utilisateurs de genre féminin.
-Votes femmes1 : nombre d’utilisateurs féminins ayant attribué une note au film.
-Note USA1 : note moyenne des utilisateurs américains.
-Votes USA1 : nombre d’utilisateurs américains ayant attribué une note au film.
-Note hors USA1 : note moyenne des utilisateurs qui ne sont pas américains.
-Votes hors USA1 : nombre d’utilisateurs qui ne sont pas américains ayant attribué une note au film.## Méthodologie
1. **Nettoyage des données** : Utilisation de Pandas pour traiter les valeurs manquantes, harmoniser les formats de données, et retirer les doublons.
2. **Analyse exploratoire** : Analyse des distributions de variables, corrélations, et tendances générales.## Outils Utilisés
- **Pandas** : Pour le nettoyage et la manipulation des données
- **Jupyter Notebook** : Pour documenter et exécuter les analyses## Résultats
Grâce à cette analyse, nous avons pu :
- Identifier les genres de films les plus populaires.
- Analyser l'influence de la durée sur la note moyenne.
- Examiner les pays produisant le plus de films et les tendances selon les années.
- (Ajoute ici les autres résultats clés)## Conclusion
Ce projet a permis de mettre en pratique des compétences en nettoyage de données, analyse exploratoire et visualisation, tout en explorant des données cinématographiques intéressantes.## Auteur
Hamza - [Ton profil GitHub](https://github.com/hamzacham)
---
**Keywords**: data analysis, pandas, cinema dataset, Python, data visualization, machine learning, jupyter_notebook, pandas