Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/vincent-tran-94/sentiment_analytics_video_games
Analyse sentimentale des tweets sur les jeux vidéos
https://github.com/vincent-tran-94/sentiment_analytics_video_games
data-science data-visualization machine-learning natural-language-processing python sentiment-analysis sk-learn tweet-analysis
Last synced: 24 days ago
JSON representation
Analyse sentimentale des tweets sur les jeux vidéos
- Host: GitHub
- URL: https://github.com/vincent-tran-94/sentiment_analytics_video_games
- Owner: vincent-tran-94
- Created: 2025-01-17T11:53:31.000Z (about 1 month ago)
- Default Branch: main
- Last Pushed: 2025-01-24T21:43:40.000Z (28 days ago)
- Last Synced: 2025-01-24T22:27:12.847Z (28 days ago)
- Topics: data-science, data-visualization, machine-learning, natural-language-processing, python, sentiment-analysis, sk-learn, tweet-analysis
- Language: Jupyter Notebook
- Homepage:
- Size: 1.94 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Sentiment_Analytics_Video_Games
Analyse sentimentale des tweets sur les jeux vidéosL'objectif principal de ce projet est de déterminer si un type de jeu est perçu comme bon, mauvais ou neutre à partir d'un ensemble de tweets, en utilisant des modèles de traitement du langage naturel (NLP) ou de Machine Learning.
Dans un premier temps, nous allons explorer et analyser le jeu de données pour mieux comprendre sa structure. Cela inclura des étapes de prétraitement des données visant à nettoyer les valeurs manquantes, éliminer les doublons et améliorer la qualité du contenu des tweets afin de mieux représenter le corpus.
Ensuite, nous utiliserons une méthode de pondération des mots appelée TF-IDF (Term Frequency-Inverse Document Frequency). Cette méthode permettra d'identifier la fréquence des mots et leur importance relative pour chaque tweet.
Une fois les données préparées, nous entraînerons différents modèles de Machine Learning à l'aide de la bibliothèque Scikit-learn. Ces modèles seront évalués pour identifier les plus performants à l'aide de techniques de validation croisée.
Enfin, nous validerons les performances du modèle sélectionné sur un jeu de données différent.
Par ailleurs, nous explorerons des outils d'interprétabilité pour analyser les prédictions du modèle. Cela nous permettra de comprendre et d'identifier les erreurs, que ce soit sur le jeu d'entraînement ou le jeu de test.
https://www.kaggle.com/datasets/jp797498e/twitter-entity-sentiment-analysis (Lien de téléchargement de deux datasets)
## Image sur les sentiments des mots par nom de jeu
## Installations à faire
- Version Python 3.11.7
Importer le lien du projet et puis créez votre environnement virtuel
```
git clone https://github.com/vincent-tran-94/Sentiment_Analytics_Games.git
python3 -m venv env
source env/Scripts/activate
```
Installer les dépendances
```
pip install -r requirements.txt
```