Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/aranzadata/videogame_trends

Análisis de datos exploratorio para identificar patrones y tendencias en las ventas de videojuegos, con el objetivo de detectar juegos prometedores para el siguiente año.
https://github.com/aranzadata/videogame_trends

exploratory-data-analysis scipy seaborn ttest

Last synced: 2 days ago
JSON representation

Análisis de datos exploratorio para identificar patrones y tendencias en las ventas de videojuegos, con el objetivo de detectar juegos prometedores para el siguiente año.

Awesome Lists containing this project

README

        

# videogame_trends
El objetivo del presente proyecto es identificar las plataformas y géneros de videojuegos con mayor potencial de ventas para el año 2017 en tres regiones del mundo: Norte América, Europa y Japón, así como describir diferencias en el comportamiento de los usuarios de estos mercados.

Se analiza una base de datos con información reelevante sobre títulos de videojuegos, ventas, calificación de usuarios, críticos y clasifiación ESRB (Entertainment Software Rating Board) desde la década de los ochenta hasta 2016.

El análisis se divide en cinco etapas principales:

Importción y visualización inicial. Se realiza la importación de la base de datos y se describen sus principales características, número de filas y columnas, tipos de datos, si existen datos ausentes y/o duplicados y el formato de los datos. En esta sección se establecen los cambios pertinentes a realizar en la etapa de Preparación de datos.
Preparación de datos: En esta etapa se realizan los cambios establecidos en la etapa anterior así como analizar el tratamiento adecuado para los datos duplicados y ausentes. Dentro de esta etapa se ralizan cambios de tipos de datos de columnas, se modifica el formato de texto de nombres y columnas, se analizan los datos ausentes y duplicados y se propone reemplazar, descartar o modificar de acuerdo a lo que se considere pertinente. También se realiza enriquecimiento de datos, se agregan columnas o datos que puedan enriquecer el análisis.
Análisis y visualización de datos. En esta etapa se hace el análisis exloratorio de datos, se realizan tablas y gráficas con el objetivo de comprender relaciones entre variables y formular hipótesis para la siguietne etapa. En este trabajo se analizan los siguientes aspectos:

Títulos lanzados anualmente por género y plataforma. Se calcula el número de lanzamientos anuales y se grafican. Estas gráficas ayudan a visualizar y establecer periodos de ventas y focalizar el análisis a un periodo de interés.

Ventas anuales globales por plataforma. Para el periodo de interés se calculan las ventas anuales globales por cada plataforma y se grafican. Se identifican las plataformas líderes en ventas. Se grafica la distribución de ventas globales para cada una de las plataformas líderes, se comparan sus ventas promedio, valores esperados y valores atípicos.

Tiempo de reelevancia por plataforma. Para las plataformas que han dejado de tener lanzamientos se calcula el promedio de años con ventas para definir cuál es el periodo en el que las plataformas actuales son reelevante. Se identifican las plataformas vigentes con potencial de ventas para el año 2017.

Relación entre críticas y ventas. Se realizan gráficos de dispersión de ventas contra calificación de críticos y usuarios. Se calcula la correlación entre estas variables. Esta sección ayuda a entender si la calificación de críticos o usuarios puede tomarse en cuenta para predecir el nivel de ventas de un juego.

Ventas de juegos multiplataforma. Se realiza una gráfica de dispersión y un diagrama de cajas de las ventas globales de un conjunto de títulos lanzados en las dos plataformas líderes del periodo de interés. Esto con el objetivo de entender si existen diferencias entre los usuarios de ambas plataformas e identificar la relación entre estas.

Ventas anuales globales por género. Se calculan y grafican las ventas globales anuales por género, para idenificar las tendencias futuras para el mercado de 2017.

Resumen por región para Norte América, Europa y Japón. Para tener un análisis más focalizado del mercado, se identifican las cinco plataformas y cinco géneros con mayor proporción de ventas para cada una de estas regiones. Además se realizan diagramas de cajas para evaluar si la clasificación ESRB tiene algún efecto en las ventas para cada región.

Pruebas de hipóteis. En esta sección se realizan pruebas estadísticas para corroborar o descartar las observciones realizadas en la etapa de análisis exloratorio. En el presente trabajo se desea probar las siguientes hiótesis:

Las calificaciones promedio de los usuarios para las plataformas Xbox One y PC son las mismas.

Las calificaciones promedio de los usuarios para los géneros de Acción y Deportes son diferentes.