Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/karencofre/marketing-segmentacion-en-powerbi
Proyecto prueba de hipótesis en powerbi y python
https://github.com/karencofre/marketing-segmentacion-en-powerbi
bigquery google-colab powerbi python sql statsmodels
Last synced: about 1 month ago
JSON representation
Proyecto prueba de hipótesis en powerbi y python
- Host: GitHub
- URL: https://github.com/karencofre/marketing-segmentacion-en-powerbi
- Owner: karencofre
- Created: 2024-08-22T03:22:53.000Z (3 months ago)
- Default Branch: main
- Last Pushed: 2024-09-26T03:19:49.000Z (about 2 months ago)
- Last Synced: 2024-09-29T06:06:59.205Z (about 2 months ago)
- Topics: bigquery, google-colab, powerbi, python, sql, statsmodels
- Language: Jupyter Notebook
- Homepage:
- Size: 1.83 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Pruebas de Hipótesis y Segmentación en PowerBI
Ficha Técnica: Proyecto de Análisis de Datos
Título del Proyecto: Prueba de Hipótesis en PowerBI
Objetivo:
Realizar una prueba de hipótesis, utilizando una técnica de analisis de datos de segmentación y validación de Hipótesis.Equipo:
Trabajo Individual.Herramientas y Tecnologías:
- Python
- Pandas y statsmodels
- sklearn
- Google BigQuery.
- Power BI.
- Google Slides.
- Google ColabProcesamiento y análisis:
- limpieza de datos
- exploración de datos
- formulas DAX
- consultas SQL
- Técnica de Análisis de datos
Resultados y Conclusiones:
Se probo la hipótesis mediante insights concluidos por gráficos de la correlación entre variables.Validación de Hipótesis(Z test):
```python
alpha = 0.05
categoria_a = df[df['categoria_streams'] == 'alto'].shape[0]
categoria_b = df[df['categoria_streams'] == 'bajo' ].shape[0]
muestra_a, muestra_b = df.shape[0]
array_categorias = np.array([categoria_a,categoria_b])
array_muestras = np.array([muestra_a,muestra_b])
p_valor = proportions_ztest(count= array_categorias,nobs = array_muestras)[1]
print(f'{p_valor:.3f}')
```Dashboard
![Dashboard](Dashboard2.png)
Limitaciones/Próximos Pasos:
Identifica y describe cualquier limitación o desafío encontrado durante el proyecto.
Sugiere posibles próximos pasos para extender o mejorar el proyecto de análisis de datos.Enlaces de interés:
[google slides](https://docs.google.com/presentation/d/1toe7RTKU9dDJpv125bwmL84ZtTEeKtMwZs2N945mfSI/edit?usp=sharing)
[google colab hypothesis testing](https://colab.research.google.com/drive/1RuRjItPZu4b9CAwKEaQ-BCElUiY2CgA6?usp=sharing)
[google colab ML](https://colab.research.google.com/drive/1nrNIo-hoe_g1MSo_cTtdZuzpdf6RKkMz?usp=sharing)