Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/theoldvalyria/ecommerce_analysis
Анализ данных E-commerce
https://github.com/theoldvalyria/ecommerce_analysis
jupyter-notebook matplotlib numpy pandas python requests seaborn
Last synced: 12 days ago
JSON representation
Анализ данных E-commerce
- Host: GitHub
- URL: https://github.com/theoldvalyria/ecommerce_analysis
- Owner: theoldvalyria
- Created: 2024-07-23T22:46:26.000Z (4 months ago)
- Default Branch: main
- Last Pushed: 2024-08-17T14:51:43.000Z (3 months ago)
- Last Synced: 2024-08-17T15:59:33.073Z (3 months ago)
- Topics: jupyter-notebook, matplotlib, numpy, pandas, python, requests, seaborn
- Language: Jupyter Notebook
- Homepage:
- Size: 293 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
## Анализ данных E-commerce
Проект направлен на анализ данных о покупках, чтобы понять поведение пользователей, эффективность доставки заказов и частоту покупок товаров, выявление сегментов аудитории и понимание причин потери клиентов.
## Используемые Инструменты и Библиотеки
Python
Pandas
Jupyter
Matplotlib
NumPy
Seaborn
requests## Описание Проекта
Решены следующие задачи:
1. Подсчет пользователей, совершивших только одну покупку.
2. Среднее количество недоставленных заказов в месяц с разбивкой по причинам.
3. Определение самого популярного дня недели для покупки каждого товара.
4. Среднее количество покупок в неделю на одного пользователя (по месяцам).
5. Когортный анализ пользователей и выявление когорты с наибольшим удержанием на 3-й месяц.
6. RFM-сегментация пользователей для оценки аудитории.## Датасет
Датасет состоит из следующих файлов:
- `olist_customers_dataset.csv`: информация о клиентах.
- `olist_orders_dataset.csv`: информация о заказах.
- `olist_order_items_dataset.csv`: информация о товарных позициях в заказах.## Результаты
- Пользователи с одной покупкой: 90,557 пользователей совершили только одну покупку.- Не доставленные заказы:
- Среднее количество заказов в месяц, не доставленных по причине "canceled": 26.0
- Среднее количество заказов в месяц, не доставленных по причине "unavailable": 25.0- Когорта с высоким retention:
- Когорта: 2017-06
- Retention на 3-й месяц: 0.39%- RFM-сегментация пользователей:
- Давние клиенты, спящие и недавние пользователи были выделены по давности покупок.
- Пользователи классифицированы по частоте (редкие, нечастые, частые) и сумме покупок (малая, средняя, большая).- Топ-5 сегментов покупателей:
- 211 - спящие: редкие и малые покупки.
- 311 - многообещающие: недавние пользователи с одной недорогой покупкой.
- 111 - бездействующие: одна недорогая покупка и отсутствие повторных покупок.
- 312 - нуждаются во внимании: недавние пользователи, средняя выручка.
- 212 - нуждаются во внимании: недавние пользователи, средняя выручка.
Подробные выводы и визуализации доступны в Jupyter Notebook.