https://github.com/alenales/purchase-analysis
Анализ пользователей и совершенных заказов
https://github.com/alenales/purchase-analysis
ab-testing jupiter-notebook python
Last synced: 3 months ago
JSON representation
Анализ пользователей и совершенных заказов
- Host: GitHub
- URL: https://github.com/alenales/purchase-analysis
- Owner: AlenaLes
- Created: 2022-08-01T17:54:59.000Z (over 3 years ago)
- Default Branch: main
- Last Pushed: 2024-03-03T21:36:15.000Z (almost 2 years ago)
- Last Synced: 2025-03-14T07:25:12.389Z (10 months ago)
- Topics: ab-testing, jupiter-notebook, python
- Language: Jupyter Notebook
- Homepage:
- Size: 19 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: Readme.md
Awesome Lists containing this project
README
# Анализ данных с помощью Python | Учебный проект
## Краткое описание
Мини задачи направлены на анализ совершенных покупок с помощью Python. В каждом файле можно посмотреть заметки для пояснений.
Во всех задачах используются одинаковые таблицы с данными.
- В uniq_id_cust - таблица с уникальными идентификаторами пользователей;
- orders - уникальные идентификаторы заказов (номер чека);
- items - товарные позиции, входящие в заказы.
## Задачи проекта
- Найти колличество пользователей, совершивших покупку 1 раз.
- Найти среднее число заказов, которые не доставляются по разным причниам. Дополнительно детализировать причины.
Деталицация по причинам.

- По каждому товару определить, в какой день недели товар чаще всего покупается.
- Определить среднее число покупок в неделю по каждому пользователю.
- Провести когортный анализ пользователей. В период с января по декабрь выявить когорту с самым высоким retention на 3й месяц.
Для решения данной задачи выявили первый и последний месяц и на их основе отобрали заказчиков, которые совершали покупки в течении трех первых месяцев с момента их первой покупки.

- Построить RFM-сегментацию пользователей для качественной оценки аудитории. В кластеризации использовать следующие метрики: R - время от последней покупки пользователя до текущей даты, F - суммарное количество покупок у пользователя за всё время, M - сумма покупок за всё время. Для каждого RFM-сегмента построить границы метрик recency, frequency и monetary для интерпретации этих кластеров.
Рассматривали только 2017 год, так как он единственный является полным.
Для подсчета Frequency - посчитали колличество покупок по каждому покупателю
Для подсчета Monetary - сумму по всем чекам каждого пользователя.
Для подсчета Recency - посчитали кол-во дней между текущим временем и последней покупкой пользователя.
Так как большинство пользователей делали покупку только 1 раз, то, при использовании квантилей, мы наблюдаем сильный перекос Frequency, поэтому можем сделать вывод, что данный показатель не будет особо репрезентативным.
По итогу получаем следующую таблицу:

Всего получили 49 сегментов. Информация о границах сегментации подробно расписана в файле: (https://github.com/AlenaLes/Simple_analysis/blob/main/First_project_6.ipynb).