An open API service indexing awesome lists of open source software.

https://github.com/alenales/purchase-analysis

Анализ пользователей и совершенных заказов
https://github.com/alenales/purchase-analysis

ab-testing jupiter-notebook python

Last synced: 3 months ago
JSON representation

Анализ пользователей и совершенных заказов

Awesome Lists containing this project

README

          

# Анализ данных с помощью Python | Учебный проект

## Краткое описание
Мини задачи направлены на анализ совершенных покупок с помощью Python. В каждом файле можно посмотреть заметки для пояснений.
Во всех задачах используются одинаковые таблицы с данными.

- В uniq_id_cust - таблица с уникальными идентификаторами пользователей;
- orders - уникальные идентификаторы заказов (номер чека);
- items - товарные позиции, входящие в заказы.

## Задачи проекта

- Найти колличество пользователей, совершивших покупку 1 раз.
- Найти среднее число заказов, которые не доставляются по разным причниам. Дополнительно детализировать причины.

Деталицация по причинам.

![Детализация причин](https://user-images.githubusercontent.com/100629361/205738048-642bd5ed-606f-45c8-8e0c-5e61af888d8f.PNG)

- По каждому товару определить, в какой день недели товар чаще всего покупается.
- Определить среднее число покупок в неделю по каждому пользователю.
- Провести когортный анализ пользователей. В период с января по декабрь выявить когорту с самым высоким retention на 3й месяц.

Для решения данной задачи выявили первый и последний месяц и на их основе отобрали заказчиков, которые совершали покупки в течении трех первых месяцев с момента их первой покупки.

![image](https://user-images.githubusercontent.com/100629361/205742112-f29e2a66-a221-45b5-aa7a-4152283c8013.png)

- Построить RFM-сегментацию пользователей для качественной оценки аудитории. В кластеризации использовать следующие метрики: R - время от последней покупки пользователя до текущей даты, F - суммарное количество покупок у пользователя за всё время, M - сумма покупок за всё время. Для каждого RFM-сегмента построить границы метрик recency, frequency и monetary для интерпретации этих кластеров.

Рассматривали только 2017 год, так как он единственный является полным.

Для подсчета Frequency - посчитали колличество покупок по каждому покупателю

Для подсчета Monetary - сумму по всем чекам каждого пользователя.

Для подсчета Recency - посчитали кол-во дней между текущим временем и последней покупкой пользователя.

Так как большинство пользователей делали покупку только 1 раз, то, при использовании квантилей, мы наблюдаем сильный перекос Frequency, поэтому можем сделать вывод, что данный показатель не будет особо репрезентативным.

По итогу получаем следующую таблицу:

![image](https://user-images.githubusercontent.com/100629361/205749251-8b1b0a98-8779-4d7d-bdd7-2c00568ca786.png)

Всего получили 49 сегментов. Информация о границах сегментации подробно расписана в файле: (https://github.com/AlenaLes/Simple_analysis/blob/main/First_project_6.ipynb).