An open API service indexing awesome lists of open source software.

https://github.com/nastya-paprika/in-one-click

Модель для формирования персонализированных предложений клиентам интернет-магазина "В один клик"
https://github.com/nastya-paprika/in-one-click

data-science jypyternotebook python

Last synced: 6 months ago
JSON representation

Модель для формирования персонализированных предложений клиентам интернет-магазина "В один клик"

Awesome Lists containing this project

README

          

# IN ONE CLICK

## Модель для формирования персонализированных предложений клиентам интернет-магазина "В один клик"

**Описание исследования**

Интернет-магазин «В один клик» продаёт разные товары: для детей, для дома, мелкую бытовую технику, косметику и даже продукты. Отчёт магазина за прошлый период показал, что активность покупателей начала снижаться. Привлекать новых клиентов уже не так эффективно: о магазине и так знает большая часть целевой аудитории. Возможный выход — удерживать активность постоянных клиентов.

**Цель исследования** - разработать модель машинного обучения, которая осуществит подбор персонализированных предложений для имеющихся клиентов интернет-магазина.

**Задачи исследования:**

1. Построить модель, которая предскажет вероятность снижения покупательской активности клиента в следующие три месяца.
2. В исследование нужно включить дополнительные данные финансового департамента о прибыльности клиента: какой доход каждый покупатель приносил компании за последние три месяца.
3. Используя данные модели и данные о прибыльности клиентов, нужно выделить сегменты покупателей и разработать для них персонализированные предложения.

### Общий вывод

**Описание исходных данных и предобработки данных**

Исходные данные включали сведения о покупательском поведении, выручке и времени, проведенном на сайте:

- Данные были предобработаны: устранены пропуски, закодированы категориальные признаки (OneHot и Ordinal Encoding), нормализованы числовые данные (StandardScaler, MinMaxScaler).
- Проведен корреляционный анализ для проверки взаимосвязей между признаками.

**Что было сделано для поиска лучшей модели**

- Реализованы четыре алгоритма машинного обучения: LogisticRegression, KNeighborsClassifier, DecisionTreeClassifier и SVC.
- Использован подход кросс-валидации с RandomizedSearchCV для оптимизации гиперпараметров.
- Модели оценивались по метрике ROC-AUC.

**Лучшая модель и ее характеристики**

Лучшая модель — *LogisticRegression* с параметрами:

- Коэффициент регуляризации: C = 10.
- Оптимизатор: saga.
- Число итераций: 500.
- Нормализация: StandardScaler.

Метрика ROC-AUC на тестовой выборке составила 0.9189, что подтверждает высокое качество предсказаний.

### Выводы и дополнительные предложения для выбранного сегмента (группы) покупателей

Выбранный сегмент: Клиенты с высокой вероятностью снижения активности (>50%) и высокой прибылью (>3).

**Выводы:**
- Анализ популярных категорий показал, что клиенты активно покупают определенные товары (такие как - товары для детей, косметика и аксессуары, домашний текстиль). Эти категории требуют поддержания интереса через персонализированные акции.
- Выявлено снижение трат на технику для красоты и здоровья. Для таких категорий возможно стимулирование спроса через акции или бонусы.

**Предложения:**
- Сосредоточить усилия на удержании ключевых клиентов с высокой прибылью.
- Разработать акции для частопотребляемых категорий, чтобы стимулировать повторные покупки.
- Для категорий с редкой частотой покупок предложить дополнительные услуги (гарантия, бонусы, кэшбэк).
- Регулярно пересматривать сегментацию и проводить анализ трат для адаптации предложений.