https://github.com/nastya-paprika/in-one-click
Модель для формирования персонализированных предложений клиентам интернет-магазина "В один клик"
https://github.com/nastya-paprika/in-one-click
data-science jypyternotebook python
Last synced: 6 months ago
JSON representation
Модель для формирования персонализированных предложений клиентам интернет-магазина "В один клик"
- Host: GitHub
- URL: https://github.com/nastya-paprika/in-one-click
- Owner: nastya-paprika
- Created: 2025-02-02T12:04:02.000Z (8 months ago)
- Default Branch: main
- Last Pushed: 2025-02-02T12:28:16.000Z (8 months ago)
- Last Synced: 2025-02-10T22:23:12.047Z (8 months ago)
- Topics: data-science, jypyternotebook, python
- Language: Jupyter Notebook
- Homepage:
- Size: 1.56 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# IN ONE CLICK
## Модель для формирования персонализированных предложений клиентам интернет-магазина "В один клик"
**Описание исследования**
Интернет-магазин «В один клик» продаёт разные товары: для детей, для дома, мелкую бытовую технику, косметику и даже продукты. Отчёт магазина за прошлый период показал, что активность покупателей начала снижаться. Привлекать новых клиентов уже не так эффективно: о магазине и так знает большая часть целевой аудитории. Возможный выход — удерживать активность постоянных клиентов.
**Цель исследования** - разработать модель машинного обучения, которая осуществит подбор персонализированных предложений для имеющихся клиентов интернет-магазина.
**Задачи исследования:**
1. Построить модель, которая предскажет вероятность снижения покупательской активности клиента в следующие три месяца.
2. В исследование нужно включить дополнительные данные финансового департамента о прибыльности клиента: какой доход каждый покупатель приносил компании за последние три месяца.
3. Используя данные модели и данные о прибыльности клиентов, нужно выделить сегменты покупателей и разработать для них персонализированные предложения.### Общий вывод
**Описание исходных данных и предобработки данных**
Исходные данные включали сведения о покупательском поведении, выручке и времени, проведенном на сайте:
- Данные были предобработаны: устранены пропуски, закодированы категориальные признаки (OneHot и Ordinal Encoding), нормализованы числовые данные (StandardScaler, MinMaxScaler).
- Проведен корреляционный анализ для проверки взаимосвязей между признаками.**Что было сделано для поиска лучшей модели**
- Реализованы четыре алгоритма машинного обучения: LogisticRegression, KNeighborsClassifier, DecisionTreeClassifier и SVC.
- Использован подход кросс-валидации с RandomizedSearchCV для оптимизации гиперпараметров.
- Модели оценивались по метрике ROC-AUC.**Лучшая модель и ее характеристики**
Лучшая модель — *LogisticRegression* с параметрами:
- Коэффициент регуляризации: C = 10.
- Оптимизатор: saga.
- Число итераций: 500.
- Нормализация: StandardScaler.Метрика ROC-AUC на тестовой выборке составила 0.9189, что подтверждает высокое качество предсказаний.
### Выводы и дополнительные предложения для выбранного сегмента (группы) покупателей
Выбранный сегмент: Клиенты с высокой вероятностью снижения активности (>50%) и высокой прибылью (>3).
**Выводы:**
- Анализ популярных категорий показал, что клиенты активно покупают определенные товары (такие как - товары для детей, косметика и аксессуары, домашний текстиль). Эти категории требуют поддержания интереса через персонализированные акции.
- Выявлено снижение трат на технику для красоты и здоровья. Для таких категорий возможно стимулирование спроса через акции или бонусы.**Предложения:**
- Сосредоточить усилия на удержании ключевых клиентов с высокой прибылью.
- Разработать акции для частопотребляемых категорий, чтобы стимулировать повторные покупки.
- Для категорий с редкой частотой покупок предложить дополнительные услуги (гарантия, бонусы, кэшбэк).
- Регулярно пересматривать сегментацию и проводить анализ трат для адаптации предложений.