Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/sofiakhutsieva/ml_outflow_of_clients_from_a_telecommunication_company

Прогнозирование оттока пользователей (Проект в skillbox)
https://github.com/sofiakhutsieva/ml_outflow_of_clients_from_a_telecommunication_company

bagging-algorithms boosting-algorithms classical-ml-algorithms classification-model ml sklearn stacking-algorithms xgboost

Last synced: 6 days ago
JSON representation

Прогнозирование оттока пользователей (Проект в skillbox)

Awesome Lists containing this project

README

        

# Отток клиентов из телекоммуникационной компании

## **Задача**

Любой бизнес хочет максимизировать количество клиентов. Для достижения этой цели важно не только пытаться привлечь новых, но и удерживать уже существующих. Удержать клиента обойдется компании дешевле, чем привлечь нового. Кроме того, новый клиент может оказаться слабо заинтересованным в услугах бизнеса и с ним будет сложно работать, тогда как о старых клиентах уже есть необходимые данные по взаимодействию с сервисом.

Соответственно, прогнозируя отток, мы можем вовремя среагировать и попытаться удержать клиента, который хочет уйти. Опираясь на данные об услугах, которыми пользуется клиент, мы можем сделать ему специальное предложение, пытаясь изменить его решение об уходе от оператора. Благодаря этому задача удержания будет легче в реализации, чем задача привлечения новых пользователей, о которых мы еще ничего не знаем.

Вам предоставлен набор данных от телекоммуникационной компании. В данных содержится информация о почти шести тысячах пользователей, их демографических характеристиках, услугах, которыми они пользуются, длительности пользования услугами оператора, методе оплаты, размере оплаты.

Cтоит задача проанализировать данные и спрогнозировать отток пользователей (выявить людей, которые продлят контракт и которые не продлят). Работа должна включать в себя следующие обязательные пункты:

Описание данных (с расчетом базовых статистик),
Исследование зависимостей и формулирование гипотез,
Построение моделей для прогнозирования оттока (с обоснованием выбора той или иной модели) на основе проверенных гипотез и выявленных взаимосвязей,
Сравнение качества полученных моделей.
Во втором разделе обязательно должно присутствовать обоснование гипотез, подробное описание выявленных взаимосвязей, а также их визуализация.
В четвертом дополнительно должны быть сформулированы общие выводы работы.

Стек: Python, sklearn, numpy, pandas, matplotlib, seaborn

Если файл не открывается - https://colab.research.google.com/drive/1Whq-Bga4Asu04Z-E62G8K8-tNnL4VZYv#scrollTo=QEaF1AEbXM8r

## **Результат**

![image](https://github.com/SofiaKhutsieva/ML_outflow_of_clients_from_a_telecommunication_company/assets/73535658/b79ffa5d-4149-44ca-81d4-c79f4a07c520)