Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/hairymax/yandex.practicum.datascience

My projects from the Yandex Practicum Data Science course.
https://github.com/hairymax/yandex.practicum.datascience

catboost computer-vision data-analysis data-science keras lightgbm matplotlib nltk numpy pandas python scikit-learn seaborn tensorflow xgboost

Last synced: about 1 month ago
JSON representation

My projects from the Yandex Practicum Data Science course.

Awesome Lists containing this project

README

        

# Проекты Data Science. Яндекс.Практикум (Школа Анализа Данных)

В данном репозитории собраны проекты, выполненные в процессе обучения по программе профессиональной переподготовки [Специалист по Data Science](https://practicum.yandex.ru/data-scientist/) в Яндекс.Практикум

## Сертификат ([Русский](sertificate/Алёшин_Максим_Сергеевич_20222DS00349.pdf) | [English](sertificate/Maxim_Aleshin_20222DS00349.pdf))
[![Сертификат](sertificate/cover.png)](sertificate/Алёшин_Максим_Сергеевич_20222DS00349.pdf)

`hmpipes.py` - содержит скрипты для автоматизации некоторых DataScience задач, которые были написаны в процессе работы над проектами
## Описание проектов

| Проект | Описание | Библиотеки     | Навыки     |
|---|---|---|---|
| [Прогнозирование оттока клиентов оператора связи](14%20Прогнозирование%20оттока%20клиентов%20оператора%20связи) | Прогнозирование разрыва договора на оказание услуг оператором связи для планирования промоакций с целью удержания клиентов | `LightGBM` `NumPy` `CatBoost` `Pandas` `Sklearn` `Seaborn` `Matplotlib` | `ML`
`Data Analysis` |
| [Компьютерное зрение](13%20Компьютерное%20зрение) | Определение приблизительного возраста человека по фотографии | `Keras` `NumPy` `PIL` `Matplotlib` | `ML`
`Computer Vision` |
| [Классификация текстовых комментариев](12%20Классификация%20текстовых%20комментариев) | Классификация текстовых комментариев на позитивные и негативные | `LightGBM` `Pandas` `Sklearn` `Seaborn` `NLTK` `Matplotlib` | `ML`
`NLP` `tf-idf` |
| [Прогнозирование количества заказов такси](11%20Прогнозирование%20количества%20заказов%20такси) | Модель машинного обучения для прогнозирования спроса на такси на следующий час | `CatBoost` `NumPy` `LightGBM` `Pandas` `Sklearn` `Seaborn` `Statsmodels` `Matplotlib` | `ML`
`Time Series` |
| [Определение стоимости поддержанных авто](10%20Определение%20стоимости%20поддержанных%20авто) | Создание модели машинного обучения для определения стоимости подддержанных автомобилей по параметрам из объяалений | `LightGBM` `CatBoost` `Pandas` `Sklearn` `Seaborn` `Matplotlib` `pandas_profiling` | `ML`
`Регрессия` |
| [Защита персональных данных клиентов](09%20Защита%20персональных%20данных%20клиентов) | Разработка метода шифрования персональных данных клиентов, не ухудшающего качество моделей машинного обучения | `Sklearn` `Pandas` `NumPy` | `ML`
`Линейная алгебра` |
| [Прогнозирование восстановления золота из руды](08%20Прогнозирование%20восстановления%20золота%20из%20руды) | Прогнозирование значения концентрации золота на разных этапах процесса очистки золотосодержащей руды | `Sklearn` `Pandas` `NumPy` `Seaborn` `Matplotlib` | `ML`
`Регрессия` |
| [Выбор локации для нефтяной скважины](07%20Выбор%20локации%20для%20нефтяной%20скважины) | Определение региона, где добыча принесёт наибольшую прибыль, анализ рисков | `Sklearn` `NumPy` `Pandas` `Matplotlib` | `ML` `Регрессия` `Bootstrap` |
| [Прогнозирование оттока клиентов банка](06%20Прогнозирование%20оттока%20клиентов%20банка) | Предсказание факта ухода клиента банка в ближайшее время (бинарная классификация) | `Sklearn` `Pandas` `NumPy` `Seaborn` `Matplotlib` | `ML`
`Классификация` |
| [Рекомендация тарифов мобильного оператора](05%20Рекомендация%20тарифов%20мобильного%20оператора) | Рекомендации подходящего тарифа для пользователя на основе его пользования услугами связи | `Sklearn` `Pandas` `XGBoost` `NumPy` `Matplotlib` | `ML`
`Классификация` |
| [Исследование игровых платформ](04%20Исследование%20игровых%20платформ) | Анализ рынка игровых платформ в разных регионах для определения потенциально популярных игровых жанров и платформ | `Pandas` `NumPy` `SciPy` `Seaborn` `Matplotlib` | `Data Analysis`
`A/B testing`|
| [Анализ перспективности тарифов мобильного оператора](03%20Анализ%20перспективности%20тарифов%20мобильного%20оператора) | Анализ поведения клиентов оператора сотовой связи для определения наиболее выгодного для оператора тарифа | `Pandas` `NumPy` `SciPy` `Seaborn` `Matplotlib` | `Data Analysis`
`A/B testing` |
| [Исследование объявлений о продаже квартир](02%20Исследование%20объявлений%20о%20продаже%20квартир) | Анализ рынка недвижимости Санкт-Петербурга и Ленинградкой области, выявление аномалий для отслеживания мошеннической деятельности | `Pandas` `NumPy` `Matplotlib` `Seaborn` | `Data Analysis`
`Маркетинг_анализ` |
| [Исследование надёжности заёмщиков](01%20Исследование%20надёжности%20заёмщиков) | Исследование факторов, влияющих на факт возврата кредита в срок, на основе статистики о платёжеспособности клиентов | `Pandas` `Seaborn` `Matplotlib` `PyMystem3` | `Data Analysis`
`Финансовый_анализ` |