Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/hairymax/yandex.practicum.datascience
My projects from the Yandex Practicum Data Science course.
https://github.com/hairymax/yandex.practicum.datascience
catboost computer-vision data-analysis data-science keras lightgbm matplotlib nltk numpy pandas python scikit-learn seaborn tensorflow xgboost
Last synced: about 4 hours ago
JSON representation
My projects from the Yandex Practicum Data Science course.
- Host: GitHub
- URL: https://github.com/hairymax/yandex.practicum.datascience
- Owner: hairymax
- Created: 2022-02-15T11:52:27.000Z (over 2 years ago)
- Default Branch: main
- Last Pushed: 2022-08-12T04:39:00.000Z (over 2 years ago)
- Last Synced: 2023-07-11T14:40:33.534Z (over 1 year ago)
- Topics: catboost, computer-vision, data-analysis, data-science, keras, lightgbm, matplotlib, nltk, numpy, pandas, python, scikit-learn, seaborn, tensorflow, xgboost
- Language: Jupyter Notebook
- Homepage:
- Size: 73.9 MB
- Stars: 2
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Проекты Data Science. Яндекс.Практикум (Школа Анализа Данных)
В данном репозитории собраны проекты, выполненные в процессе обучения по программе профессиональной переподготовки [Специалист по Data Science](https://practicum.yandex.ru/data-scientist/) в Яндекс.Практикум
## Сертификат ([Русский](sertificate/Алёшин_Максим_Сергеевич_20222DS00349.pdf) | [English](sertificate/Maxim_Aleshin_20222DS00349.pdf))
[![Сертификат](sertificate/cover.png)](sertificate/Алёшин_Максим_Сергеевич_20222DS00349.pdf)`hmpipes.py` - содержит скрипты для автоматизации некоторых DataScience задач, которые были написаны в процессе работы над проектами
## Описание проектов| Проект | Описание | Библиотеки | Навыки |
|---|---|---|---|
| [Прогнозирование оттока клиентов оператора связи](14%20Прогнозирование%20оттока%20клиентов%20оператора%20связи) | Прогнозирование разрыва договора на оказание услуг оператором связи для планирования промоакций с целью удержания клиентов | `LightGBM` `NumPy` `CatBoost` `Pandas` `Sklearn` `Seaborn` `Matplotlib` | `ML`
`Data Analysis` |
| [Компьютерное зрение](13%20Компьютерное%20зрение) | Определение приблизительного возраста человека по фотографии | `Keras` `NumPy` `PIL` `Matplotlib` | `ML`
`Computer Vision` |
| [Классификация текстовых комментариев](12%20Классификация%20текстовых%20комментариев) | Классификация текстовых комментариев на позитивные и негативные | `LightGBM` `Pandas` `Sklearn` `Seaborn` `NLTK` `Matplotlib` | `ML`
`NLP` `tf-idf` |
| [Прогнозирование количества заказов такси](11%20Прогнозирование%20количества%20заказов%20такси) | Модель машинного обучения для прогнозирования спроса на такси на следующий час | `CatBoost` `NumPy` `LightGBM` `Pandas` `Sklearn` `Seaborn` `Statsmodels` `Matplotlib` | `ML`
`Time Series` |
| [Определение стоимости поддержанных авто](10%20Определение%20стоимости%20поддержанных%20авто) | Создание модели машинного обучения для определения стоимости подддержанных автомобилей по параметрам из объяалений | `LightGBM` `CatBoost` `Pandas` `Sklearn` `Seaborn` `Matplotlib` `pandas_profiling` | `ML`
`Регрессия` |
| [Защита персональных данных клиентов](09%20Защита%20персональных%20данных%20клиентов) | Разработка метода шифрования персональных данных клиентов, не ухудшающего качество моделей машинного обучения | `Sklearn` `Pandas` `NumPy` | `ML`
`Линейная алгебра` |
| [Прогнозирование восстановления золота из руды](08%20Прогнозирование%20восстановления%20золота%20из%20руды) | Прогнозирование значения концентрации золота на разных этапах процесса очистки золотосодержащей руды | `Sklearn` `Pandas` `NumPy` `Seaborn` `Matplotlib` | `ML`
`Регрессия` |
| [Выбор локации для нефтяной скважины](07%20Выбор%20локации%20для%20нефтяной%20скважины) | Определение региона, где добыча принесёт наибольшую прибыль, анализ рисков | `Sklearn` `NumPy` `Pandas` `Matplotlib` | `ML` `Регрессия` `Bootstrap` |
| [Прогнозирование оттока клиентов банка](06%20Прогнозирование%20оттока%20клиентов%20банка) | Предсказание факта ухода клиента банка в ближайшее время (бинарная классификация) | `Sklearn` `Pandas` `NumPy` `Seaborn` `Matplotlib` | `ML`
`Классификация` |
| [Рекомендация тарифов мобильного оператора](05%20Рекомендация%20тарифов%20мобильного%20оператора) | Рекомендации подходящего тарифа для пользователя на основе его пользования услугами связи | `Sklearn` `Pandas` `XGBoost` `NumPy` `Matplotlib` | `ML`
`Классификация` |
| [Исследование игровых платформ](04%20Исследование%20игровых%20платформ) | Анализ рынка игровых платформ в разных регионах для определения потенциально популярных игровых жанров и платформ | `Pandas` `NumPy` `SciPy` `Seaborn` `Matplotlib` | `Data Analysis`
`A/B testing`|
| [Анализ перспективности тарифов мобильного оператора](03%20Анализ%20перспективности%20тарифов%20мобильного%20оператора) | Анализ поведения клиентов оператора сотовой связи для определения наиболее выгодного для оператора тарифа | `Pandas` `NumPy` `SciPy` `Seaborn` `Matplotlib` | `Data Analysis`
`A/B testing` |
| [Исследование объявлений о продаже квартир](02%20Исследование%20объявлений%20о%20продаже%20квартир) | Анализ рынка недвижимости Санкт-Петербурга и Ленинградкой области, выявление аномалий для отслеживания мошеннической деятельности | `Pandas` `NumPy` `Matplotlib` `Seaborn` | `Data Analysis`
`Маркетинг_анализ` |
| [Исследование надёжности заёмщиков](01%20Исследование%20надёжности%20заёмщиков) | Исследование факторов, влияющих на факт возврата кредита в срок, на основе статистики о платёжеспособности клиентов | `Pandas` `Seaborn` `Matplotlib` `PyMystem3` | `Data Analysis`
`Финансовый_анализ` |