Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/tnel7/data-science-yandex-practicum

Проекты из Яндекс Практикума "Специалист по Data Science"
https://github.com/tnel7/data-science-yandex-practicum

data-science machine-learning nlp-machine-learning numpy pandas seaborn sklearn

Last synced: 9 days ago
JSON representation

Проекты из Яндекс Практикума "Специалист по Data Science"

Awesome Lists containing this project

README

        

# Data-Science-Yandex-practicum
| Название | Описание | Используемые библиотеки |
| --- | --- | --- |
| [Анализ данных сервиса аренды самокатов](https://github.com/tnel7/Data-Science-Yandex-practicum/blob/main/%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85%20%D1%81%D0%B5%D1%80%D0%B2%D0%B8%D1%81%D0%B0%20%D0%B0%D1%80%D0%B5%D0%BD%D0%B4%D1%8B%20%D1%81%D0%B0%D0%BC%D0%BE%D0%BA%D0%B0%D1%82%D0%BE%D0%B2%20GoFast.ipynb)| Построить модель для задачи классификации, которая выберет подходящий тариф |*Pandas, Matplotlib, Scikit-learn* |
| [Выбор локации для скважины](https://github.com/tnel7/Data-Science-Yandex-practicum/blob/main/%D0%92%D1%8B%D0%B1%D0%BE%D1%80%20%D0%BB%D0%BE%D0%BA%D0%B0%D1%86%D0%B8%D0%B8%20%D0%B4%D0%BB%D1%8F%20%D1%81%D0%BA%D0%B2%D0%B0%D0%B6%D0%B8%D0%BD%D1%8B.ipynb) | Поиск прибыльного нефтедобывающего региона с помощью моделирования машинного обучения | *Pandas, Numpy, Seaborn, Scikit-learn, Bootstrap* |
| [Выявление закономерностей определяющих успешность игры](https://github.com/tnel7/Data-Science-Yandex-practicum/blob/main/%D0%92%D1%8B%D1%8F%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5%20%D0%B7%D0%B0%D0%BA%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%80%D0%BD%D0%BE%D1%81%D1%82%D0%B5%D0%B9%20%D0%BE%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D1%8F%D1%8E%D1%89%D0%B8%D1%85%20%D1%83%D1%81%D0%BF%D0%B5%D1%88%D0%BD%D0%BE%D1%81%D1%82%D1%8C%20%D0%B8%D0%B3%D1%80%D1%8B.ipynb) | Анализ открытых данных, и поиск потенциально популярного продукта, что позволит компании заказчику спланировать рекламные кампании | *Pandas, Matplotlib, NumPy, SciPy, Seaborn* |
| [Исследование надежности заемщиков](https://github.com/tnel7/Data-Science-Yandex-practicum/blob/main/%D0%98%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%BD%D0%B0%D0%B4%D0%B5%D0%B6%D0%BD%D0%BE%D1%81%D1%82%D0%B8%20%D0%B7%D0%B0%D0%B5%D0%BC%D1%89%D0%B8%D0%BA%D0%BE%D0%B2.ipynb) | На основе статистики о платёжеспособности клиентов исследовать влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок | *Pandas, Matplotlib, Scikit-learn* |
| [Исследование объявлений о продаже квартир](https://github.com/tnel7/Data-Science-Yandex-practicum/blob/main/%D0%98%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%BE%D0%B1%D1%8A%D1%8F%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B9%20%D0%BE%20%D0%BF%D1%80%D0%BE%D0%B4%D0%B0%D0%B6%D0%B5%20%D0%BA%D0%B2%D0%B0%D1%80%D1%82%D0%B8%D1%80.ipynb) | Используя датасет с параметрами квартир, предсказать рыночную стоимость объектов недвижимости | *Pandas, Matplotlib, Seaborn* |
| [Классификация комментариев на позитивные и негативные](https://github.com/tnel7/Data-Science-Yandex-practicum/blob/main/%D0%9A%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D1%8F%20%D0%BA%D0%BE%D0%BC%D0%BC%D0%B5%D0%BD%D1%82%D0%B0%D1%80%D0%B8%D0%B5%D0%B2%20%D0%BD%D0%B0%20%D0%BF%D0%BE%D0%B7%D0%B8%D1%82%D0%B8%D0%B2%D0%BD%D1%8B%D0%B5%20%D0%B8%20%D0%BD%D0%B5%D0%B3%D0%B0%D1%82%D0%B8%D0%B2%D0%BD%D1%8B%D0%B5.ipynb) | Поиск токсичных комментариев и отправка их на модернизацию. Классификация комментариев на позитивные и негативные. | *Pandas, Numpy, Seaborn, tf-idf, nltk, pipeline, LinearRegression, CatBoost, LightGBM* |
| [Линейные модели в машинном обучении](https://github.com/tnel7/Data-Science-Yandex-practicum/blob/main/%D0%9B%D0%B8%D0%BD%D0%B5%D0%B9%D0%BD%D1%8B%D0%B5%20%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8%20%D0%B2%20%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%BC%20%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B8.ipynb) | Разработать модель машинного обучения, которая поможет фермеру управлять рисками и принимать объективное решение о покупке. | *Pandas, Numpy, Scikit-learn, Matplotlib, Seaborn, Scipy, Phik* |
| [Обучение с учителем качество модели](https://github.com/tnel7/Data-Science-Yandex-practicum/blob/main/%D0%9E%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5%20%D1%81%20%D1%83%D1%87%D0%B8%D1%82%D0%B5%D0%BB%D0%B5%D0%BC%20%D0%BA%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%BE%20%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8.ipynb) | Разработать решение, которое позволит персонализировать предложения постоянным клиентам, чтобы увеличить их покупательскую активность. | *Pandas, Numpy, Scikit-learn, Matplotlib, Seaborn, Scipy, Phik, Shap* |
| [Определение возраста покупателей](https://github.com/tnel7/Data-Science-Yandex-practicum/blob/main/%D0%9E%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5%20%D0%B2%D0%BE%D0%B7%D1%80%D0%B0%D1%81%D1%82%D0%B0%20%D0%BF%D0%BE%D0%BA%D1%83%D0%BF%D0%B0%D1%82%D0%B5%D0%BB%D0%B5%D0%B9.ipynb) | Постройте и обучите свёрточную нейронную сеть на датасете с фотографиями людей. Научить нейронную сеть определять возраст покупателя на фото | *Tensorflow.keras, Numpy, Pandas, Matplotlib* |
| [Определение стоимости автомобилей](https://github.com/tnel7/Data-Science-Yandex-practicum/blob/main/%D0%9E%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5%20%D1%81%D1%82%D0%BE%D0%B8%D0%BC%D0%BE%D1%81%D1%82%D0%B8%20%D0%B0%D0%B2%D1%82%D0%BE%D0%BC%D0%BE%D0%B1%D0%B8%D0%BB%D0%B5%D0%B9.ipynb) | Разработка системы рекомендации стоимости автомобиля на основе его описания. Построить модель машинного обучения, используя модели Градиентного Бустинга для быстрого определения стоимости автомобиля | *Pandas, Numpy, Scikit-learn, XGBoost, CatBoost, LightGBM, Matplotlib, Seaborn, Scipy* |
| [Предсказание уровня удовлетворённости сотрудника](https://github.com/tnel7/Data-Science-Yandex-practicum/blob/main/%D0%9F%D1%80%D0%B5%D0%B4%D1%81%D0%BA%D0%B0%D0%B7%D0%B0%D0%BD%D0%B8%D0%B5%20%D1%83%D1%80%D0%BE%D0%B2%D0%BD%D1%8F%20%D1%83%D0%B4%D0%BE%D0%B2%D0%BB%D0%B5%D1%82%D0%B2%D0%BE%D1%80%D1%91%D0%BD%D0%BD%D0%BE%D1%81%D1%82%D0%B8%20%D1%81%D0%BE%D1%82%D1%80%D1%83%D0%B4%D0%BD%D0%B8%D0%BA%D0%B0.ipynb) | Предстоит решить 2 задачи: одна линейной регрессии, другая классификации. В первой задаче нам предстоит предсказать уровень удовлетворенности сотрудников, а во второй предсказать возможное увольнение сотрудника, учитывая результаты его ответа на тест о условиях работы.| *Pandas, Matplotlib, Numpy, Scipy, Phik, sklearn.pipeline, sklearn.metrics, sklearn.tree* |
| [Прогнозирование заказов такси](https://github.com/tnel7/Data-Science-Yandex-practicum/blob/main/%D0%9F%D1%80%D0%BE%D0%B3%D0%BD%D0%BE%D0%B7%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%B7%D0%B0%D0%BA%D0%B0%D0%B7%D0%BE%D0%B2%20%D1%82%D0%B0%D0%BA%D1%81%D0%B8.ipynb) | Построение системы прогноза количества заказов такси на следующий час | *Pandas, Numpy, Scikit-learn, XGBoost, CatBoost, LightGBM, Seaborn, Statsmodels* |
| [Итоговый проект телекоммуникации](https://github.com/tnel7/Data-Science-Yandex-practicum/blob/main/%D0%98%D1%82%D0%BE%D0%B3%D0%BE%D0%B2%D1%8B%D0%B9%20%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%20%D0%A2%D0%B5%D0%BB%D0%B5%D0%BA%D0%BE%D0%BC%D0%BC%D1%83%D0%BD%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D0%B8.ipynb) | Цель проекта: разработать модель машинного обучения, прогнозирующую возможный отток клиентов. | *Pandas, Numpy, Matplotlib, Scipy, Phik, Scikit-learn, XGBoost, CatBoost, LightGBM, Seaborn, Statsmodels* |