An open API service indexing awesome lists of open source software.

https://github.com/drsartoriuss/portfolio

Учебные проекты из Яндекс Практикума "Специалист по Data Science+"
https://github.com/drsartoriuss/portfolio

catboost computer-vision data-science deeplearning mashinelearning matplotlib nlp-machine-learning numpy pandas scipy seaborn sklearn sql torch tsf

Last synced: 29 days ago
JSON representation

Учебные проекты из Яндекс Практикума "Специалист по Data Science+"

Awesome Lists containing this project

README

        

# Портфолио учебных проектов программы Data Science+ на платформе Яндекс.Практикум

Здесь представлены проекты, выполненные мною во время учебы в Яндекс Практикуме по специальности "Специалист по Data Science расширенный".

| № | Название проекта | Описание | Инструменты|
|:-------------------|:---------------------- | :---------------------- | :---------------------- |
|1| [Оценка музыкальных предпочтений](01_EDA_value_music_references) | Исследование поведения и музыкальных предпочтений пользователей Москвы и Санкт-Петербурга |*pandas* |
|2| [Исследование надежности заемщиков](02_EDA_bank_borrowers) | Оценка влияния семейного положения клиентов банка на своевременное погашение кредита |*pandas* |
|3| [Исследование рынка недвижимости](03_EDA_real_estate) | Исследование параметров, влияющих на рыночную стоимость объектов недвижимости |*pandas, matplotlib, numpy* |
|4| [Исследование рынка российского кинопроката](04_EDA_film_distribution) | Изучение особенностей рынка российского кинопроката |*pandas, matplotlib, numpy* |
|5| [Статистический анализ данных сервиса аренды самокатов](05_SDA_scooter_rental_service) | Анализ поведения пользователей сервиса аренды самокатов, проверка статистических гипотез | *pandas, matplotlib, numpy, scipy, math* |
|6| [Рекомендация тарифов](06_ML_tariff_recommendation) | Создание модели, предлагающей клиенту наиболее оптимальный мобильный тариф | *pandas, sklearn* |
|7| [Прогнозирование оттока клиентов](07_ML_customer_churn_forecasting) | Построение модели, прогнозирующей, покинет ли клиент банк в ближайшее время | *pandas, sklearn, numpy, matplotlib* |
|8| [Оценка объемов нефтедобычи](08_ML_well_location_selection) | Построение модели определяющей наиболее выгодный регион для разработки новых нефтяных скважин | *pandas, sklearn, numpy, matplotlib* |
|9| [Прогнозирование отмены бронирования](09_ML_booking_cancellations_predicting) | Проектирование модели для предсказания отмены бронирования | *pandas, sklearn, numpy, matplotlib, seaborn* |
|10| [Music genre prediction M1_26DS+](10_ML_Masterskaya_26DS_music_classification) |Разработатка модели классификации музыкальных произведений по жанрам| *pandas, sklearn, numpy, matplotlib, scipy, phik, xgboost, catboost* |
|11| [Предсказание стоимости жилья](11_ML_home_value_predicting_SPARK) | Обучение модели, определяющей медианную стоимость квартиры в жилом массиве| *pandas, pyspark, numpy, matplotlib* |
|12| [Защита персональных данных клиентов](12_ML_protection_personal_information) | Разработка надежного метода шифрования персональных данных, не влияющего на качество предсказаний модели | *pandas, sklearn, numpy, matplotlib, seaborn, phik* |
|13| [Определение стоимости автомобилей](13_ML_cars_value_determination) | Построение модели, оперативно предсказывающей рыночную стоимость автомобиля | *pandas, numpy, seaborn, matplotlib, phik, time, sklearn, lightgbm, catboost* |
|14| [Приближенный поиск ближайших соседей](14_ML_Masterskaya_match_Faiss) | Создание ранжирующей модели, которая среди миллионов товаров ищет пять, наиболее подходящих по запросу. | *pandas, sklearn, numpy, matplotlib, scipy, seaborn, faiss* |
|15| [Прогнозирование температуры поверхности звезды](15_ML_NN_star_temperature_predicting) | Построение нейросети, максимально точно определяющей абсолютную температуру на поверхности звёзды | *torch, pandas, numpy, math, seaborn, matplotlib, phik, time, sklearn* |
|16| [Оценка рисков ДТП](16_ML_SQL_accident_risk_predicting) | Создание адекватной системы оценки водительского риска на каршеринге| *torch, pandas, numpy, math, seaborn, matplotlib, phik, sqlalchemy, sklearn, catboost* |
|17| [Прогнозирование заказов такси](17_ML_TSF_taxi_order_forecasting) | Создание модели, предсказывающей количество заказов такси на следующий час | *pandas, numpy, seaborn, matplotlib, statsmodels, sklearn, catboost, lightgbm* |
|18| [Определение токсичности комментариев](18_ML_NLP_comment_classification) | Подготовка модели, классифицирующей комментарии на нейтральные и токсичные для последующей модерации | *pandas, numpy, matplotlib, torch, re, nltk, chardet, transformers, tqdm, imblearn, wordcloud, sklearn, catboost* |
|19| [Определение возраста покупателей по фотографии](19_ML_CV_age_buyers_determinig) | Построение модели, визуально определяющей возраст человека в супермаркете по фото | *pandas, tensorflow.keras, matplotlib, seaborn, numpy* |
|20| [Поиск по изображению](20_ML_NLP_CV_search_images)| Разработка демонстрационной версии поиска изображений по запросу | *pandas, sklearn, nltk, re, BERT, CLIP, torch, transformers, sentence_transformers, matplotlib, seaborn, PIL, numpy, math, os* |
|21| [Предсказание оттока абонентов](21_ML_SQL_sub_churn_prediction) | Создание модели, прогнозирующей отток абонентов из телекоммуникационной компании | *pandas, phik, sqlalchemy, matplotlib, seaborn, numpy, sklearn, pipeline, columntransformer, catboost, lightgbm* |