https://github.com/drsartoriuss/portfolio
Учебные проекты из Яндекс Практикума "Специалист по Data Science+"
https://github.com/drsartoriuss/portfolio
catboost computer-vision data-science deeplearning mashinelearning matplotlib nlp-machine-learning numpy pandas scipy seaborn sklearn sql torch tsf
Last synced: 29 days ago
JSON representation
Учебные проекты из Яндекс Практикума "Специалист по Data Science+"
- Host: GitHub
- URL: https://github.com/drsartoriuss/portfolio
- Owner: DrSartoriuss
- Created: 2024-06-26T09:03:32.000Z (11 months ago)
- Default Branch: main
- Last Pushed: 2024-11-23T13:14:25.000Z (6 months ago)
- Last Synced: 2025-03-28T10:21:29.259Z (about 2 months ago)
- Topics: catboost, computer-vision, data-science, deeplearning, mashinelearning, matplotlib, nlp-machine-learning, numpy, pandas, scipy, seaborn, sklearn, sql, torch, tsf
- Language: Jupyter Notebook
- Homepage:
- Size: 18.2 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Портфолио учебных проектов программы Data Science+ на платформе Яндекс.Практикум
Здесь представлены проекты, выполненные мною во время учебы в Яндекс Практикуме по специальности "Специалист по Data Science расширенный".
| № | Название проекта | Описание | Инструменты|
|:-------------------|:---------------------- | :---------------------- | :---------------------- |
|1| [Оценка музыкальных предпочтений](01_EDA_value_music_references) | Исследование поведения и музыкальных предпочтений пользователей Москвы и Санкт-Петербурга |*pandas* |
|2| [Исследование надежности заемщиков](02_EDA_bank_borrowers) | Оценка влияния семейного положения клиентов банка на своевременное погашение кредита |*pandas* |
|3| [Исследование рынка недвижимости](03_EDA_real_estate) | Исследование параметров, влияющих на рыночную стоимость объектов недвижимости |*pandas, matplotlib, numpy* |
|4| [Исследование рынка российского кинопроката](04_EDA_film_distribution) | Изучение особенностей рынка российского кинопроката |*pandas, matplotlib, numpy* |
|5| [Статистический анализ данных сервиса аренды самокатов](05_SDA_scooter_rental_service) | Анализ поведения пользователей сервиса аренды самокатов, проверка статистических гипотез | *pandas, matplotlib, numpy, scipy, math* |
|6| [Рекомендация тарифов](06_ML_tariff_recommendation) | Создание модели, предлагающей клиенту наиболее оптимальный мобильный тариф | *pandas, sklearn* |
|7| [Прогнозирование оттока клиентов](07_ML_customer_churn_forecasting) | Построение модели, прогнозирующей, покинет ли клиент банк в ближайшее время | *pandas, sklearn, numpy, matplotlib* |
|8| [Оценка объемов нефтедобычи](08_ML_well_location_selection) | Построение модели определяющей наиболее выгодный регион для разработки новых нефтяных скважин | *pandas, sklearn, numpy, matplotlib* |
|9| [Прогнозирование отмены бронирования](09_ML_booking_cancellations_predicting) | Проектирование модели для предсказания отмены бронирования | *pandas, sklearn, numpy, matplotlib, seaborn* |
|10| [Music genre prediction M1_26DS+](10_ML_Masterskaya_26DS_music_classification) |Разработатка модели классификации музыкальных произведений по жанрам| *pandas, sklearn, numpy, matplotlib, scipy, phik, xgboost, catboost* |
|11| [Предсказание стоимости жилья](11_ML_home_value_predicting_SPARK) | Обучение модели, определяющей медианную стоимость квартиры в жилом массиве| *pandas, pyspark, numpy, matplotlib* |
|12| [Защита персональных данных клиентов](12_ML_protection_personal_information) | Разработка надежного метода шифрования персональных данных, не влияющего на качество предсказаний модели | *pandas, sklearn, numpy, matplotlib, seaborn, phik* |
|13| [Определение стоимости автомобилей](13_ML_cars_value_determination) | Построение модели, оперативно предсказывающей рыночную стоимость автомобиля | *pandas, numpy, seaborn, matplotlib, phik, time, sklearn, lightgbm, catboost* |
|14| [Приближенный поиск ближайших соседей](14_ML_Masterskaya_match_Faiss) | Создание ранжирующей модели, которая среди миллионов товаров ищет пять, наиболее подходящих по запросу. | *pandas, sklearn, numpy, matplotlib, scipy, seaborn, faiss* |
|15| [Прогнозирование температуры поверхности звезды](15_ML_NN_star_temperature_predicting) | Построение нейросети, максимально точно определяющей абсолютную температуру на поверхности звёзды | *torch, pandas, numpy, math, seaborn, matplotlib, phik, time, sklearn* |
|16| [Оценка рисков ДТП](16_ML_SQL_accident_risk_predicting) | Создание адекватной системы оценки водительского риска на каршеринге| *torch, pandas, numpy, math, seaborn, matplotlib, phik, sqlalchemy, sklearn, catboost* |
|17| [Прогнозирование заказов такси](17_ML_TSF_taxi_order_forecasting) | Создание модели, предсказывающей количество заказов такси на следующий час | *pandas, numpy, seaborn, matplotlib, statsmodels, sklearn, catboost, lightgbm* |
|18| [Определение токсичности комментариев](18_ML_NLP_comment_classification) | Подготовка модели, классифицирующей комментарии на нейтральные и токсичные для последующей модерации | *pandas, numpy, matplotlib, torch, re, nltk, chardet, transformers, tqdm, imblearn, wordcloud, sklearn, catboost* |
|19| [Определение возраста покупателей по фотографии](19_ML_CV_age_buyers_determinig) | Построение модели, визуально определяющей возраст человека в супермаркете по фото | *pandas, tensorflow.keras, matplotlib, seaborn, numpy* |
|20| [Поиск по изображению](20_ML_NLP_CV_search_images)| Разработка демонстрационной версии поиска изображений по запросу | *pandas, sklearn, nltk, re, BERT, CLIP, torch, transformers, sentence_transformers, matplotlib, seaborn, PIL, numpy, math, os* |
|21| [Предсказание оттока абонентов](21_ML_SQL_sub_churn_prediction) | Создание модели, прогнозирующей отток абонентов из телекоммуникационной компании | *pandas, phik, sqlalchemy, matplotlib, seaborn, numpy, sklearn, pipeline, columntransformer, catboost, lightgbm* |