Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/gilevatanya/yandex-practicum-projects
Кейсы решенные на курсах Яндекс Практикума.
https://github.com/gilevatanya/yandex-practicum-projects
bert bootstrap catboost keras lightgbm matplotlib nltk numpy pandas postgresql python pytorch scikit-learn scipy seaborn sql
Last synced: about 1 month ago
JSON representation
Кейсы решенные на курсах Яндекс Практикума.
- Host: GitHub
- URL: https://github.com/gilevatanya/yandex-practicum-projects
- Owner: GilevaTanya
- Created: 2024-07-05T14:36:47.000Z (6 months ago)
- Default Branch: main
- Last Pushed: 2024-08-12T16:04:26.000Z (5 months ago)
- Last Synced: 2024-12-06T08:04:25.195Z (about 1 month ago)
- Topics: bert, bootstrap, catboost, keras, lightgbm, matplotlib, nltk, numpy, pandas, postgresql, python, pytorch, scikit-learn, scipy, seaborn, sql
- Language: Jupyter Notebook
- Homepage:
- Size: 3.39 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# yandex-practicum-projects
Я начинающий специалист по Data Science. \
Мой путь в it начался с курсов Яндекс Практикум. \
В настоящий момент мое обучение на курсе завершено и я ищу свою первую работу!> Используемый стек: \
Python, Pandas, Matplotlib, Seaborn, NumPy, SciPy, PyTorch, Keras, Scikit-learn, Bootstrap, Lightgbm, Catboost, BERT, Nltk, A/B tests, SQL, PostgreSQL.За время учебы я решила 16 кейсов (банки, телеком, промышленность, интернет-сервисы и д.р.) \
Здесь представлены ссылки и краткое описание 6 наиболее интересных из них.| # | Наименование проекта | Описание | Стек |
| ---- | ------------------------------------------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ |
| 1. | [Нейросеть для определения возраста покупателей по фотографии](https://github.com/GilevaTanya/yandex-practicum-projects/blob/main/model-fo-determining-age-on-a-photo/Readme.md) | Фотофиксация в прикассовой зоне поможет определять возраст клиентов, чтобы анализировать покупки и предлагать товары, которые могут заинтересовать покупателей этой возрастной группы и контролировать добросовестность кассиров при продаже алкоголя. (обработка изображения, нейронные сети, компьютерное зрение) | Python, Pandas, Keras, TensorFlow, PIL , matplotlib |
| 2. | [Модель для классификации комментариев](https://github.com/GilevaTanya/yandex-practicum-projects/tree/main/model-for-classifying-comments-with-BERT) | Модель, которая будет искать токсичные комментарии и отправлять на модерацию. (обработка естественного языка, классификация) | Python, Pandas, Numpy, BERT, nltk, scikit-learn, tf-idf. |
| 3. | [Модель для предсказания температуры сплава, для оптимизации процесса производства стали.](https://github.com/GilevaTanya/yandex-practicum-projects/tree/main/model-for-determining-the-temperature-of-the-alloy) | Чтобы оптимизировать производственные расходы, металлургический комбинат решил уменьшить потребление электроэнергии на этапе обработки стали за счет контроля температуры сплава (градиентный бустинг, регрессия)| Python, Pandas, Numpy, seaborn, matplotlib, scipy, math, scikit-learn, CatBoost |
| 4. | [Модель для прогнозирования оттока клиентов Банка](https://github.com/GilevaTanya/yandex-practicum-projects/tree/main/model-for-predicting-customer-of-the-bank) | Модель которая поможет банку сохранять текущих клиентов и недопустить расторжения договора (классификация: дерево решений, случайный лес, логистическая регрессия) | Python, Pandas, Numpy, scikit-learn matplotlib |
| 5. | [Модель для прогнозирования количества заказов такси на следующий час](https://github.com/GilevaTanya/yandex-practicum-projects/tree/main/model-for-predicting-taxi-for-the-next-hour) | Чтобы привлекать больше водителей в период пиковой нагрузки, нужно спрогнозировать количество заказов такси на следующий час (временные ряды, регрессия, градиентный бустинг) | Python, Pandas, Numpy, scikit-learn, statsmodels, RidgeCV |
| 6. | [Модель для прогнозирования рыночной стоимости автомобиля](https://github.com/GilevaTanya/yandex-practicum-projects/tree/main/model-for-predicting-value-car) | Сервис по продаже автомобилей для привлечения новых клиентов предлагает быстро узнать рыночную стоимость автомобиля (градиентный бустинг, регрессия) | Python, Pandas, seaborn, matplotlib, scikit-learn, LightGBM |####
#### 1. Проект: Нейросеть для определения возраста покупателей по фотографии (обработка изображения, нейронные сети, компьютерное зрение, Keras)
**- Что сделано:** произвела исследовательский анализ набора фотографий, подготовила данные к обучению: нормировка, аугментация, привела к одной размерности. При обучении нейронной сеть, использовала архитектуру ResNet50, верхушка реализовала через 2 полносвязных слоя, активация через relu, оптимизатор: Adam. Оценка качества по MAE.\
**- Результат:** создала нейросеть на базе Keras.####
#### 2. Проект: Модель для классификации комментариев (обработка естественного языка, NLP, классификация, BERT)
**- Что сделано:** произвела предобработку данных, визуализацию, подготовила данных к обучению (лемматизация, векторизация, удаление стоп-слов), обучила нескольких моделей с автоматическим подбором гиперпараметров + предобрученная модель BERT2000. Выбрала наилучшую модель по значению F1-меры. \
**- Результат:** создала модель на базе LinearRegression.####
#### 3. Проект: Модель для предсказания температуры сплава, для оптимизации процесса производства стали (градиентный бустинг, регрессия).
**- Что сделано:** произвела предобработку данных, визуализацию, подготовила данные к обучению,произвела масштабирование признаков, обучила несколько моделей с автоматическим подбором гиперпараметров. Выборала наилучшую модель по значению МАЕ <=6,8. Провела исследования важности признаков feature_importances_\
**- Результат:** создала модель на базе CatBoost.####
#### 4. Проект: Модель для прогнозирования оттока клиента Банка (классификация).
**- Что сделано:** произвела предобработку данных, визуализацию, подготовила данных к обучению, обучила нескольких моделей с автоматическим подбором гиперпараметров + измерение AUC-ROC. Выбрала наилучшую модель по значению F1-меры. Проверка на адекватность.\
**- Результат:** создала модель Случайного леса, при взвешивании классов.####
#### 5. Проект: Модель для прогнозирования количества заказов такси на следующий час (временные ряды, регрессия, градиентный бустинг)
**- Что сделано:** ресемплировала данных по одному часу, проверила соблюдение хронологического порядка и границ временного интервала, произвела оценку стационарности ряда, тренда, сезонности и шума, произвела проверка автокорреляции. Создала дополнительные признаки, подготовила данные к обучению, обучила нескольких моделей с автоматическим подбором гиперпараметров. Выбрала наилучшую модель по RMSE. Проверка на адекватность. \
**- Результат:** создана модель на базе LinearRegression.####
#### 6. Проект: Модель для прогнозирования рыночной стоимости автомобиля (градиентный бустинг, регрессия).
**- Что сделано:** произвела предобработку данных, визуализацию, подготовила данных к обучению (прямое кодирование категориальных признаков в численные посредством OHE, масштабирование признаков. Для модели LightGBM кодировка через OHE не проводила), обучила нескольких моделей с автоматическим подбором гиперпараметров. Выбрала наилучшую модель по значению RMSE. \
**- Результат:** создала модель на базе LightGBM.