Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/egorumaev/egorumaev


https://github.com/egorumaev/egorumaev

Last synced: 18 days ago
JSON representation

Awesome Lists containing this project

README

        

# Привет) 👋

## **РЕЗЮМЕ**

* [Резюме](https://github.com/egorumaev/cv-egorumaev/blob/main/CV_Egor_Yumaev.pdf "Ссылка на резюме")

---

## **ПРОФЕССИОНАЛЬНАЯ ПЕРЕПОДГОТОВКА**

* ["Linux: внедрение и расширенное администрирование ИТ-решений на базе отечественных операционных систем в государственных и коммерческих организациях"](https://tusur-courses.ru/catalog/sistemnoe-administrirovanie/linux-vnedrenie-i-rasshirennoe-administrirovanie "Образовательная программа") ([Томский государственный университет систем управления и радиоэлектроники (ТУСУР)](https://tusur.ru/ru "Официальный сайт"), Томск, Россия). Диплом о проф. переподготовке. 2024

* ["Специалист по Data Science"](https://practicum.yandex.ru/data-scientist/?from=catalog "Образовательная программа") ([Яндекс.Практикум](https://practicum.yandex.ru/ "Официальный сайт"), Москва, Россия). Диплом о проф. переподготовке: [RU](https://github.com/egorumaev/cv-egorumaev/blob/main/2023%20DS%20%D0%AE%D0%BC%D0%B0%D0%B5%D0%B2%20%D0%95.%20%D0%94%D0%B8%D0%BF%D0%BB%D0%BE%D0%BC%20RU.pdf "Ссылка на диплом") / [ENG](https://github.com/egorumaev/cv-egorumaev/blob/main/2023%20DS%20%D0%AE%D0%BC%D0%B0%D0%B5%D0%B2%20%D0%95.%20%D0%94%D0%B8%D0%BF%D0%BB%D0%BE%D0%BC%20ENG.pdf "Ссылка на диплом"). 2022-2023

---

## **КУРСЫ**

* ["Математика для анализа данных"](https://practicum.yandex.ru/math-for-da-ds/?from=catalog "Программа курса") (Яндекс.Практикум, Москва, Россия). Свидетельство: [RU](https://github.com/egorumaev/cv-egorumaev/blob/main/2024%20%D0%9C%D0%B0%D1%82%D0%B5%D0%BC%D0%B0%D1%82%D0%B8%D0%BA%D0%B0%20%D0%B4%D0%BB%D1%8F%20%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85.pdf "Ссылка на свидетельство") / [ENG](https://github.com/egorumaev/cv-egorumaev/blob/main/2024%20Math%20for%20DA%20and%20DS.pdf "Ссылка на свидетельство"). 2023-2024

* ["Python: des fondamentaux aux concepts avancés du langage"](https://www.fun-mooc.fr/fr/cours/python-3-des-fondamentaux-aux-concepts-avances-du-langage/ "Программа курса") (Université Côte d'Azur, Ницца, Франция). Open badge: [FR](https://github.com/egorumaev/cv-egorumaev/blob/main/2023%20Yumaev%20E.%20Python%20Cote-d-Azure.pdf "Ссылка на Open Badge"). 2023

* ["Machine learning in Python with scikit-learn"](https://www.fun-mooc.fr/fr/cours/machine-learning-python-scikit-learn/ "Программа курса") (French National Research Institute for Digital Science and Technology (INRIA), Париж, Франция). Open badge: [ENG](https://github.com/egorumaev/cv-egorumaev/blob/main/2023%20Yumaev%20E.%20INRIA%20ML%20Python%20sklearn.pdf "Ссылка на Open Badge"). 2023

* ["Data Science с Глебом Михайловым"](https://stepik.org/113596 "Программа курса") (STEPIK). Сертификат: [RU](https://github.com/egorumaev/cv-egorumaev/blob/main/2023%20DS%20%D1%81%20%D0%93%D0%BB%D0%B5%D0%B1%D0%BE%D0%BC%20%D0%9C%D0%B8%D1%85%D0%B0%D0%B9%D0%BB%D0%BE%D0%B2%D1%8B%D0%BC.pdf "Ссылка на сертификат"). 2023

* ["Введение в Data Science и машинное обучение"](https://stepik.org/4852 "Программа курса") (STEPIK). Сертификат: [RU](https://github.com/egorumaev/cv-egorumaev/blob/main/2023%20Stepik%20%D0%92%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5%20%D0%B2%20DS%20%D0%B8%20ML.pdf "Ссылка на сертификат"). 2023

---

["Курсы, пройденные на портале STEPIK"](https://stepik.org/users/553414073/profile "Ссылка на личный профиль на сайте stepik.org")

---

## **НАВЫКИ**

| | | | | |
|:-----|:-----|:-----|:-----|:-----|
| **Python 3** | **SQL** | **MS Excel** | **Power Query** | **Power Pivot** |
| **VBA** | **MS Power BI**| **Pandas** | **Numpy** | **Jupiter Notebook** |
| **classical ML** | **Matplotlib** | **Seaborn** | **DataLens** | **Scikit-learn** |
| **Catboost** | **LightGBM** | **XGBoost** | **А/В-тесты** | **pgAdmin** |
| **DBeaver** | **Redash** |**SciPy** | **Linux** | **Astra Linux** |
| **Bash** | **Docker** | **RegEx** | **Git** | |

---

## **ВЫПОЛНЕННЫЕ ПРОЕКТЫ**


Название
Цель
Библиотеки
Технологии

1
«Расчет среднего времени ответа менеджеров службы поддержки»
рассчитать среднее время ответа для каждого менеджера службы поддержки на запросы клиентов
Psycopg2, Pandas
SQL (PostgresSQL), оконные функции, CTE (Common Table Expressions), LaTex

2
«Список из пяти последних совершенных (выполненных) операций клиента»
сформировать список пяти последних операций клиента по заданному шаблону
Pandas

3
«Создание Docker-образа на основе актуальной версии Docker-образа Ubuntu и собственного Dockerfile с загрузкой в репозиторий на Docker Hub»
создать собственный Docker-образ с последующей загрузкой в облачный репозиторий на Docker Hub

Linux (Astra Linux, Ubuntu), Bash, Vim, Docker, Docker Image, Dockerfile, Docker Hub

4
«Настройка сервера SSH для многопользовательского доступа»
настроить сервер SSH для многопользовательского доступа в локальной компьютерной сети

Linux (Astra Linux), Bash, Vim, SSH, SSH-сервер, SSH-клиент, NAT Network, Inrental Network

5
«Настройка NFS и Samba в компьютерной сети»
реализовать настройку NFS и Samba в компьютерной сети

Linux (Astra Linux), Bash, Vim, SSH, SOCKS, SQUID, NFS, Samba

6
«Сбор информации об операционной системе удаленного сервера»
с помощью протокола SSH подключиться к удаленному серверу и собрать информацию об операционной системе

Linux (Astra Linux), Bash, SSH, SCP

7
«Оценка результатов эксперимента на этапе планирования A/B-теста»
на этапе планирования A/B-теста провести анализ соответствия плановых значений метрик теста и расчитанного размера выборки
Pandas, Numpy, Matplotlib, Statsmodels, Tqdm
Monte Carlo Method, A/B Test Calculator by Gleb Mikhaylov, Evan Miller Sample Size Calculator, LaTeX

8
«Сравнение точности двух тестов с бинарным ответом на примере тестов на беременность на основе анализа значений sensitivity и specificity тестов»
на основе анализа метрик двух тестов определить, какой из тестов является более точным
Pandas, Matplotlib, Sklearn
Monte Carlo Method, LaTeX

9
«SQLite & PostgreSQL. Анализ данных в Google Colab»
провести анализ данных с помощью SQLite и PostgreSQL в Google Colab
Sqlite3, SQLAlchemy, Pandas, Missingno, Matplotlib
SQLite, PostgreSQL, ElephantSQL, оконные функции, Google Colab, Google Drive

10
«Прогнозирование исхода лечения цирроза печени – Prediction of Cirrhosis Outcomes» (Kaggle)
предсказание вероятности исхода лечения пациентов с циррозом печени (задача мультиклассификации)
Pandas, Numpy, Matplotlib, Seaborn, Missingno, Dataprep, Phik, Category_encoders, Sklearn, Imblearn, Catboost, XGBoost
IQR (Interquartile Range), PCA (Principal component analysis), LDA (Linear Discriminant Analysis), t-SNE (T-distributed Stochastic Neighbor Embedding), Feature Engineering, Polynomial Features, Pipeline, VarianceThreshold, SMOTETomek

11
«Турникеты» (Open Data Science)
на основе накопленных данных идентифицировать посетителя в зависимости от характерного времени его прохода на территорию организации, исключив вероятность передачи пропуска одним сотрудником другому (задача мультиклассификации)
Pandas, Numpy, Random, Matplotlib, Seaborn, Datetime, Sklearn, Imblearn, CatBoost
Feature Engineering, Polynomial Features, SelektKBest, GridSearchCV, RandomizedSearchCV, Pipeline, OneVsRestClassifier, confusion_matrix

12
«Разработка модели машинного обучения для предсказания температуры стали для оптимизации производственных расходов металлургического комбината „Так закаляем сталь‟» (Яндекс.Практикум)
разработка модели машинного обучения, предсказывающей температуру стали, выплавляемой на металлургическом комбинате «Так закаляем сталь» (задача регрессии)
Pandas, Numpy, Matplotlib, Seaborn, DateTime, Phik, Sklearn, Imblearn, Feature_Engine, Catboost, Xgboost, Lightgbm
Pipeline, Feature Engineering, RandomizedSearchCV, PolynomialFeatures, MinMaxScaler, DropCorrelatedFeatures, SelektKBest, VotingRegressor, background_gradient

13
«Разработка модели машинного обучения для прогнозирования оттока клиентов оператора связи „Ниединогоразрыва.ком‟» (Яндекс.Практикум)
разработка модели машинного обучения, прогнозирующей возможный отток клиентов (задача классификации)
Pandas, Numpy, Matplotlib, Seaborn, Skimpy, Datetime, ydata-profiling, Psutil, Phik, Sklearn, Imblearn, Catboost, Xgboost, LightGBM
Pipeline, Feature Engineering, RandomizedSearchCV, MinMaxScaler, mutual_info_regression, Mutual Information, OneHotEncoder, OrdinalEncoder, MinMaxScaler, SelectKBest, chi2, VotingClassifier, confusion_matrix, background_gradient

14
«Определение возраста покупателей» (Яндекс.Практикум)
построение модели, которая по фотографии определит приблизительный возраст человека (задача регрессии для Computer Vision)
Pandas, Numpy, Matplotlib, Seaborn, PIL, Tensorflow, Keras
Yandex Compute Cloud

15
«Выявление токсичных комментариев в отзывах покупателей интернет-магазина „Викишоп‟» (Яндекс.Практикум)
построение модели классификации комментариев пользователей на позитивные и негативные (задача классификации для Natural Language Processing / NLP)
Pandas, Numpy, Matplotlib, Seaborn, Autocorrect, Contractions, Gc, Collections, Re, NLTK, Sklearn, Catboost
Pipeline, RandomizedSearchCV, TfidfVectorizer, CountVectorizer, ngram_range

16
Задача «Классификация тональности текста» (Яндекс.Практикум)
обучение логистической регрессии для определения тональности текста (задача классификации для Natural Language Processing / NLP)
Pandas, NLTK, Sklearn
Google Drive

17
«Прогнозирование количества заказов такси на следующий час для компании „Чётенькое такси‟» (Яндекс.Практикум)
построение модели, предсказывающей количество заказов такси на следующий час (задача регрессии для Time Series)
Pandas, Numpy, Matplotlib, Seaborn, Statsmodels, Sklearn, Catboost, LightGBM
seasonal_decompose, TimeSeriesSplit, RandomizedSearchCV

18
«Определение рыночной стоимости автомобилей» (Яндекс.Практикум)
разработка модели машинного обучения, предсказывающей рыночную стоимость автомобиля (задача регрессии)
Pandas, Numpy, Matplotlib, Seaborn, Joypy, Skimpy, Datetime, Sklearn, Feature-engine, Catboost, LightGBM
KNNImputer, SimpleImputer, OneHotEncoder, OrdinalEncoder, MinMaxScaler, DropCorrelatedFeatures, SelectKBest, mutual_info_regression, make_scorer, RandomizedSearchCV

19
«Защита персональных данных клиентов страховой компании „Хоть потоп‟» (Яндекс.Практикум)
разработка метода преобразования данных, гарантирующего одновременно невозможность восстановления персональной информации и высокое качество моделей машинного обучения, использующих обезличенные персональные данные
Pandas, Numpy, Matplotlib, Seaborn, Phik, Sklearn

20
«Разработка модели, предсказывающей коэффициент восстановления золота из золотодобывающей руды для группы компаний „Цифра‟» (Яндекс.Практикум)
подготовка прототипа модели машинного обучения, предсказывающей коэффициент восстановления золота из золотосодержащей руды (задача регрессии)
Pandas, Numpy, Matplotlib, Seaborn, Torchmetrics, Joypy, Sklearn
Symmetric Mean Absolute Percentage Error, make_scorer, RandomizedSearchCV

21
«Поиск локации для скважины для ПАО „ГлавРосГосНефть‟» (Яндекс.Практикум)
определение региона, где добыча нефти принесёт наибольшую прибыль (задача регрессии)
Pandas, Numpy, Matplotlib, Seaborn, Phik, Sklearn
Анализ возможной прибыли и рисков с помощью техники Bootstrap

22
«Предсказание оттока клиентов из банка» (Яндекс.Практикум)
построение модели машинного обучения, предсказывающей отток клиентов из банка (задача классификации)
Pandas, Numpy, Random, Matplotlib, Seaborn, Skimpy, Imbalanced-learn, Phik, Collections, Tqdm, Sklearn
SMOTE, ADASYN, RandomUnderSampling, SMOTETomek, OneHotEncoder, OrdinalEncoder, StandardScaler, mutual_info_regression, SelectKBest, GridSearchCV

23
«Рекомендация тарифов» (Яндекс.Практикум)
на основе данных о поведении клиентов оператора мобильной связи 'Мегалайн', уже перешедших на новые тарифы 'Smart' и 'Ultra', построить модель для классификации пользователей в зависимости от используемого ими тарифа (задача классификации)
Pandas, Numpy, Matplotlib, Seaborn, Tqdm, Sklearn
GridSearchCV

24
«Интернет-магазин „Стримчик‟» (Яндекс.Практикум)
на основе исследования информации из открытых источников выявить факторы и закономерности, определяющие успех выпуска компьютерной игры при планировании вывода на рынок новой компьютерной игры и оптимизации бюджета рекламной компании
Pandas, Numpy, Random, Matplotlib, Seaborn, Scipy

25
«Исследование объявлений о продаже квартир в Санкт-Петербурге и Ленинградской области» (Яндекс.Практикум)
проведение исследовательского анализа данных датасета с объявлениями о продаже квартир
Pandas, Numpy, Random, Matplotlib, Seaborn

---