{"id":20522272,"url":"https://github.com/hairymax/yandex.practicum.datascience","last_synced_at":"2025-09-25T12:30:40.011Z","repository":{"id":50347650,"uuid":"459557359","full_name":"hairymax/Yandex.Practicum.DataScience","owner":"hairymax","description":"My projects from the Yandex Practicum Data Science course.","archived":false,"fork":false,"pushed_at":"2022-08-12T04:39:00.000Z","size":77538,"stargazers_count":9,"open_issues_count":0,"forks_count":2,"subscribers_count":1,"default_branch":"main","last_synced_at":"2024-11-15T22:35:38.325Z","etag":null,"topics":["catboost","computer-vision","data-analysis","data-science","keras","lightgbm","matplotlib","nltk","numpy","pandas","python","scikit-learn","seaborn","tensorflow","xgboost"],"latest_commit_sha":null,"homepage":"","language":"Jupyter Notebook","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/hairymax.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null}},"created_at":"2022-02-15T11:52:27.000Z","updated_at":"2024-11-10T19:19:41.000Z","dependencies_parsed_at":"2022-09-19T08:50:17.412Z","dependency_job_id":null,"html_url":"https://github.com/hairymax/Yandex.Practicum.DataScience","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/hairymax%2FYandex.Practicum.DataScience","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/hairymax%2FYandex.Practicum.DataScience/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/hairymax%2FYandex.Practicum.DataScience/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/hairymax%2FYandex.Practicum.DataScience/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/hairymax","download_url":"https://codeload.github.com/hairymax/Yandex.Practicum.DataScience/tar.gz/refs/heads/main","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":234185538,"owners_count":18792844,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["catboost","computer-vision","data-analysis","data-science","keras","lightgbm","matplotlib","nltk","numpy","pandas","python","scikit-learn","seaborn","tensorflow","xgboost"],"created_at":"2024-11-15T22:34:44.179Z","updated_at":"2025-09-25T12:30:33.815Z","avatar_url":"https://github.com/hairymax.png","language":"Jupyter Notebook","funding_links":[],"categories":[],"sub_categories":[],"readme":"# Проекты Data Science. Яндекс.Практикум (Школа Анализа Данных)\n\nВ данном репозитории собраны проекты, выполненные в процессе обучения по программе профессиональной переподготовки [Специалист по Data Science](https://practicum.yandex.ru/data-scientist/) в Яндекс.Практикум\n\n## Сертификат ([Русский](sertificate/Алёшин_Максим_Сергеевич_20222DS00349.pdf) | [English](sertificate/Maxim_Aleshin_20222DS00349.pdf))\n[![Сертификат](sertificate/cover.png)](sertificate/Алёшин_Максим_Сергеевич_20222DS00349.pdf)\n\n`hmpipes.py` - содержит скрипты для автоматизации некоторых DataScience задач, которые были написаны в процессе работы над проектами\n## Описание проектов\n\n| Проект | Описание | Библиотеки \u0026nbsp; \u0026nbsp; | Навыки \u0026nbsp; \u0026nbsp; |\n|---|---|---|---|\n| [Прогнозирование оттока клиентов оператора связи](14%20Прогнозирование%20оттока%20клиентов%20оператора%20связи) | Прогнозирование разрыва договора на оказание услуг оператором связи для планирования промоакций с целью удержания клиентов | `LightGBM` `NumPy` `CatBoost` `Pandas` `Sklearn` `Seaborn` `Matplotlib` | `ML`\u003cbr\u003e`Data Analysis` |\n| [Компьютерное зрение](13%20Компьютерное%20зрение) | Определение приблизительного возраста человека по фотографии | `Keras` `NumPy` `PIL` `Matplotlib` | `ML`\u003cbr\u003e`Computer Vision` |\n| [Классификация текстовых комментариев](12%20Классификация%20текстовых%20комментариев) | Классификация текстовых комментариев на позитивные и негативные | `LightGBM` `Pandas` `Sklearn` `Seaborn` `NLTK` `Matplotlib` | `ML`\u003cbr\u003e`NLP` `tf-idf` |\n| [Прогнозирование количества заказов такси](11%20Прогнозирование%20количества%20заказов%20такси) | Модель машинного обучения для прогнозирования спроса на такси на следующий час | `CatBoost` `NumPy` `LightGBM` `Pandas` `Sklearn` `Seaborn` `Statsmodels` `Matplotlib` | `ML`\u003cbr\u003e`Time Series` |\n| [Определение стоимости поддержанных авто](10%20Определение%20стоимости%20поддержанных%20авто) | Создание модели машинного обучения для определения стоимости подддержанных автомобилей по параметрам из объяалений | `LightGBM` `CatBoost` `Pandas` `Sklearn` `Seaborn` `Matplotlib` `pandas_profiling` | `ML`\u003cbr\u003e`Регрессия` |\n| [Защита персональных данных клиентов](09%20Защита%20персональных%20данных%20клиентов) | Разработка метода шифрования персональных данных клиентов, не ухудшающего качество моделей машинного обучения | `Sklearn` `Pandas` `NumPy` | `ML`\u003cbr\u003e`Линейная алгебра` |\n| [Прогнозирование восстановления золота из руды](08%20Прогнозирование%20восстановления%20золота%20из%20руды) | Прогнозирование значения концентрации золота на разных этапах процесса очистки золотосодержащей руды | `Sklearn` `Pandas` `NumPy` `Seaborn` `Matplotlib` | `ML`\u003cbr\u003e`Регрессия` |\n| [Выбор локации для нефтяной скважины](07%20Выбор%20локации%20для%20нефтяной%20скважины) | Определение региона, где добыча принесёт наибольшую прибыль, анализ рисков | `Sklearn` `NumPy` `Pandas` `Matplotlib` | `ML` `Регрессия` `Bootstrap` |\n| [Прогнозирование оттока клиентов банка](06%20Прогнозирование%20оттока%20клиентов%20банка) | Предсказание факта ухода клиента банка в ближайшее время (бинарная классификация) | `Sklearn` `Pandas` `NumPy` `Seaborn` `Matplotlib` | `ML`\u003cbr\u003e`Классификация` |\n| [Рекомендация тарифов мобильного оператора](05%20Рекомендация%20тарифов%20мобильного%20оператора) | Рекомендации подходящего тарифа для пользователя на основе его пользования услугами связи | `Sklearn` `Pandas` `XGBoost` `NumPy` `Matplotlib` | `ML`\u003cbr\u003e`Классификация` |\n| [Исследование игровых платформ](04%20Исследование%20игровых%20платформ) | Анализ рынка игровых платформ в разных регионах для определения потенциально популярных игровых жанров и платформ | `Pandas` `NumPy` `SciPy` `Seaborn` `Matplotlib` | `Data Analysis`\u003cbr\u003e`A/B testing`|\n| [Анализ перспективности тарифов мобильного оператора](03%20Анализ%20перспективности%20тарифов%20мобильного%20оператора) | Анализ поведения клиентов оператора сотовой связи для определения наиболее выгодного для оператора тарифа | `Pandas` `NumPy` `SciPy` `Seaborn` `Matplotlib` | `Data Analysis`\u003cbr\u003e`A/B testing` |\n| [Исследование объявлений о продаже квартир](02%20Исследование%20объявлений%20о%20продаже%20квартир) | Анализ рынка недвижимости Санкт-Петербурга и Ленинградкой области, выявление аномалий для отслеживания мошеннической деятельности | `Pandas` `NumPy` `Matplotlib` `Seaborn` | `Data Analysis`\u003cbr\u003e`Маркетинг_анализ` |\n| [Исследование надёжности заёмщиков](01%20Исследование%20надёжности%20заёмщиков) | Исследование факторов, влияющих на факт возврата кредита в срок, на основе статистики о платёжеспособности клиентов | `Pandas` `Seaborn` `Matplotlib` `PyMystem3` | `Data Analysis`\u003cbr\u003e`Финансовый_анализ` |\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fhairymax%2Fyandex.practicum.datascience","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fhairymax%2Fyandex.practicum.datascience","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fhairymax%2Fyandex.practicum.datascience/lists"}