{"id":15097629,"url":"https://github.com/nmerka/practicum_rep","last_synced_at":"2026-01-31T12:32:21.485Z","repository":{"id":243386401,"uuid":"812263421","full_name":"nmerka/practicum_rep","owner":"nmerka","description":"Проекты курса Аналитик данных (Яндекс.Практикум)","archived":false,"fork":false,"pushed_at":"2024-06-23T13:26:23.000Z","size":8699,"stargazers_count":0,"open_issues_count":0,"forks_count":0,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-06-16T09:58:09.694Z","etag":null,"topics":["jupyter-notebook","matplotlib","numpy","pandas","plotly","python","scipy","seaborn","sql","tableau"],"latest_commit_sha":null,"homepage":"","language":"Jupyter Notebook","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/nmerka.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2024-06-08T11:55:00.000Z","updated_at":"2024-06-23T13:26:25.000Z","dependencies_parsed_at":"2024-06-23T14:40:59.098Z","dependency_job_id":"00970d0a-66d2-4739-a07b-d09b868ff709","html_url":"https://github.com/nmerka/practicum_rep","commit_stats":{"total_commits":51,"total_committers":1,"mean_commits":51.0,"dds":0.0,"last_synced_commit":"24d791ae73d00d6db9a0e54068b168640edd9e43"},"previous_names":["nmerka/practicum_rep"],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/nmerka/practicum_rep","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/nmerka%2Fpracticum_rep","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/nmerka%2Fpracticum_rep/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/nmerka%2Fpracticum_rep/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/nmerka%2Fpracticum_rep/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/nmerka","download_url":"https://codeload.github.com/nmerka/practicum_rep/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/nmerka%2Fpracticum_rep/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":28942979,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-01-31T12:10:04.904Z","status":"ssl_error","status_checked_at":"2026-01-31T12:09:58.894Z","response_time":128,"last_error":"SSL_read: unexpected eof while reading","robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":false,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["jupyter-notebook","matplotlib","numpy","pandas","plotly","python","scipy","seaborn","sql","tableau"],"created_at":"2024-09-25T16:24:22.031Z","updated_at":"2026-01-31T12:32:21.469Z","avatar_url":"https://github.com/nmerka.png","language":"Jupyter Notebook","funding_links":[],"categories":[],"sub_categories":[],"readme":"# Учебные проекты аналитика данных\n| Название проекта      | Описание               | Используемые библиотеки |\n| :------------- |:------------------| :-----|\n| [Исследование надёжности заёмщиков — анализ банковских данных](https://github.com/nmerka/practicum_rep/blob/main/project/%D0%98%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%BD%D0%B0%D0%B4%D0%B5%D0%B6%D0%BD%D0%BE%D1%81%D1%82%D0%B8%20%D0%B7%D0%B0%D0%B5%D0%BC%D1%89%D0%B8%D0%BA%D0%BE%D0%B2%20%E2%80%94%20%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%20%D0%B1%D0%B0%D0%BD%D0%BA%D0%BE%D0%B2%D1%81%D0%BA%D0%B8%D1%85%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85.ipynb)     | На основе данных кредитного отдела банка исследовала влияние семейного положения и количества детей на факт погашения кредита в срок. Была получена информация о данных. Определены и обработаны пропуски. Заменены типы данных на соответствующие хранящимся данным. Удалены дубликаты. Выделены леммы в значениях столбца и категоризированны данные.|Python, pandas|\n| [Продажа квартир в Санкт-Петербурге — анализ рынка недвижимости](https://github.com/nmerka/practicum_rep/blob/main/project_2/%D0%98%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%BE%D0%B1%D1%8A%D1%8F%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B9%20%D0%BE%20%D0%BF%D1%80%D0%BE%D0%B4%D0%B0%D0%B6%D0%B5%20%D0%BA%D0%B2%D0%B0%D1%80%D1%82%D0%B8%D1%80%20(3).ipynb) |На основе данных сервиса Яндекс.Недвижимость определена рыночная стоимость объектов недвижимости разного типа, типичные параметры квартир, в зависимости от удаленности от центра. Проведена предобработка данных. Добавлены новые данные. Построены гистограммы, боксплоты, диаграммы рассеивания.|Python, pandas, matplotlib, исследовательский анализ данных, визуализация данных, предобработка данных|\n| [Исследование о рынке российского кинопроката](https://github.com/nmerka/practicum_rep/blob/main/Project_3/%D0%98%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85%20%D0%BE%20%D1%80%D0%BE%D1%81%D1%81%D0%B8%D0%B9%D1%81%D0%BA%D0%BE%D0%BC%20%D0%BA%D0%B8%D0%BD%D0%BE%D0%BF%D1%80%D0%BE%D0%BA%D0%B0%D1%82%D0%B5%20(1).ipynb) | Изучен рынок российского кинопроката и выявлены текущие тренды. Уделено внимание фильмам, которые получили государственную поддержку. Исследовано, насколько такие фильмы интересны зрителю. Работа с данными, опубликованными на портале открытых данных Министерства культуры. Набор данных содержит информацию о прокатных удостоверениях, сборах и государственной поддержке фильмов, а также информацию с сайта КиноПоиск..|Python, pandas, matplotlib, numpy, seaborn, исследовательский анализ данных, визуализация данных, предобработка данных.|\n|[Исследования рынка общепита в Москве для принятия решения об открытии нового заведения](https://github.com/nmerka/practicum_rep/blob/main/Project_4/%D0%98%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5%20%D1%80%D1%8B%D0%BD%D0%BA%D0%B0%20%D0%B7%D0%B0%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B9%20%D0%BE%D0%B1%D1%89%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE%20%D0%BF%D0%B8%D1%82%D0%B0%D0%BD%D0%B8%D1%8F%20%D0%9C%D0%BE%D1%81%D0%BA%D0%B2%D1%8B.ipynb) | Подготовлено исследование рынка на основе открытых данных о заведениях общественного питания Москвы, визуализированы полученные данные. На основе данных выбрано место для открытия новой кофейни. В построении графиков использованы библиотеки seaborn и plotly. |Python, pandas, matplotlib, numpy, seaborn, plotly, исследовательский анализ данных, визуализация данных, предобработка данных.|\n|[Анализ убытков приложения ProcrastinatePRO+](https://github.com/nmerka/practicum_rep/blob/main/Project_5/%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%20%D0%B1%D0%B8%D0%B7%D0%BD%D0%B5%D1%81-%D0%BF%D0%BE%D0%BA%D0%B0%D0%B7%D0%B0%D1%82%D0%B5%D0%BB%D0%B5%D0%B9%20%D0%BF%D1%80%D0%B8%D0%BB%D0%BE%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F%20Procrastinate%20Pro%2B.ipynb)| Проведен анализ данных от ProcrastinatePRO+. Рассчитаны различные метрики, использован когортный анализ: LTV, CAC, Retention rate, DAU, WAU, MAU и т.д. Использованы уже написанные ранее функции расчёта метрик. Сделаны выводы по полученным данным. |Python, pandas, matplotlib, numpy, когортный анализ, юнит-экономика, продуктовын метрики, визуализация данных, предобработка данных.|\n|[Статистический анализ данных сервиса аренды самокатов GoFast.](https://github.com/nmerka/practicum_rep/blob/main/Project_6/%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9%20%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85%20%D1%81%D0%B5%D1%80%D0%B2%D0%B8%D1%81%D0%B0%20%D0%B0%D1%80%D0%B5%D0%BD%D0%B4%D1%8B%20%D1%81%D0%B0%D0%BC%D0%BE%D0%BA%D0%B0%D1%82%D0%BE%D0%B2%20GoFast%20(1).ipynb)| В проекте был проведен анализ данных о некоторых пользователях из нескольких городов, а также об их поездках. Проверены некоторые гипотезы, которые могут помочь бизнесу вырасти.  |Python, pandas, matplotlib, numpy, seaborn, scipy, описательная статистика, проверка статистических гипотез.|\n|[Проверка гипотез по увеличению выручки в интернет-магазине — оценить результаты A/B теста](https://github.com/nmerka/practicum_rep/blob/main/Project_7/%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%20%D1%80%D0%B5%D0%B7%D1%83%D0%BB%D1%8C%D1%82%D0%B0%D1%82%D0%BE%D0%B2%20%D0%90%D0%92%20%D1%82%D0%B5%D1%81%D1%82%D0%B0%20(1).ipynb)| Проведена приоритизация гипотез по фреймворкам ICE и RICE. Затем проведен анализ результатов A/B-теста, построилены графики кумулятивной выручки, среднего чека, конверсии по группам, посчитана статистическая значимость различий конверсий и средних чеков по сырым и очищенным данным. На основании анализа мной было принято решение о нецелесообразности дальнейшего проведения теста. |Python, pandas, matplotlib, numpy, seaborn, scipy, plotly, А/В тестирование, проверка статистических гипотез.|\n|[Прогнозирование вероятности оттока пользователей для фитнес-центров](https://github.com/nmerka/practicum_rep/blob/main/Project_8/%D0%A3%D0%B4%D0%B5%D1%80%D0%B6%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%BA%D0%BB%D0%B8%D0%B5%D0%BD%D1%82%D0%BE%D0%B2%20%D1%81%D0%B5%D1%82%D0%B8%20%D1%84%D0%B8%D1%82%D0%BD%D0%B5%D1%81-%D1%86%D0%B5%D0%BD%D1%82%D1%80%D0%BE%D0%B2%20%C2%AB%D0%9A%D1%83%D0%BB%D1%8C%D1%82%D1%83%D1%80%D0%B8%D1%81%D1%82-%D0%B4%D0%B0%D1%82%D0%B0%D1%81%D0%B0%D0%B5%D0%BD%D1%82%D0%B8%D1%81%D1%82%C2%BB%20(1).ipynb)|В данном проекте использовано машинное обучение. Спрогнозирована вероятность оттока (на уровне следующего месяца) для каждого клиента; сформированы типичные портреты пользователей: выделены наиболее яркие группы, охарактеризованы их основные свойства; проанализированы основные признаки, наиболее сильно влияющие на отток. |Python, pandas, matplotlib, seaborn, scipy, sklearn, машинное обучение, классификация, кластеризация|\n|[Анализ продаж игр для интернет-магазина](https://github.com/nmerka/practicum_rep/blob/main/Project_9/%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%20%D0%BF%D1%80%D0%BE%D0%B4%D0%B0%D0%B6%20%D0%B8%D0%B3%D1%80%20%D0%B4%D0%BB%D1%8F%20%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D0%BD%D0%B5%D1%82-%D0%BC%D0%B0%D0%B3%D0%B0%D0%B7%D0%B8%D0%BD%D0%B0%20%D0%A1%D1%82%D1%80%D0%B8%D0%BC%D1%87%D0%B8%D0%BA%20.ipynb)|Для интернет-магазина «Стримчик», который продаёт по всему миру компьютерные игры, нужно выявить определяющие успешность игры закономерности. Из открытых источников доступны исторические данные о продажах игр, оценки пользователей и экспертов, жанры и платформы (например, Xbox или PlayStation).  Это позволит сделать ставку на потенциально популярный продукт и спланировать рекламные кампании. |Python, pandas, matplotlib, seaborn, scipy,numpy, проверка статистических гипотез, описательная статистика, А/В тестирование.|\n\n\n\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fnmerka%2Fpracticum_rep","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fnmerka%2Fpracticum_rep","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fnmerka%2Fpracticum_rep/lists"}