https://github.com/nmerka/practicum_rep
Проекты курса Аналитик данных (Яндекс.Практикум)
https://github.com/nmerka/practicum_rep
jupyter-notebook matplotlib numpy pandas plotly python scipy seaborn sql tableau
Last synced: 3 days ago
JSON representation
Проекты курса Аналитик данных (Яндекс.Практикум)
- Host: GitHub
- URL: https://github.com/nmerka/practicum_rep
- Owner: nmerka
- Created: 2024-06-08T11:55:00.000Z (over 1 year ago)
- Default Branch: main
- Last Pushed: 2024-06-23T13:26:23.000Z (over 1 year ago)
- Last Synced: 2025-06-16T09:58:09.694Z (8 months ago)
- Topics: jupyter-notebook, matplotlib, numpy, pandas, plotly, python, scipy, seaborn, sql, tableau
- Language: Jupyter Notebook
- Homepage:
- Size: 8.3 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Учебные проекты аналитика данных
| Название проекта | Описание | Используемые библиотеки |
| :------------- |:------------------| :-----|
| [Исследование надёжности заёмщиков — анализ банковских данных](https://github.com/nmerka/practicum_rep/blob/main/project/%D0%98%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%BD%D0%B0%D0%B4%D0%B5%D0%B6%D0%BD%D0%BE%D1%81%D1%82%D0%B8%20%D0%B7%D0%B0%D0%B5%D0%BC%D1%89%D0%B8%D0%BA%D0%BE%D0%B2%20%E2%80%94%20%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%20%D0%B1%D0%B0%D0%BD%D0%BA%D0%BE%D0%B2%D1%81%D0%BA%D0%B8%D1%85%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85.ipynb) | На основе данных кредитного отдела банка исследовала влияние семейного положения и количества детей на факт погашения кредита в срок. Была получена информация о данных. Определены и обработаны пропуски. Заменены типы данных на соответствующие хранящимся данным. Удалены дубликаты. Выделены леммы в значениях столбца и категоризированны данные.|Python, pandas|
| [Продажа квартир в Санкт-Петербурге — анализ рынка недвижимости](https://github.com/nmerka/practicum_rep/blob/main/project_2/%D0%98%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%BE%D0%B1%D1%8A%D1%8F%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B9%20%D0%BE%20%D0%BF%D1%80%D0%BE%D0%B4%D0%B0%D0%B6%D0%B5%20%D0%BA%D0%B2%D0%B0%D1%80%D1%82%D0%B8%D1%80%20(3).ipynb) |На основе данных сервиса Яндекс.Недвижимость определена рыночная стоимость объектов недвижимости разного типа, типичные параметры квартир, в зависимости от удаленности от центра. Проведена предобработка данных. Добавлены новые данные. Построены гистограммы, боксплоты, диаграммы рассеивания.|Python, pandas, matplotlib, исследовательский анализ данных, визуализация данных, предобработка данных|
| [Исследование о рынке российского кинопроката](https://github.com/nmerka/practicum_rep/blob/main/Project_3/%D0%98%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85%20%D0%BE%20%D1%80%D0%BE%D1%81%D1%81%D0%B8%D0%B9%D1%81%D0%BA%D0%BE%D0%BC%20%D0%BA%D0%B8%D0%BD%D0%BE%D0%BF%D1%80%D0%BE%D0%BA%D0%B0%D1%82%D0%B5%20(1).ipynb) | Изучен рынок российского кинопроката и выявлены текущие тренды. Уделено внимание фильмам, которые получили государственную поддержку. Исследовано, насколько такие фильмы интересны зрителю. Работа с данными, опубликованными на портале открытых данных Министерства культуры. Набор данных содержит информацию о прокатных удостоверениях, сборах и государственной поддержке фильмов, а также информацию с сайта КиноПоиск..|Python, pandas, matplotlib, numpy, seaborn, исследовательский анализ данных, визуализация данных, предобработка данных.|
|[Исследования рынка общепита в Москве для принятия решения об открытии нового заведения](https://github.com/nmerka/practicum_rep/blob/main/Project_4/%D0%98%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5%20%D1%80%D1%8B%D0%BD%D0%BA%D0%B0%20%D0%B7%D0%B0%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B9%20%D0%BE%D0%B1%D1%89%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE%20%D0%BF%D0%B8%D1%82%D0%B0%D0%BD%D0%B8%D1%8F%20%D0%9C%D0%BE%D1%81%D0%BA%D0%B2%D1%8B.ipynb) | Подготовлено исследование рынка на основе открытых данных о заведениях общественного питания Москвы, визуализированы полученные данные. На основе данных выбрано место для открытия новой кофейни. В построении графиков использованы библиотеки seaborn и plotly. |Python, pandas, matplotlib, numpy, seaborn, plotly, исследовательский анализ данных, визуализация данных, предобработка данных.|
|[Анализ убытков приложения ProcrastinatePRO+](https://github.com/nmerka/practicum_rep/blob/main/Project_5/%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%20%D0%B1%D0%B8%D0%B7%D0%BD%D0%B5%D1%81-%D0%BF%D0%BE%D0%BA%D0%B0%D0%B7%D0%B0%D1%82%D0%B5%D0%BB%D0%B5%D0%B9%20%D0%BF%D1%80%D0%B8%D0%BB%D0%BE%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F%20Procrastinate%20Pro%2B.ipynb)| Проведен анализ данных от ProcrastinatePRO+. Рассчитаны различные метрики, использован когортный анализ: LTV, CAC, Retention rate, DAU, WAU, MAU и т.д. Использованы уже написанные ранее функции расчёта метрик. Сделаны выводы по полученным данным. |Python, pandas, matplotlib, numpy, когортный анализ, юнит-экономика, продуктовын метрики, визуализация данных, предобработка данных.|
|[Статистический анализ данных сервиса аренды самокатов GoFast.](https://github.com/nmerka/practicum_rep/blob/main/Project_6/%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9%20%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85%20%D1%81%D0%B5%D1%80%D0%B2%D0%B8%D1%81%D0%B0%20%D0%B0%D1%80%D0%B5%D0%BD%D0%B4%D1%8B%20%D1%81%D0%B0%D0%BC%D0%BE%D0%BA%D0%B0%D1%82%D0%BE%D0%B2%20GoFast%20(1).ipynb)| В проекте был проведен анализ данных о некоторых пользователях из нескольких городов, а также об их поездках. Проверены некоторые гипотезы, которые могут помочь бизнесу вырасти. |Python, pandas, matplotlib, numpy, seaborn, scipy, описательная статистика, проверка статистических гипотез.|
|[Проверка гипотез по увеличению выручки в интернет-магазине — оценить результаты A/B теста](https://github.com/nmerka/practicum_rep/blob/main/Project_7/%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%20%D1%80%D0%B5%D0%B7%D1%83%D0%BB%D1%8C%D1%82%D0%B0%D1%82%D0%BE%D0%B2%20%D0%90%D0%92%20%D1%82%D0%B5%D1%81%D1%82%D0%B0%20(1).ipynb)| Проведена приоритизация гипотез по фреймворкам ICE и RICE. Затем проведен анализ результатов A/B-теста, построилены графики кумулятивной выручки, среднего чека, конверсии по группам, посчитана статистическая значимость различий конверсий и средних чеков по сырым и очищенным данным. На основании анализа мной было принято решение о нецелесообразности дальнейшего проведения теста. |Python, pandas, matplotlib, numpy, seaborn, scipy, plotly, А/В тестирование, проверка статистических гипотез.|
|[Прогнозирование вероятности оттока пользователей для фитнес-центров](https://github.com/nmerka/practicum_rep/blob/main/Project_8/%D0%A3%D0%B4%D0%B5%D1%80%D0%B6%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%BA%D0%BB%D0%B8%D0%B5%D0%BD%D1%82%D0%BE%D0%B2%20%D1%81%D0%B5%D1%82%D0%B8%20%D1%84%D0%B8%D1%82%D0%BD%D0%B5%D1%81-%D1%86%D0%B5%D0%BD%D1%82%D1%80%D0%BE%D0%B2%20%C2%AB%D0%9A%D1%83%D0%BB%D1%8C%D1%82%D1%83%D1%80%D0%B8%D1%81%D1%82-%D0%B4%D0%B0%D1%82%D0%B0%D1%81%D0%B0%D0%B5%D0%BD%D1%82%D0%B8%D1%81%D1%82%C2%BB%20(1).ipynb)|В данном проекте использовано машинное обучение. Спрогнозирована вероятность оттока (на уровне следующего месяца) для каждого клиента; сформированы типичные портреты пользователей: выделены наиболее яркие группы, охарактеризованы их основные свойства; проанализированы основные признаки, наиболее сильно влияющие на отток. |Python, pandas, matplotlib, seaborn, scipy, sklearn, машинное обучение, классификация, кластеризация|
|[Анализ продаж игр для интернет-магазина](https://github.com/nmerka/practicum_rep/blob/main/Project_9/%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%20%D0%BF%D1%80%D0%BE%D0%B4%D0%B0%D0%B6%20%D0%B8%D0%B3%D1%80%20%D0%B4%D0%BB%D1%8F%20%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D0%BD%D0%B5%D1%82-%D0%BC%D0%B0%D0%B3%D0%B0%D0%B7%D0%B8%D0%BD%D0%B0%20%D0%A1%D1%82%D1%80%D0%B8%D0%BC%D1%87%D0%B8%D0%BA%20.ipynb)|Для интернет-магазина «Стримчик», который продаёт по всему миру компьютерные игры, нужно выявить определяющие успешность игры закономерности. Из открытых источников доступны исторические данные о продажах игр, оценки пользователей и экспертов, жанры и платформы (например, Xbox или PlayStation). Это позволит сделать ставку на потенциально популярный продукт и спланировать рекламные кампании. |Python, pandas, matplotlib, seaborn, scipy,numpy, проверка статистических гипотез, описательная статистика, А/В тестирование.|