https://github.com/lyubov0406/data_analyst_portfolio
В репозитории собраны пет-проекты, демонстрирующие мои навыки в аналитике данных
https://github.com/lyubov0406/data_analyst_portfolio
data-analysis matplotlib numpy pandas portfolio python scipy seaborn sql tableau visualization
Last synced: about 1 month ago
JSON representation
В репозитории собраны пет-проекты, демонстрирующие мои навыки в аналитике данных
- Host: GitHub
- URL: https://github.com/lyubov0406/data_analyst_portfolio
- Owner: Lyubov0406
- Created: 2025-03-24T15:37:23.000Z (about 1 month ago)
- Default Branch: main
- Last Pushed: 2025-04-01T12:41:42.000Z (about 1 month ago)
- Last Synced: 2025-04-01T13:37:57.384Z (about 1 month ago)
- Topics: data-analysis, matplotlib, numpy, pandas, portfolio, python, scipy, seaborn, sql, tableau, visualization
- Language: Jupyter Notebook
- Homepage:
- Size: 3.37 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Портфолио аналитика данных
Меня зовут Любовь, мне 24 года.
Я кончила программу высшего образования (СПбГУ, клиническая психология, с отличием), в рамках которой неоднократно выполняла научные проекты, включающие анализ данных. На тот момент пользовалась **Google Sheets**, **IBM SPSS** и **Jamovi**, в которых проводила корреляционные, сравнительные, дисперсионные, кластерные и факторные анализы.
На протяжении полугода активно осваиваю **SQL**, **Python**, инструменты визуализации (**Tableau, Redash, Power BI**), а также знакомлюсь с A/B тестированием и углубляюсь в мат. статистику и теорию вероятности.
**Я умею:**
1. Проводить разведочный анализ данных (EDA)
2. Писать сложные SQL-запросы с GROUP BY, JOIN, оконными функциями
3. Создавать сводные таблицы, писать формулы в Google Sheets, MS Excel
4. Создавать интерактивные дашборды с фильтрами и расчетными полями
4. Подготавливать данные и выполнять стат анализ с помощью Python (pandas, matplotlib и пр.)Не имею коммерческого опыта, но готова быстро вникать в работу компании, приобретать новые знания и обучаться необходимым навыкам. Рассматриваю как варианты стажировки без оплаты (не более 3 месяцев), так и позицию junior специалиста.
Хочу присоединиться к команде, где смогу работать с реальными бизнес-задачами, развиваться под руководством опытных аналитиков и приносить пользу, используя свои навыки!
**В этом репозитории собраны пет-проекты, демонстрирующие мои навыки как аналитика данных.**
## Пет-проекты
### Анализ деятельности продуктового магазина (Python)
**Код:** https://github.com/Lyubov0406/Data_Analyst_Portfolio/blob/main/Python_projects/shop_analysis/shop_analysis.ipynb
**Описание:** В рамках EDA была исследована клиентская база магазина (возраст, уровень образования, семейный статус покупателей), доходность всего магазина и различных его отделов, а также офлайн- и онлайн-подразделений, проанализирована успешность проведенных рекламных компаний.
**Навыки:** очистка и подготовка данных, описательный анализ, корреляционный и сравнительный анализы, визуализации.
**Инструменты:** Python в Jupiter Notebook. Библиотеки: pandas, numpy, scipy, scikit_posthocs, seaborn, matplotlib.
**Краткие итоги:** Наиболее удачной была последняя рекламная компания, получившая одобрение от 15% покупателей. Наименее удачной вторая, получившая всего 1%. Количество откликов на рекламные компании положительно связано как с суммой общих трат покупателей, так и с их доходом на высоком уровне значимости (p<0.001). В офлайн-магазине совершается практически в 1,5 раза больше покупок. Общий доход магазина = 1188623$. В среднем каждый покупатель потратил примерно 561.2$. В абсолютных затратах лидирует винная продукция, обеспечивая 54% выручки магазина.
### Анализ топа наиболее прослушиваемых треков на Spotify (SQL)
**Код:** https://github.com/Lyubov0406/Data_Analyst_Portfolio/blob/main/SQL_projects/spotify_2023_analysis/spoify_2023_analysis.sql
**Описание:** Был проведен EDA с целью выявления наиболее успешных треков и их исполнителей, а также описания успешных композиций по их техническим параметрам (темп, тональность, модальность, танцевальность и пр.).
**Навыки:** Использование агрегатных функций и группировка, создание переменнных, условных выражений, табличных выражений, соединение таблиц (JOIN).
**Инструменты:** MySQL, DBeaver.
**Краткие итоги:** В топ попало 632 уникальных исполнителя и коллабораций. Наиболее успешными исполнителями можно назвать Taylor Swift и The Weekend, имеющих наибольшее количество треков и прослушиваний. Самая популярная новинка года - трек Miley Cyrus "Flowers". Наибольшие показатели прослушиваемости набрали треки, выпущенные осенью, наименьшие - весной, хотя по количеству релизов этот сезон года лидирует. 6 из 10 наиболее популярных треков имеют мажорную модальность, при этом среди всех песен топа преобладают композиции с "нейтральным настроением" (30