{"id":26943523,"url":"https://github.com/lyubov0406/data_analyst_portfolio","last_synced_at":"2026-04-09T12:56:39.695Z","repository":{"id":284187964,"uuid":"954120692","full_name":"Lyubov0406/Data_Analyst_Portfolio","owner":"Lyubov0406","description":"В репозитории собраны пет-проекты, демонстрирующие мои навыки в аналитике данных","archived":false,"fork":false,"pushed_at":"2025-04-01T12:41:42.000Z","size":3537,"stargazers_count":0,"open_issues_count":0,"forks_count":0,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-04-01T13:37:57.384Z","etag":null,"topics":["data-analysis","matplotlib","numpy","pandas","portfolio","python","scipy","seaborn","sql","tableau","visualization"],"latest_commit_sha":null,"homepage":"","language":"Jupyter Notebook","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/Lyubov0406.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2025-03-24T15:37:23.000Z","updated_at":"2025-04-01T12:41:45.000Z","dependencies_parsed_at":"2025-04-01T13:48:04.402Z","dependency_job_id":null,"html_url":"https://github.com/Lyubov0406/Data_Analyst_Portfolio","commit_stats":null,"previous_names":["lyubov0406/data_analytics_portfolio","lyubov0406/data_analyst_portfolio"],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/Lyubov0406%2FData_Analyst_Portfolio","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/Lyubov0406%2FData_Analyst_Portfolio/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/Lyubov0406%2FData_Analyst_Portfolio/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/Lyubov0406%2FData_Analyst_Portfolio/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/Lyubov0406","download_url":"https://codeload.github.com/Lyubov0406/Data_Analyst_Portfolio/tar.gz/refs/heads/main","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":246856687,"owners_count":20844974,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["data-analysis","matplotlib","numpy","pandas","portfolio","python","scipy","seaborn","sql","tableau","visualization"],"created_at":"2025-04-02T17:15:42.737Z","updated_at":"2025-12-30T23:11:24.463Z","avatar_url":"https://github.com/Lyubov0406.png","language":"Jupyter Notebook","funding_links":[],"categories":[],"sub_categories":[],"readme":"# Портфолио аналитика данных\n\nМеня зовут Любовь, мне 24 года.\n\nЯ кончила программу высшего образования (СПбГУ, клиническая психология, с отличием), в рамках которой неоднократно выполняла научные проекты, включающие анализ данных. На тот момент пользовалась **Google Sheets**, **IBM SPSS** и **Jamovi**, в которых проводила корреляционные, сравнительные, дисперсионные, кластерные и факторные анализы. \n\nНа протяжении полугода активно осваиваю **SQL**, **Python**, инструменты визуализации (**Tableau, Redash, Power BI**), а также знакомлюсь с A/B тестированием и углубляюсь в мат. статистику и теорию вероятности. \n\n**\u003cins\u003eЯ умею:\u003cins\u003e**\n1. Проводить разведочный анализ данных (EDA)\n2. Писать сложные SQL-запросы с GROUP BY, JOIN, оконными функциями\n3. Создавать сводные таблицы, писать формулы в Google Sheets, MS Excel \n4. Создавать интерактивные дашборды с фильтрами и расчетными полями\n4. Подготавливать данные и выполнять стат анализ с помощью Python (pandas, matplotlib и пр.)\n\nНе имею коммерческого опыта, но готова быстро вникать в работу компании, приобретать новые знания и обучаться необходимым навыкам. Рассматриваю как варианты стажировки без оплаты (не более 3 месяцев), так и позицию junior специалиста. \n\nХочу присоединиться к команде, где смогу работать с реальными бизнес-задачами, развиваться под руководством опытных аналитиков и приносить пользу, используя свои навыки!\n\n**В этом репозитории собраны пет-проекты, демонстрирующие мои навыки как аналитика данных.**\n\n## Пет-проекты\n\n### Анализ деятельности продуктового магазина (Python)\n\n**Код:** https://github.com/Lyubov0406/Data_Analyst_Portfolio/blob/main/Python_projects/shop_analysis/shop_analysis.ipynb      \n\n**Описание:** В рамках EDA была исследована клиентская база магазина (возраст, уровень образования, семейный статус покупателей), доходность всего магазина и различных его отделов, а также офлайн- и онлайн-подразделений, проанализирована успешность проведенных рекламных компаний.      \n\n**Навыки:** очистка и подготовка данных, описательный анализ, корреляционный и сравнительный анализы, визуализации.\n\n**Инструменты:** Python в Jupiter Notebook. Библиотеки: pandas, numpy, scipy, scikit_posthocs, seaborn, matplotlib.\n\n**Краткие итоги:** Наиболее удачной была последняя рекламная компания, получившая одобрение от 15% покупателей. Наименее удачной вторая, получившая всего 1%. Количество откликов на рекламные компании положительно связано как с суммой общих трат покупателей, так и с их доходом на высоком уровне значимости (p\u003c0.001). В офлайн-магазине совершается практически в 1,5 раза больше покупок. Общий доход магазина = 1188623$. В среднем каждый покупатель потратил примерно 561.2$. В абсолютных затратах лидирует винная продукция, обеспечивая 54% выручки магазина. \n\n### Анализ топа наиболее прослушиваемых треков на Spotify (SQL)\n\n**Код:** https://github.com/Lyubov0406/Data_Analyst_Portfolio/blob/main/SQL_projects/spotify_2023_analysis/spoify_2023_analysis.sql    \n\n**Описание:** Был проведен EDA с целью выявления наиболее успешных треков и их исполнителей, а также описания успешных композиций по их техническим параметрам (темп, тональность, модальность, танцевальность и пр.).\n\n**Навыки:** Использование агрегатных функций и группировка, создание переменнных, условных выражений, табличных выражений, соединение таблиц (JOIN).\n\n**Инструменты:** MySQL, DBeaver. \n\n**Краткие итоги:** В топ попало 632 уникальных исполнителя и коллабораций. Наиболее успешными исполнителями можно назвать Taylor Swift и The Weekend, имеющих наибольшее количество треков и прослушиваний. Самая популярная новинка года - трек Miley Cyrus \"Flowers\". Наибольшие показатели прослушиваемости набрали треки, выпущенные осенью, наименьшие - весной, хотя по количеству релизов этот сезон года лидирует. 6 из 10 наиболее популярных треков имеют мажорную модальность, при этом среди всех песен топа преобладают композиции с \"нейтральным настроением\" (30\u003cvalence\u003c70). \n\n### Анализ автомобильного рынка (Tableau)\n\n**Дашборды:** [pdf-файл](https://github.com/Lyubov0406/Data_Analyst_Portfolio/blob/main/Visualisation_projects/Auto-market_analysis_Tableau/auto-market_dashboards.pdf) и интерактивный вариант на [Tableau Public](https://public.tableau.com/app/profile/lyubov.zaitseva/vizzes)     \n\n**Описание:** Для наглядности динамики изменений на автомобильном рынке было создано два дашборда. Первый из них показывает основную информацию по продажам за 2022-2023 года: выручка и количество продаж по месяцам и по маркам/моделям автомобилей. Второй содержит информацию о дилерах автомобилей и их различиях между друг другом также по показателям выручки и продаж.\n\n**Навыки:** Составление визуализаций, верстка дашбордов, добавление интерактивных фильтров.\n\n**Инструменты:** Tableau Public.\n\n**Краткие итоги:** Четвертый квартал года является наиболее успешным по выручке и количеству продаж как в 2022, так и в 2023 годах. Наиболее продаваемые и доходные марки - Chevrolet, Ford и Dodge. Наибольший вклад в суммарную вырочку вносит Южный экономический регион с дилерами в Остине, Гринвилле и Джейнсвилле. Важно отметить, что дилеры разделились на две явно отличимые группы по количеству продаж и выручке. \n\n\nДругие проекты собраны в папки по конкретным стекам в этом же репозитории.\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Flyubov0406%2Fdata_analyst_portfolio","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Flyubov0406%2Fdata_analyst_portfolio","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Flyubov0406%2Fdata_analyst_portfolio/lists"}