Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/fulyankin/andan
https://github.com/fulyankin/andan
Last synced: about 2 months ago
JSON representation
- Host: GitHub
- URL: https://github.com/fulyankin/andan
- Owner: FUlyankin
- License: mit
- Created: 2024-11-06T21:49:08.000Z (about 2 months ago)
- Default Branch: main
- Last Pushed: 2024-11-07T12:17:42.000Z (about 2 months ago)
- Last Synced: 2024-11-07T13:26:50.364Z (about 2 months ago)
- Language: Jupyter Notebook
- Size: 303 KB
- Stars: 1
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Анализ данных на python (коллекция зима-весна 2025)
Добро пожаловать в репозиторий хард-потока по анализу данных.
## Полезные ссылки
- [Таблица с вашими оценками](https://docs.google.com/spreadsheets/d/1oDwEBHLWWTDRM5C-VIMO-xMZKGZuobLcUkycx5ojgb0/edit?usp=sharing)
- [Youtube-канал](https://youtube.com/playlist?list=PLNKXA-74YGLhk6AHxlIh4mSJznjV8k6Kd&si=masDMfH-pxZbJKvv) с записями семинаров и [yandex-disk](https://disk.yandex.ru/d/bC-ToPd-QweBKg) с ними же
- Материалы для каждого семинара лежат в папках `/sem*`
- Если вы хотите скачать из репозитория конкретную папку, просто вставьте ссылку на неё [в сервис для скачки.](https://minhaskamal.github.io/DownGit/#/home)## Идеология курса
Добро пожаловать на курс по анализу данных. Основная цель этого курса - научить вас работе с данными. Мы научимся анализировать таблицы, строить красивый визуал, проверять гипотезы, симулировать случайные величины, а также посмотрим на базовые концепции машинного обучения.
На семинарах мы будем активно использовать различные понятия из теории вероятностей и математической статистики. Лекции и семинары по ним лучше не прогуливать ;)
## Домашние задания и контрольные
**Домашки:**
- Тут будут ссылки на ДЗ
## Большой план маленьких побед
В первом модуле будет 5 семинаров. Во втором модуле их будет 10.
- __sem01__ Вспоминаем питон на задачах про симуляции! Говорим про распределения. Вводимся в scipy и matplotlib.
- __sem02__ Обсуждаем numpy и решаем в нём задачки, немного говорим про вычислительный линал и BLAS/LAPACK
- __sem03__ Квантильное преобразование, больше говорим про симуляции, обсуждаем проклятье размерности
- __sem04__ Решаем в pandas какой-нибудь прикольный кейс
- __sem05__ Мб чёнеть спарсим или продолжим ботать пандас## Самый важный раздел
Вы получаете две оценки. Одну за курс, вторую за независимый экзамен. Оценка за курс ставится по формуле:
```
Итог = Min(8, 0.25 * ДЗ + 0.25 * П + 0.2 * КР + 0.3 * ЭКЗ)
```- ДЗ — среднее домашние работы (их будет 4 штуки)
- П — свой проект длинной в модуль (расскажем детали позже)
- КР — контрольная (о формате договоримся позже)
- ЭКЗ - экзамен## Лицензия
Весь контент, созданный для этого курса распространяются на правах лицензии [MIT License](https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/LICENSE) либо на правах лицензии [WTFPL](http://www.wtfpl.net/) на ваш выбор. Материалы публикуются как общественное достояние.