Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/fulyankin/andan


https://github.com/fulyankin/andan

Last synced: about 2 months ago
JSON representation

Awesome Lists containing this project

README

        

# Анализ данных на python (коллекция зима-весна 2025)

Добро пожаловать в репозиторий хард-потока по анализу данных.

## Полезные ссылки

- [Таблица с вашими оценками](https://docs.google.com/spreadsheets/d/1oDwEBHLWWTDRM5C-VIMO-xMZKGZuobLcUkycx5ojgb0/edit?usp=sharing)
- [Youtube-канал](https://youtube.com/playlist?list=PLNKXA-74YGLhk6AHxlIh4mSJznjV8k6Kd&si=masDMfH-pxZbJKvv) с записями семинаров и [yandex-disk](https://disk.yandex.ru/d/bC-ToPd-QweBKg) с ними же
- Материалы для каждого семинара лежат в папках `/sem*`
- Если вы хотите скачать из репозитория конкретную папку, просто вставьте ссылку на неё [в сервис для скачки.](https://minhaskamal.github.io/DownGit/#/home)

## Идеология курса

Добро пожаловать на курс по анализу данных. Основная цель этого курса - научить вас работе с данными. Мы научимся анализировать таблицы, строить красивый визуал, проверять гипотезы, симулировать случайные величины, а также посмотрим на базовые концепции машинного обучения.

На семинарах мы будем активно использовать различные понятия из теории вероятностей и математической статистики. Лекции и семинары по ним лучше не прогуливать ;)

## Домашние задания и контрольные

**Домашки:**

- Тут будут ссылки на ДЗ

## Большой план маленьких побед

В первом модуле будет 5 семинаров. Во втором модуле их будет 10.

- __sem01__ Вспоминаем питон на задачах про симуляции! Говорим про распределения. Вводимся в scipy и matplotlib.
- __sem02__ Обсуждаем numpy и решаем в нём задачки, немного говорим про вычислительный линал и BLAS/LAPACK
- __sem03__ Квантильное преобразование, больше говорим про симуляции, обсуждаем проклятье размерности
- __sem04__ Решаем в pandas какой-нибудь прикольный кейс
- __sem05__ Мб чёнеть спарсим или продолжим ботать пандас

## Самый важный раздел

Вы получаете две оценки. Одну за курс, вторую за независимый экзамен. Оценка за курс ставится по формуле:

```
Итог = Min(8, 0.25 * ДЗ + 0.25 * П + 0.2 * КР + 0.3 * ЭКЗ)
```

- ДЗ — среднее домашние работы (их будет 4 штуки)
- П — свой проект длинной в модуль (расскажем детали позже)
- КР — контрольная (о формате договоримся позже)
- ЭКЗ - экзамен

## Лицензия

Весь контент, созданный для этого курса распространяются на правах лицензии [MIT License](https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/LICENSE) либо на правах лицензии [WTFPL](http://www.wtfpl.net/) на ваш выбор. Материалы публикуются как общественное достояние.