https://github.com/githubjeka/9_evaluation_selection
https://github.com/rolling-scopes-school/ml-intro/blob/2022/9_evaluation_selection/HOMEWORK.md
https://github.com/githubjeka/9_evaluation_selection
Last synced: 9 months ago
JSON representation
https://github.com/rolling-scopes-school/ml-intro/blob/2022/9_evaluation_selection/HOMEWORK.md
- Host: GitHub
- URL: https://github.com/githubjeka/9_evaluation_selection
- Owner: githubjeka
- Created: 2022-05-05T18:20:51.000Z (over 3 years ago)
- Default Branch: main
- Last Pushed: 2022-05-16T17:28:26.000Z (over 3 years ago)
- Last Synced: 2025-04-28T11:12:39.575Z (9 months ago)
- Language: Python
- Size: 48.8 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Model evaluation and selection
Приложение с моделью
для [Forest train dataset](https://www.kaggle.com/competitions/forest-cover-type-prediction/overview), созданная в
рамках курса от [Rolling Scopes School](https://github.com/rolling-scopes-school). Идеи для шаблона проекта взяты
из [python-packaging](https://blog.ionelmc.ro/2014/05/25/python-packaging/#the-structure)
и [ml-project-demo](https://github.com/rolling-scopes-school/ml-project-demo)
При разработке использовался:
- [Python](https://www.python.org/downloads/release/python-3912/) version 3.9.12 (под Windows 11)
- [Poetry](https://python-poetry.org/) version 1.1.13
## Установка приложения
1. Запустить команду ```poetry install --no-dev``` для установки всех зависимостей, которые перечислены в
файле `pyproject.toml`
2. Загрузить файлы [Forest train dataset](https://www.kaggle.com/competitions/forest-cover-type-prediction/data) в
директорию проекта `data`
## Использование приложения
1. Просмотр доступных параметров приложения и их значений по умолчанию
```
poetry run train --help
```
2. Запуск приложения с параметрами по умолчанию
```
poetry run train
```
Будет загружены информация из файла `data/train.csv` и результаты запуска будут сохранены в директории `models` и `mlruns`
3. Просмотр результатов через [MLflow](https://www.mlflow.org)
```
poetry run mlflow ui
```
### TASK 8
Запуск
```bash
# Для просмотра справки запустить `poetry run tree --help`
poetry run tree
```

### TASK 9 automatic hyperparameter with nested cross-validation
Запуск
```bash
# Для просмотра справки запустить `poetry run gridcv --help`
poetry run gridcv
```

## Development
При инициализации проекта для разработки используйте команду
```bash
poetry install
```
Для тестов используйте [Pytest](https://docs.pytest.org)
```bash
poetry run pytest
```

Для форматирования используйте [Black](https://black.readthedocs.io)
```bash
black src/eval_sel/
# All done! ✨ 🍰 ✨
# 6 files left unchanged.
```

Проверка форматирования организована через [flake8](https://flake8.pycqa.org/en/latest/#)
Используйте следующую команду для запуска этой проверки
```bash
flake8 src/eval_sel/
```
Для проверки static typing используйте [mypy](http://www.mypy-lang.org)
```bash
mypy src/eval_sel/
```

### Nox
Запуск всех команд доступен через [Nox](https://nox.thea.codes/en/stable/)
```bash
nox
```
