https://github.com/alexsolov28/ml_nir
Научно-исследовательская работа на тему «Прогнозирование цен на жилье»
https://github.com/alexsolov28/ml_nir
jupyter-notebook matplotlib numpy pandas python seaborn
Last synced: 26 days ago
JSON representation
Научно-исследовательская работа на тему «Прогнозирование цен на жилье»
- Host: GitHub
- URL: https://github.com/alexsolov28/ml_nir
- Owner: AlexSolov28
- Created: 2024-09-13T19:44:31.000Z (over 1 year ago)
- Default Branch: main
- Last Pushed: 2024-12-13T08:40:14.000Z (about 1 year ago)
- Last Synced: 2025-04-05T20:43:09.677Z (11 months ago)
- Topics: jupyter-notebook, matplotlib, numpy, pandas, python, seaborn
- Language: Jupyter Notebook
- Homepage:
- Size: 2.35 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# ML_NIR
Научно-исследовательская работа по дисциплине «Технологии машинного обучения» на тему: «Прогнозирование цен на жилье»
[Сайт типового задания на НИР](https://github.com/ugapanyuk/ml_course_2022/wiki/TMO_NIRS)
Задачи:
1. Проведение разведочного анализа данных. Построение графиков, необходимых для понимания структуры данных. Анализ и заполнение пропусков в данных.
2. Выбор признаков, подходящих для построения моделей. Кодирование категориальных признаков. Масштабирование данных. Формирование вспомогательных признаков, улучшающих качество моделей.
3. Проведение корреляционного анализа данных. Формирование промежуточных выводов о возможности построения моделей машинного обучения.
4. Выбор метрик для последующей оценки качества моделей.
5. Выбор наиболее подходящих моделей для решения задачи регрессии.
6. Формирование обучающей и тестовой выборок на основе исходного набора данных.
7. Построение базового решения (baseline) для выбранных моделей без подбора гиперпараметров. Производится обучение моделей на основе обучающей выборки и оценка качества моделей на основе тестовой выборки.
8. Подбор гиперпараметров для выбранных моделей.
9. Сравнение качества полученных моделей с качеством baseline-моделей.
10. Формирование выводов о качестве построенных моделей на основе выбранных метрик.