{"id":24526116,"url":"https://github.com/daskwin/car_predictions_price","last_synced_at":"2026-01-03T00:10:00.592Z","repository":{"id":266347140,"uuid":"898103161","full_name":"daskwin/car_predictions_price","owner":"daskwin","description":"Homework 1 ML HSE AI","archived":false,"fork":false,"pushed_at":"2024-12-03T20:56:15.000Z","size":6488,"stargazers_count":0,"open_issues_count":0,"forks_count":0,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-01-22T05:34:24.265Z","etag":null,"topics":[],"latest_commit_sha":null,"homepage":null,"language":"HTML","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"mit","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/daskwin.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2024-12-03T19:45:53.000Z","updated_at":"2024-12-03T20:56:19.000Z","dependencies_parsed_at":null,"dependency_job_id":"3892b166-772a-46b2-9023-4ca40479bc32","html_url":"https://github.com/daskwin/car_predictions_price","commit_stats":null,"previous_names":["daskwin/car_predictions_price"],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/daskwin%2Fcar_predictions_price","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/daskwin%2Fcar_predictions_price/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/daskwin%2Fcar_predictions_price/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/daskwin%2Fcar_predictions_price/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/daskwin","download_url":"https://codeload.github.com/daskwin/car_predictions_price/tar.gz/refs/heads/main","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":243753989,"owners_count":20342537,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":[],"created_at":"2025-01-22T05:32:06.256Z","updated_at":"2026-01-03T00:10:00.552Z","avatar_url":"https://github.com/daskwin.png","language":"HTML","funding_links":[],"categories":[],"sub_categories":[],"readme":"# Анализ проделанной работы\nПо первой части работы был выполнен EDA. В итоге данные были очищены и заполнены (если были пропуски в данных). На данном этапе для меня как таковых сложностей не возникло, поскольку самые сложные этапы были удалены (я честно пыталась предобработать `torque`, но немного запуталась и решила оставить этот столбец). Были также рассмотрены и сделаны выводы по различным визуализациям как признаков, так и связи их с таргетом (корреляции и различные попарные графики).\n\nНекоторый опыт в обучении моделей я уже имела, но все равно в какой-то момент было интересно, почему коэффициент регуляризации у меня вышел очень большим (пришла к выводу, что, возможно, это зависело от масштаба таргета). Понятное дело, что при использовании еще и категориальных признаков модель улучшилась в своем качестве, хоть и не так сильно, как хотелось бы)))\n\nОчень понравилось, что в конце первой части были рассмотрены еще и безнесовые вещи. Как мне кажется, это очень полезно для дальнейшего использования в реальных ситуациях (работа, как пример).\n\nОсновные итоги:\n* модель Ridge с использованием еще и категориальных признаков показала наилучшие результаты ($R^2=0,61$, $RMSE=475 024$);\n* Разобраны различные виды линейной регрессии (в Лассо даже получилось занулить признаки);\n* При рассмотреннии бизнес-метрики выяснилось, что любые изменения и подборы параметров положительно сказывались на качестве для бизнеса;\n* Буст качеству модели дало добавление категориальных признаков и нахождение лучше модели и ее параметров через GridSearchCV.\n  \nБолее подробные выводы были написаны в ноутбуке.\n\n---\n\nА вот вторая часть работы для меня оказалась несколько новой. Тут необходимо было реализован \"сервис\", который предсказывает цены автомобилей. Тут я хотела бы прикрепить скриншоты работы:\n\n`На вход в формате json подаются признаки одного объекта, на выходе сервис выдает предсказанную стоимость машины`\n\n![Описание изображения](/img/1.png)\n\n`На вход подается csv-файл с признаками тестовых объектов, на выходе получаем файл с +1 столбцом - предсказаниями на этих объектах`\n\n![Описание изображения](/img/2.png)\n\nПри выполнении файл сохраняется в директорию проекта:\n\n![Описание изображения](/img/3.png)\n\nДанные, которые мы загружаем:\n\n![Описание изображения](/img/4.png)\n\nДанные, которые мы получаем:\n\n![Описание изображения](/img/5.png)\n\n---\n\nЕдинственное, что хотела бы отметить. В моем коде предполагается, что в данных нет пропусков. Это можно было бы дополнить, если из изначального ноутбука также выгрузить медианы тренировочных данных и заполнять пропуски ими.\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fdaskwin%2Fcar_predictions_price","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fdaskwin%2Fcar_predictions_price","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fdaskwin%2Fcar_predictions_price/lists"}