https://github.com/garrrikkotua/tinkoff_lab_feature_selection
Feature selection for Tinkoff fintech lab
https://github.com/garrrikkotua/tinkoff_lab_feature_selection
jupyter-notebook python
Last synced: 2 months ago
JSON representation
Feature selection for Tinkoff fintech lab
- Host: GitHub
- URL: https://github.com/garrrikkotua/tinkoff_lab_feature_selection
- Owner: garrrikkotua
- Created: 2019-11-01T06:07:37.000Z (over 5 years ago)
- Default Branch: master
- Last Pushed: 2019-11-15T06:53:01.000Z (over 5 years ago)
- Last Synced: 2025-01-28T11:23:28.680Z (4 months ago)
- Topics: jupyter-notebook, python
- Language: Jupyter Notebook
- Homepage:
- Size: 4.04 MB
- Stars: 0
- Watchers: 3
- Forks: 1
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Tinkoff_Lab_Feature_Selection
Tinkoff_Lab_Feature_Selection
Это репозиторий проекта лаборатории финансовых технологий Тинькофф.
# Цель проекта
Используя данные партнеров компании, отобрать самые важные признаки для улучшения моделей предсказания дефолтности и грейсовости клиентов.# Использованные методы отбора признаков
Univariate selection
Backward elimination
Forward selection
L1-based feature selection
PCA
Feature importance используя XgBoost
Feature importance используя Catboost
# Описание файлов
1. working_with_grace.ipynb, working_with_pd.ipynb - сравнение методов 1, 2, 4 и 5 для grace и pd соответсвенно
2. Trying_xgboost_grace.ipynb, Trying_xgboost_pd.ipynb - 6 и 7 для grace и pd соответсвенно
3. Forward_selection.ipynb - 3 метод для grace и pd
4. Combining_models_pd.ipynb, Combining_models_grace.ipynb - комбинирование моей и текущей модели для сравнения (используя метод 2)
5. Combining_models_pd_fs.ipynb, Combining_models_grace_fs.ipynb комбинирование моей и текущей модели для сравнения (используя метод 3)
6. comparison_methods.xlsx - итоговая таблица сравнения всех методова 1-7
7. comparison_tinkoff.xlsx - итоговая таблица сравнения моей модели и текущей (на методах 2 и 3)
8. Отчет_по_проделанной_работе.docx - описание проделанной работы
9. autoencoder.ipynb - попытка понижения размерности датасета с помощью нейронной сети
10. все остальное - данные и служебные файлы# Смотрите файл "Отчет_по_проделанной_работе.docx", чтобы узнать подробности.