Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/al-ogr/sf_pr1_job_analysis_hh

SkillFactory DataScience PROJECT-1. Анализ резюме из HeadHunter
https://github.com/al-ogr/sf_pr1_job_analysis_hh

data-analysis data-science ipynb plotly python

Last synced: about 2 months ago
JSON representation

SkillFactory DataScience PROJECT-1. Анализ резюме из HeadHunter

Awesome Lists containing this project

README

        

drawing

# Проект: Анализ резюме из HeadHunter

## Оглавление
[1. Описание проекта](README.md#Описание-проекта)
[2. Какой кейс решаем?](README.md#Какой-кейс-решаем)
[3. Краткая информация о данных](README.md#Краткая-информация-о-данных)
[4. Результаты](README.md#Результаты)

### Описание проекта
Компании HeadHunter для построения модели автоматического определения примерного уровеня заработной платы, подходящей пользователю, на базе информации, которую он указал о себе, необходимо получить подготовленный датасет.

:arrow_up:[к оглавлению](README.md#Оглавление)

### Какой кейс решаем?
*Проблематика:* часть соискателей не указывает желаемую заработную плату, когда составляет своё резюме, что является помехой для рекомендательной системы HeadHunter, которая подбирает соискателям список наиболее подходящих вакансий, а работодателям — список наиболее подходящих специалистов.
Необходимо подготовить отчёт о проделанной работе в виде ноутбука. Отчёт должен содержать ответы на задания, приведенные в [ноутбуке-шаблоне](https://lms-cdn.skillfactory.ru/assets/courseware/v1/1577d067038f8073197105c174f05822/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/Project-1._Ноутбук-шаблон.ipynb).

**Требования к оформлению ноутбука-решения**
- Решение оформляется только в Jupyter Notebook.
- Решение оформляется в соответствии с [ноутбуком-шаблоном](https://lms-cdn.skillfactory.ru/assets/courseware/v1/1577d067038f8073197105c174f05822/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/Project-1._Ноутбук-шаблон.ipynb).
- Каждое задание выполняется в отдельной ячейке, выделенной под задание.
- Код для каждого задания оформляется в одной-двух jupyter-ячейках.
- Решение должно использовать только пройденный материал: переменные, основные структуры данных (списки, словари, множества), циклы, функции, библиотеки numpy, pandas, matplotlib, seaborn, plotly.
- Код должен быть читаемым и понятным.
- Использование руководства [PEP 8](https://lms.skillfactory.ru/courses/course-v1:SkillFactory+DSPR-2.0+14JULY2021/jump_to_id/958c1e42860d475999e9f9381dfe8b5a).
- Графики оформляются в соответствии с теми правилами, приведенными в модуле по визуализации данных.
- Обязательное требование: графики должны содержать название, отражающее их суть, и подписи осей.
- Выводы к графикам оформляются в формате Markdown под самим графиком в отдельной ячейке.

**Что практикуем**
- Проведение базового анализа структуры данных.
- Преобразование данных.
- Проведение разведывательного анализа.
- Проведение очистки данных.

:arrow_up:[к оглавлению](README.md#Оглавление)

### Краткая информация о данных
База резюме, выгруженная с сайта поиска вакансий hh.ru представлена в файле
[dst-3.0_16_1_hh_database.csv](https://drive.google.com/file/d/1Kb78mAWYKcYlellTGhIjPI-bCcKbGuTn/view?usp=sharing)

:arrow_up:[к оглавлению](README.md#Оглавление)

### Результаты
В ходе выполнения задания сформирован отчет в формате .ipynb с применением библиотеки визуализации данных Plotly.

:arrow_up:[к оглавлению](README.md#Оглавление)