Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/al-ogr/sf_pr1_job_analysis_hh
SkillFactory DataScience PROJECT-1. Анализ резюме из HeadHunter
https://github.com/al-ogr/sf_pr1_job_analysis_hh
data-analysis data-science ipynb plotly python
Last synced: about 14 hours ago
JSON representation
SkillFactory DataScience PROJECT-1. Анализ резюме из HeadHunter
- Host: GitHub
- URL: https://github.com/al-ogr/sf_pr1_job_analysis_hh
- Owner: al-ogr
- Created: 2024-11-15T11:35:17.000Z (5 days ago)
- Default Branch: main
- Last Pushed: 2024-11-15T13:28:30.000Z (5 days ago)
- Last Synced: 2024-11-15T14:29:32.176Z (5 days ago)
- Topics: data-analysis, data-science, ipynb, plotly, python
- Language: Jupyter Notebook
- Homepage:
- Size: 13.7 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Проект: Анализ резюме из HeadHunter
## Оглавление
[1. Описание проекта](README.md#Описание-проекта)
[2. Какой кейс решаем?](README.md#Какой-кейс-решаем)
[3. Краткая информация о данных](README.md#Краткая-информация-о-данных)
[4. Результаты](README.md#Результаты)### Описание проекта
Компании HeadHunter для построения модели автоматического определения примерного уровеня заработной платы, подходящей пользователю, на базе информации, которую он указал о себе, необходимо получить подготовленный датасет.:arrow_up:[к оглавлению](README.md#Оглавление)
### Какой кейс решаем?
*Проблематика:* часть соискателей не указывает желаемую заработную плату, когда составляет своё резюме, что является помехой для рекомендательной системы HeadHunter, которая подбирает соискателям список наиболее подходящих вакансий, а работодателям — список наиболее подходящих специалистов.
Необходимо подготовить отчёт о проделанной работе в виде ноутбука. Отчёт должен содержать ответы на задания, приведенные в [ноутбуке-шаблоне](https://lms-cdn.skillfactory.ru/assets/courseware/v1/1577d067038f8073197105c174f05822/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/Project-1._Ноутбук-шаблон.ipynb).**Требования к оформлению ноутбука-решения**
- Решение оформляется только в Jupyter Notebook.
- Решение оформляется в соответствии с [ноутбуком-шаблоном](https://lms-cdn.skillfactory.ru/assets/courseware/v1/1577d067038f8073197105c174f05822/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/Project-1._Ноутбук-шаблон.ipynb).
- Каждое задание выполняется в отдельной ячейке, выделенной под задание.
- Код для каждого задания оформляется в одной-двух jupyter-ячейках.
- Решение должно использовать только пройденный материал: переменные, основные структуры данных (списки, словари, множества), циклы, функции, библиотеки numpy, pandas, matplotlib, seaborn, plotly.
- Код должен быть читаемым и понятным.
- Использование руководства [PEP 8](https://lms.skillfactory.ru/courses/course-v1:SkillFactory+DSPR-2.0+14JULY2021/jump_to_id/958c1e42860d475999e9f9381dfe8b5a).
- Графики оформляются в соответствии с теми правилами, приведенными в модуле по визуализации данных.
- Обязательное требование: графики должны содержать название, отражающее их суть, и подписи осей.
- Выводы к графикам оформляются в формате Markdown под самим графиком в отдельной ячейке.**Что практикуем**
- Проведение базового анализа структуры данных.
- Преобразование данных.
- Проведение разведывательного анализа.
- Проведение очистки данных.:arrow_up:[к оглавлению](README.md#Оглавление)
### Краткая информация о данных
База резюме, выгруженная с сайта поиска вакансий hh.ru представлена в файле
[dst-3.0_16_1_hh_database.csv](https://drive.google.com/file/d/1Kb78mAWYKcYlellTGhIjPI-bCcKbGuTn/view?usp=sharing)
:arrow_up:[к оглавлению](README.md#Оглавление)### Результаты
В ходе выполнения задания сформирован отчет в формате .ipynb с применением библиотеки визуализации данных Plotly.:arrow_up:[к оглавлению](README.md#Оглавление)