An open API service indexing awesome lists of open source software.

https://github.com/an1mch1k-theone/project_2_hh_analyze

Анализ вакансий из HeadHunter
https://github.com/an1mch1k-theone/project_2_hh_analyze

data-analysis data-analysis-project postgresql python sql

Last synced: 2 months ago
JSON representation

Анализ вакансий из HeadHunter

Awesome Lists containing this project

README

          

# Анализ вакансий из HeadHunter

Этот проект посвящен анализу данных о вакансиях с платформы HeadHunter с использованием SQL и Python. Проект направлен на изучение различных аспектов рынка труда, таких как количество вакансий, распределение работодателей, зарплатные вилки, ключевые навыки и другие параметры.

## Содержание

- [Описание проекта](#описание-проекта)
- [Используемые инструменты](#используемые-инструменты)
- [Структура базы данных](#структура-базы-данных)
- [Анализ данных](#анализ-данных)
- [Предварительный анализ](#предварительный-анализ)
- [Детальный анализ вакансий](#детальный-анализ-вакансий)
- [Анализ работодателей](#анализ-работодателей)
- [Анализ Data Science вакансий](#анализ-data-science-вакансий)
- [Заключение](#заключение)

---

## Описание проекта

Цель проекта — провести комплексный анализ данных о вакансиях, собранных с платформы HeadHunter. Исследование включает предварительный анализ данных, детальное изучение вакансий, анализ работодателей и фокус на вакансиях, связанных с Data Science (DS).

Проект выполнен с использованием SQL для запросов к базе данных и Python для обработки и визуализации данных.

---

## Используемые инструменты

- **SQL**: Для выполнения запросов к базе данных PostgreSQL.
- **Python**: Для обработки данных и выполнения дополнительных вычислений.
- **Pandas**: Для анализа и манипуляции данными.
- **PostgreSQL**: База данных, содержащая информацию о вакансиях, работодателях и регионах.

---

## Структура базы данных

База данных состоит из нескольких таблиц:

1. **vacancies**: Информация о вакансиях.
- `id`: Уникальный идентификатор вакансии.
- `name`: Название вакансии.
- `salary_from`, `salary_to`: Зарплатная вилка.
- `key_skills`: Ключевые навыки.
- `experience`: Требуемый опыт работы.
- `employment`: Тип трудоустройства.
- `schedule`: Рабочий график.

2. **employers**: Информация о работодателях.
- `id`: Уникальный идентификатор работодателя.
- `name`: Название компании.

3. **areas**: Информация о регионах.
- `id`: Уникальный идентификатор региона.
- `name`: Название региона.

4. **industries**: Информация о сферах деятельности.
- `id`: Уникальный идентификатор сферы деятельности.
- `name`: Название сферы деятельности.

---

## Анализ данных

### Предварительный анализ

В ходе предварительного анализа были получены следующие результаты:

- Всего в базе данных содержится **49,197 вакансий**.
- Количество работодателей достигает **23,501**.
- Данные охватывают **1,362 региона**.
- В базе представлены **294 сферы деятельности**.

### Детальный анализ вакансий

1. **Топ-5 регионов по количеству вакансий**:
- Москва
- Санкт-Петербург
- Минск
- Новосибирск
- Алматы

2. **Зарплатные вилки**:
- Среднее значение нижней границы: **71,065**.
- Среднее значение верхней границы: **110,537**.

3. **Требуемый опыт работы**:
- Наиболее популярный уровень опыта: **От 1 года до 3 лет**.

4. **Формат занятости**:
- Наиболее популярный формат: **Полная занятость**.

### Анализ работодателей

1. **Работодатели с наибольшим количеством вакансий**:
- Первое место: **Яндекс** (1,933 вакансии).
- Пятое место: **Газпром нефть** (331 вакансия).

2. **Регионы без вакансий**:
- Регион с наибольшим количеством работодателей, но без вакансий: **Россия**.

3. **Количество регионов для публикации вакансий**:
- Максимальное количество регионов у одного работодателя: **181**.

4. **Сфера деятельности**:
- Количество работодателей, указавших «Разработка программного обеспечения»: **3,553**.

### Анализ Data Science вакансий

1. **Общее количество DS-вакансий**: **1,771**.
2. **Вакансии для начинающих дата-сайентистов**: **51**.
3. **Вакансии с ключевыми навыками SQL или PostgreSQL**: **201**.
4. **Вакансии с ключевым навыком Python**: **351**.
5. **Среднее количество ключевых навыков**: **6.41**.

---

## Заключение

Проект позволил получить глубокое понимание текущего состояния рынка труда на платформе HeadHunter. Были выявлены ключевые тренды, такие как популярность удаленной работы, высокий спрос на специалистов с опытом от 1 до 3 лет и значимость навыков SQL и Python для Data Science.

Результаты анализа могут быть полезны как соискателям, так и работодателям для принятия обоснованных решений.

---

## Авторы

* [An1mch1k](https://github.com/An1mch1k-theOne)