https://github.com/alenales/vector-comparison
Использование векторов для повышения точности
https://github.com/alenales/vector-comparison
marketing python scipy vectors
Last synced: about 1 month ago
JSON representation
Использование векторов для повышения точности
- Host: GitHub
- URL: https://github.com/alenales/vector-comparison
- Owner: AlenaLes
- Created: 2024-06-04T20:22:50.000Z (11 months ago)
- Default Branch: main
- Last Pushed: 2024-06-08T10:58:54.000Z (11 months ago)
- Last Synced: 2025-02-01T17:44:27.362Z (3 months ago)
- Topics: marketing, python, scipy, vectors
- Language: Jupyter Notebook
- Homepage:
- Size: 18.6 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Применение векторов для нахождения наиболее сопоставимой КГ
## Краткое описание
Скрипт был написан в рамках реальной задачи для [АШАН](https://www.auchan.ru/).
Цель проекта: Поиск наиболее похожего магазина по метрикам для выделения сопостовимой КГ. Применяется в случае, когда КГ не выделялась до проведения акции.Задачи:
- Выбрать метрики для сравнения;
- Выгрузить датасет с помощью SQL;
- Написать функцию на Python, которая будет выводить самый ближайший магазин;Результаты:
- Создан рабочий скрипт;
- Финальные данные используются при анализе маркетинговых акций. Точность сбора КГ увеличена.Полный скрипт расположен в файле "find_nearest.ipynb".
Стэк:
- Python
- SQL## Библиотеки для работы с Python, SQL и векторами.
```
import pandas as pd
import numpy as np
from scipy.spatial.distance import cdist
from scipy.spatial import distance
import psycopg2
```Скрыты все доступы для подключения к базам.
_________________________________
## ПроцессПервым шагом создается словарь с ключами (номера магазинов) и значениями (формат магазина и регион).
После применяется функция, которая принимает на вход номер магазина. На основе ключей данного магазина производится отбор формата и региона для последующего поиска.
С помощью библиотеки scipy каждому магазину присвоена своя точка в многомерном пространстве на основании его метрик за последние 6 месяцев. На основе расположения этих векторов можно найти самый близкий/ похожий вектор, который будет наиболее приближен по метрикам к требуемому._________________________________
## Финальный результат
Выводится самый похожий магазин в том же регионе и с таким же форматом.
Печатается список всех остальных номеров магазинов и их растояние в порядке возрастания.