Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/dini4ka/technikal_magazines
https://github.com/dini4ka/technikal_magazines
Last synced: 8 days ago
JSON representation
- Host: GitHub
- URL: https://github.com/dini4ka/technikal_magazines
- Owner: Dini4ka
- Created: 2021-02-15T16:59:12.000Z (almost 4 years ago)
- Default Branch: main
- Last Pushed: 2021-02-16T23:50:38.000Z (almost 4 years ago)
- Last Synced: 2024-11-27T22:18:58.280Z (26 days ago)
- Language: Python
- Size: 1.56 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
Привет, это мой лично разработанный парсер для обхода ряда тех.магазинов( МВидео, DNS, Эльдорадо, Холодильник, РБТ), цель которого заключается в сборе отзывов на конкретные товары.
У парсера есть 2 функцию:
1) Анализ конкретного бренда на сайте(samsung, vitek, etc..), проход по каждому найденному товару и чтение отзывов. На вход подаётся ссылка на интернет магазин с поиском(пр. https://www.dns-shop.ru/search/?q=vitek), а на выход идёт csv фаил с результатом
2) Анализ оценки по конкретному csv файлу(пример такого файла лежит в репе), на выход также csv фаил с результатом
Для полного функционирования необходимо сделать следующее:
1) На диске C создать две папки 'result_files' и 'technikal_shops'
2) Иметь python версии 3.5 и выше
3) Установить следующие библиотеки:
pip3 install selenium
pip3 install requests
pip3 install bs4
pip3 install lxml
pip3 install openpyxlВ папку 'technika_shops' кладём фаил 'buff.lxml'(обязательно) и файлы, которые нам нужны для пункта 2) работы парсера. В папке 'result_files' будет лежать фаил с результатом