https://github.com/brodev3/test-tasks-evosoft
Сompleting test tasks for employment in EVOSOFT
https://github.com/brodev3/test-tasks-evosoft
Last synced: about 1 year ago
JSON representation
Сompleting test tasks for employment in EVOSOFT
- Host: GitHub
- URL: https://github.com/brodev3/test-tasks-evosoft
- Owner: brodev3
- Created: 2023-02-03T12:50:16.000Z (over 3 years ago)
- Default Branch: main
- Last Pushed: 2023-02-08T08:48:22.000Z (over 3 years ago)
- Last Synced: 2025-02-05T00:26:46.469Z (over 1 year ago)
- Language: Python
- Size: 16.6 KB
- Stars: 1
- Watchers: 1
- Forks: 1
- Open Issues: 0
-
Metadata Files:
- Readme: README.MD
Awesome Lists containing this project
README
Тестовое задание
1. Парсер данных через селениум на сайте https://www.nseindia.com/
Алгоритм:
1. Зайти на https://www.nseindia.com
2. Навестись (hover) на MARKET DATA
3. Кликнуть на Pre-Open Market
4. Спарсить данные Final Price по всем позициям на странице и вывести их в
csv файл. Имя;цена
После этого сымитировать небольшой пользовательский сценарий
использования сайта. Здесь по своему желанию, но как пример:
1. Зайти на главную страницу
2. Пролистать вниз до графика
3. Выбрать график "NIFTY BANK"
4. Нажать “View all” под "TOP 5 STOCKS - NIFTY BANK"
5. Выбрать в селекторе “NIFTY ALPHA 50”
6. Пролистать таблицу до конца
2. Парсинг последних твитов Elon Musk.
Используя HTTP-запрос получить список последних 10 твитов Илона Маска .
Вывести в лог только текст (если есть) последних твитов и для каждого поста
вывести ссылки на аккаунты авторов 3х последних комментариев.Действия
должны повторять пользовательский путь, официальное API Twitter в задаче
не должно быть использовано.
Будет плюсом:
- Использование проксирования
- Схожесть поведения с реальным пользовательским насколько это возможно
- Реализация на Ruby, Python
Для запуска:
Скачать репозиторий
Загрузить необходимые библиотеки в ручную или с помощью requirements.txt
Описание:
В файле Task #1 выполненеие задания 1. Используются:
selenium,
undetected chrome (обычный вебдрайвер сайт не пускает),
webdriver_manager (для установки вебдрайвера),
расширение в папке proxy_auth_plugin с введенным прокси,
bs4 (для удобного парсинга таблицы),
time (для создания искусственной задержки),
os,
csv
Результат парсинга будет сохранен в results.csv.
Для запуска необходимо запустить Task #1.py.
В файле Task #2 выполненеие задания 2. Используются:
snscrape (для парсинга твиттов без использования официального API Twitter),
os (для подключения прокси, необходимо ввести прокси, либо подключить VPN)
Результат парсинга будет выведен в консоль.
Для запуска необходимо запустить Task #2.py, подключить прокси либо отказаться, ввести логин пользователя без @, чьи твиты необходимо спарсить.