https://github.com/lmashik/bs4_parser_pep
Парсер документов PEP8
https://github.com/lmashik/bs4_parser_pep
beautifulsoup4 python37 requests-cache tqdm
Last synced: 2 months ago
JSON representation
Парсер документов PEP8
- Host: GitHub
- URL: https://github.com/lmashik/bs4_parser_pep
- Owner: lmashik
- Created: 2023-05-31T15:47:31.000Z (over 2 years ago)
- Default Branch: master
- Last Pushed: 2023-11-08T20:08:39.000Z (almost 2 years ago)
- Last Synced: 2025-02-27T17:23:28.324Z (7 months ago)
- Topics: beautifulsoup4, python37, requests-cache, tqdm
- Language: Python
- Homepage:
- Size: 24.4 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Проект парсинга pep и документации Python
----------------------------------------
## ОписаниеДанный парсер поможет:
* узнать все о нескольких последних версиях Python
* узнать о наиболее важных изменениях между основными версиями Python
* скачать документацию последней версии
* узнать о статусах документов PEP (сколько в каком статусе)----------------------------------------
## Используемые технологии- Python 3.7
- requests-cache (расширенная библиотека requests, включая возможность кешировать HTTP-ответы)
- tqdm (библиотека для визуализации прогресс-бара)
- Beautiful Soup (библиотека для парсинга HTML и XML документов)
----------------------------------------
## Установка и запуск1. Клонируйте репозиторий
```bash
git clone https://github.com/lmashik/bs4_parser_pep.git
```2. Создайте и активируйте виртуальное окружение
```bash
python3.7 -m venv env
```* Если у вас Linux/macOS
```bash
source env/bin/activate
```* Если у вас windows
```bash
source env/scripts/activate
```3. Обновите pip до последней версии
```bash
python3 -m pip install --upgrade pip
```4. Установите зависимости из файла requirements.txt
```bash
pip install -r requirements.txt
```5. Перейдите в директорию с парсером
```bash
cd src
```6. Ознакомьтесь с информацией о парсере и доступных командах
```bash
python main.py -h
```HTTP-ответы кешируются.
Для очистки кеша при выполнении следующей команды добавьте "-c", например,
```bash
python main.py latest-versions -c
```Работа парсера логируется. Логи сохраняются в папку logs.
----------------------------------------
## latest_versionsЧтобы узнать подробности о нескольких последних версиях Python,
запустите парсер с помощью команды```bash
python main.py latest-versions
```С помощью этой команды информация будет выведена в консоль.
Преобразите ее, добавив "-o pretty"
```bash
python main.py latest-versions -o pretty
```Для сохранения в файл, добавьте "-o file"
```bash
python main.py latest-versions -o file
```Файл будет сохранен в папку results.
----------------------------------------
## whats_newЧтобы узнать об изменениях между основными версиями,
запустите парсер с помощью команды```bash
python main.py whats-new
```С помощью этой команды информация будет выведена в консоль.
Преобразите ее, добавив "-o pretty"
```bash
python main.py whats-new -o pretty
```Для сохранения в файл, добавьте "-o file"
```bash
python main.py whats-new -o file
```Файл будет сохранен в папку results.
----------------------------------------
## downloadЧтобы скачать документацию, запустите парсер с помощью команды
```bash
python main.py download
```Документация будет сохранена в папку downloads.
----------------------------------------
## pepЧтобы консолидировать информацию о статусах документов PEP,
запустите парсер с помощью команды```bash
python main.py pep
```С помощью этой команды информация будет выведена в консоль.
Преобразите ее, добавив "-o pretty"
```bash
python main.py pep -o pretty
```Для сохранения в файл, добавьте "-o file"
```bash
python main.py pep -o file
```Файл будет сохранен в папку results.
----------------------------------------
## Автор проектаЛапикова Мария Дмитриевна
mashik_p@mail.ru