https://github.com/mikhaillipanin/html-parser
Парсинг данных из HTML таблицы и занесение их в Google Таблицу
https://github.com/mikhaillipanin/html-parser
golang google-sheets parsing
Last synced: about 2 months ago
JSON representation
Парсинг данных из HTML таблицы и занесение их в Google Таблицу
- Host: GitHub
- URL: https://github.com/mikhaillipanin/html-parser
- Owner: MikhailLipanin
- Created: 2023-02-13T21:12:14.000Z (about 2 years ago)
- Default Branch: master
- Last Pushed: 2023-02-14T21:49:09.000Z (about 2 years ago)
- Last Synced: 2025-01-16T05:11:21.322Z (3 months ago)
- Topics: golang, google-sheets, parsing
- Language: Go
- Homepage:
- Size: 73.2 KB
- Stars: 1
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# html-parser
Консольное приложение, которое парсит таблицу с данными в указанном HTML и заполняет эти данные в Google Таблицу.
Ссылка на Google таблицу: https://docs.google.com/spreadsheets/d/12MWHmBNFWFuFjXY3N2BlGw2o9w_lPfQrj3SPuNF7XZI/edit#gid=0
## Cхема работы
1. Приложение парсит данные с HTML таблички
2. Считывает данные, которые уже лежат в Google таблице
3. Обновляет данные, которых в Google таблице нет/удаляет лишние данные, которых нет в HTMLПрисутсвует синхронизация с HTML файлом в виде:
- При изменении HTML документа, при запуске данного приложения данные автоматически обновятся в Google таблице
- Поддерживает Добавление, Изменение, Удаление в HTML таблице
- Структура приложения предусматривает дальнейшее возможное улучшение: интерфейс `Storage` предоставляет возможность добавить другие виды структур хранения информации, такие как Базы Данных, Файлы и.т.д.В приложении используются пакеты:
- [viper](https://github.com/spf13/viper) для работы с конфигурационными файлами
- [spreadsheet.v2](https://gopkg.in/Iwark/spreadsheet.v2) для взаимодействия с Google Doc API
- [colly](https://github.com/gocolly/colly) для парсинга HTML файлов## Скриншоты:
C данной HTML таблицы парсятся данные:
и заносятся в Google таблицу:
