An open API service indexing awesome lists of open source software.

https://github.com/mikhaillipanin/html-parser

Парсинг данных из HTML таблицы и занесение их в Google Таблицу
https://github.com/mikhaillipanin/html-parser

golang google-sheets parsing

Last synced: about 2 months ago
JSON representation

Парсинг данных из HTML таблицы и занесение их в Google Таблицу

Awesome Lists containing this project

README

        

# html-parser

Консольное приложение, которое парсит таблицу с данными в указанном HTML и заполняет эти данные в Google Таблицу.

Ссылка на Google таблицу: https://docs.google.com/spreadsheets/d/12MWHmBNFWFuFjXY3N2BlGw2o9w_lPfQrj3SPuNF7XZI/edit#gid=0

## Cхема работы

1. Приложение парсит данные с HTML таблички
2. Считывает данные, которые уже лежат в Google таблице
3. Обновляет данные, которых в Google таблице нет/удаляет лишние данные, которых нет в HTML

Присутсвует синхронизация с HTML файлом в виде:
- При изменении HTML документа, при запуске данного приложения данные автоматически обновятся в Google таблице
- Поддерживает Добавление, Изменение, Удаление в HTML таблице
- Структура приложения предусматривает дальнейшее возможное улучшение: интерфейс `Storage` предоставляет возможность добавить другие виды структур хранения информации, такие как Базы Данных, Файлы и.т.д.

В приложении используются пакеты:

- [viper](https://github.com/spf13/viper) для работы с конфигурационными файлами
- [spreadsheet.v2](https://gopkg.in/Iwark/spreadsheet.v2) для взаимодействия с Google Doc API
- [colly](https://github.com/gocolly/colly) для парсинга HTML файлов

## Скриншоты:
C данной HTML таблицы парсятся данные:

![img.png](img.png)

и заносятся в Google таблицу:
![img_1.png](img_1.png)