An open API service indexing awesome lists of open source software.

https://github.com/semcha/netology-pwh

Материалы к модулю "Проектирование DWH" курса Нетологии
https://github.com/semcha/netology-pwh

Last synced: 6 months ago
JSON representation

Материалы к модулю "Проектирование DWH" курса Нетологии

Awesome Lists containing this project

README

          

## Работа с Clickhouse
1. Установить [Docker Desktop](https://www.docker.com/products/docker-desktop/) и [DBeaver](https://dbeaver.io/download/)
1. [Скачать репозиторий](https://github.com/semcha/netology-pwh/archive/refs/heads/master.zip) и разархивировать, либо склонировать его себе с помощью git-клиента (рекомендую [fork](https://fork.dev/))
1. Перейти в папку clickhouse `cd ./clickhouse`
1. Запустить контейнер с Clickhouse командой `docker-compose up -d`
1. Подключиться к Clickhouse с помощью DBeaver:
- Тип подключения: Clickhouse
- Хост: localhost
- База данных: raw_layer
- Имя пользователя: admin
- Пароль: admin
1. Выполнить скрипт `clickhouse_data.sql` для загрузки исходных данных в слой `raw_layer`
1. Выполнить скрипт `clickhouse_lecture.sql` по шагам для закрепления материала
1. Остановить и удалить контейнер можно c помощью интерфейса Docker Desktop (вкладка Containers)

## Data Quality (Soda Core)
1. Установить [Python 3.11](https://www.python.org/downloads/release/python-3118/)
1. Установить необходимые библиотеки Python
`pip install soda-core==3.0.54 soda-core-postgres==3.0.54`
1. Перейти в папку soda-demo `cd ./soda-demo`
1. Протестировать соединение с Clickhouse командой `soda test-connection -d dwh -c configuration.yml`
1. Запустить data quality проверки командой `soda scan -d dwh -c configuration.yml dwh.yml`

## Дополнительные ссылки
* [Список доступных проверок в Soda Core](https://docs.soda.io/soda-cl/metrics-and-checks.html#list-of-sodacl-metrics-and-checks)