Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/yandex-cloud-examples/yc-data-proc-postgresql-data-import

Импорт данных из Yandex Managed Service for PostgreSQL в Yandex Data Proc с помощью Sqoop.
https://github.com/yandex-cloud-examples/yc-data-proc-postgresql-data-import

data-proc postgresql yandex-cloud yandexcloud

Last synced: about 14 hours ago
JSON representation

Импорт данных из Yandex Managed Service for PostgreSQL в Yandex Data Proc с помощью Sqoop.

Awesome Lists containing this project

README

        

# Импорт данных из Yandex Managed Service for PostgreSQL в Yandex Data Processing с помощью Sqoop

Утилита [Sqoop](https://yandex.cloud/ru/docs/data-proc/operations/sqoop-usage) позволяет импортировать данные из [Managed Service for PostgreSQL](https://yandex.cloud/ru/docs/managed-postgresql) в кластер [Yandex Data Processing](https://yandex.cloud/ru/docs/data-proc). В зависимости от конфигурации кластера Yandex Data Processing вы можете выполнить импорт в одно из следующих хранилищ:

* бакет [Yandex Object Storage](https://yandex.cloud/ru/docs/storage);
* директорию HDFS;
* Apache Hive;
* Apache HBase.

Подготовка инфраструктуры для виртуальной машины, Object Storage, Yandex Data Processing и Managed Service for PostgreSQL через Terraform описана в [практическом руководстве](https://yandex.cloud/ru/docs/tutorials/dataplatform/sqoop-mpg), необходимый для настройки конфигурационный файл [clusters-postgresql-data-proc-and-vm.tf](clusters-postgresql-data-proc-and-vm.tf) расположен в этом репозитории.