https://github.com/yandex-cloud-examples/yc-bigquery-to-object-storage
Экспорт данных из Google Big Query через Google Storage в Object Storage Yandex Cloud.
https://github.com/yandex-cloud-examples/yc-bigquery-to-object-storage
bigquery object-storage python3 yandex-cloud yandexcloud
Last synced: about 1 month ago
JSON representation
Экспорт данных из Google Big Query через Google Storage в Object Storage Yandex Cloud.
- Host: GitHub
- URL: https://github.com/yandex-cloud-examples/yc-bigquery-to-object-storage
- Owner: yandex-cloud-examples
- License: apache-2.0
- Created: 2024-03-08T08:44:28.000Z (over 2 years ago)
- Default Branch: main
- Last Pushed: 2024-03-08T10:02:33.000Z (over 2 years ago)
- Last Synced: 2024-12-29T15:47:04.935Z (over 1 year ago)
- Topics: bigquery, object-storage, python3, yandex-cloud, yandexcloud
- Language: Python
- Homepage:
- Size: 6.84 KB
- Stars: 2
- Watchers: 4
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Экспорт данных из Google Big Query в Yandex Cloud Object Storage
Данный скрипт производит экспорт выбранных таблиц из Google Big Query в Google Storage. После чего производит копирование экспортированных данных
в Object Storage Яндекс Облака.
Необходимые пререквизиты:
1. По одному бакету на стороне Google Storage и Yandex Object Storage
2. Сервисный аккаунт на стороне Google Cloud, с доступами к проекту BigQuery (editor на проекте BQ) и бакету GS (uploader)
3. Сервисный аккаунт на стороне Yandex Cloud с доступом к бакету OBS (uploader)
4. Для сервисного акканута GCP подготовленный json файл с credentials
5. Для сервисного аккаунта YandexCloud - access key
Последовательность шагов:
1. Необходимо скачать утилиты CLI google-cloud-sdk: https://cloud.google.com/sdk/docs/install
2. Данный скрипт использует только утилиту gsutil, но для ее работы необходимо провести аутентификацию в gcloud CLI: https://cloud.google.com/sdk/docs/authorizing#authorizing_with_a_service_account
3. Необходимо установить Google BigQuery Python SDK: https://github.com/googleapis/python-bigquery
4. Для работы пакета bigquery необходимо передать путь к json-файлу в переменной окружения GOOGLE_APPLICATION_CREDENTIALS
5. Для работы утилиты gsutil необходимо заполнить своими параметрами файл .boto и передать путь к нему в переменной окружения BOTO_CONFIG
6. Обязательные аргументы для запуска скрипта: --bq_project, --gs_bucket, --bq_location=US, --yc_bucket
7. Не обязательный аргумент --gsutil_path указывается в случае, если gsutil не прописан в переменной PATH