An open API service indexing awesome lists of open source software.

https://github.com/zinal/yc-dataproc-snippets

YC Data Proc samples and snippets
https://github.com/zinal/yc-dataproc-snippets

hadoop spark yandex-cloud

Last synced: 3 months ago
JSON representation

YC Data Proc samples and snippets

Awesome Lists containing this project

README

          

# Материалы по Yandex Data Proc

В этом репозитории собраны документы и различные примеры для работы с сервисом [Yandex Data Proc](https://cloud.yandex.ru/services/data-proc).

Структура основных материалов:
* [Инструкция по диагностике работы заданий Spark](dataproc-spark-diag/)
* [Инструкция по настройке внешней базы данных Apache Hive Metastore](dataproc-hive/)
* [Настройка S3A Committers для оптимизации записи в Yandex Object Storage](dataproc-s3a-committers/)
* [Копирование дополнительных файлов на узлы Data Proc](dataproc-copy-files/)
* [Настройка кластера Data Proc для работы с Apache Kafka](dataproc-kafka/)
* [Использование автоскейлинга в заданиях Spark](dataproc-scaling/)
* [Управление дополнительными компонентами Python](dataproc-python-repo/)
* [Автоматизация настройки хранения ноутбуков Zeppelin в Object Storage](dataproc-zeppelin/)
* [Использование Delta Lake](https://github.com/yandex-cloud/yc-delta)

Примеры вспомогательных скриптов и программ:
* [Раскраска вычислительных ресурсов Data Proc](dp-compute-colorizer/)