Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/offthetab/vkapi-ml-dataharvester

Pipeline to harvest data via VK API for ML analysis with hadoop and spark
https://github.com/offthetab/vkapi-ml-dataharvester

hadoop hdfs hive linux mariadb python requests spark sqoop

Last synced: 9 days ago
JSON representation

Pipeline to harvest data via VK API for ML analysis with hadoop and spark

Awesome Lists containing this project

README

        

# VKAPI-ML-DataHarvester

Проект автоматического сбора данных о постах в группе, пользователях группы и их постах. Конвейер обработки данных включает в себя Python-скрипт для сбора данных через VK API, HDFS, MariaDB, Sqoop и Spark.