Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/orvillex/bigdata
主要汇集了较新版的各类大数据组件的使用教程,包含但不限定MapReduce、HBase、Spark等相关主流技术。后续还将持续更进Flink等当前流行的实时计算框架。
https://github.com/orvillex/bigdata
bigdata hbase java mapreduce spark
Last synced: 19 days ago
JSON representation
主要汇集了较新版的各类大数据组件的使用教程,包含但不限定MapReduce、HBase、Spark等相关主流技术。后续还将持续更进Flink等当前流行的实时计算框架。
- Host: GitHub
- URL: https://github.com/orvillex/bigdata
- Owner: OrvilleX
- Created: 2021-08-26T01:03:16.000Z (over 3 years ago)
- Default Branch: master
- Last Pushed: 2023-10-06T15:09:17.000Z (over 1 year ago)
- Last Synced: 2024-11-25T16:14:33.032Z (3 months ago)
- Topics: bigdata, hbase, java, mapreduce, spark
- Language: Java
- Homepage:
- Size: 114 KB
- Stars: 3
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: ReadMe.md
Awesome Lists containing this project
README
# 大数据技术学习
本教程将根据当下的主流技术与版本进行相关教程的编写,考虑到当前往上主要以老旧版本的教程居多,对于较新版的教程明显比较
匮乏。考虑到新版诸多API存在破坏性更新,致使新人在使用新版本的SDK上进行开发学习时往往会被劝退。为此本系列将围绕新版进
行编写并辅以实际项目代码以及博客内容。相关技术版本选型如下:
* Hadoop:3.1.1
* HBase:2.4.0
* Spark:2.4.0
* JDK:1.8围绕本源码项目的对应的教程文档可以通过[我的知乎专栏](https://www.zhihu.com/column/c_1693727391665512448)
---
## 基础教程
对于HDFS相信大家都耳熟能详了,为了快速的巩固对于其中`mapreduce`的理解,用户可以结合[本教程](/docs/MapReduceBasic.md)
进行学习,其中相关源码均在`mapreducedemo`文件夹下。## HBase教程
本教程需要集合实际的项目目录进行学习,本项目的主要目录组成如下(hbasedemo)。
* normaldemo:包含各类常用操作以及Phoenix使用方式
* mapreducedemo:包含MapReduce操作HBase的支持
* obsererdemo:包含协处理器相关使用方式## Spark教程
本教程当前主要以Java为基础进行Demo编写,主要由以下几个文件组成,有关Spark的其他更
详细的可查阅[本教程](/sparkdemo/ReadMe.md)。* AggregateSpark:包含聚合操作
* JavaSparkPi:基础入门
* JoinSpark:连接操作相关
* RDDWithSpark:RDD操作相关
* SparkWithHBase:与HBase操作相关