An open API service indexing awesome lists of open source software.

https://github.com/chucheng92/hadoopdedup

:watermelon:基于Hadoop和HBase的大规模海量数据去重
https://github.com/chucheng92/hadoopdedup

big-data cdc dedup fsp mapreduce

Last synced: about 1 year ago
JSON representation

:watermelon:基于Hadoop和HBase的大规模海量数据去重

Awesome Lists containing this project

README

          

## 基于Hadoop和HBase的大规模海量数据去重

## 目录

data - 数据集

docs - 文档

src - MapReduce

## 环境

Hadoop版本1.1.2

HBase 0.94.8