https://github.com/jzx555/disjoint_sets

数据结构：并查集 Union-Find算法(不相交集)原理及C++实现
https://github.com/jzx555/disjoint_sets

Last synced: 7 months ago
JSON representation

数据结构：并查集 Union-Find算法(不相交集)原理及C++实现

Host: GitHub
URL: https://github.com/jzx555/disjoint_sets
Owner: JZX555
License: mit
Created: 2018-03-18T10:24:32.000Z (over 7 years ago)
Default Branch: master
Last Pushed: 2018-03-18T10:33:46.000Z (over 7 years ago)
Last Synced: 2025-01-11T18:52:09.758Z (9 months ago)
Language: C++
Size: 6.84 KB
Stars: 2
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: ReadMe.md
- License: LICENSE

Awesome Lists containing this project

README

# 前言：
这一次为大家介绍的另外一种比较基础的算法——并查集Union-Find算法。这是一种用于不相交集(Disjoint Sets)的查询以及合并问题的算法。主要用树的形式来进行链接，这里我们将使用的是数组来表现。
*PS：不相交集是并查集的另一个说法~~*

PPS：可能会出现没有图的情况，请移步[JZX的CSDN](http://blog.csdn.net/weixin_41427400/article/details/79601350)~~

# 原理：
首先我们要认识到并查集算法是用来处理不相交集问题的一个工具，它为等价关系的确定提供了很大的便利。并查集中的Union可以将集合进行链接，使它们成为等价类；而Find可以查找集合的类别，从而直观的了解其等价关系。而我们对等价关系有严格的定义，先看看什么是等价关系吧。

## 等价关系：
等价关系 R 要求处于同一个等价类S中的任意元素a，b满足三点要求：
1.**自反性**，对于所有的`a属于S`，有`aRa`；
2.__对称性__，若`aRb`则有`bRa`；
3.**传递性**，若`aRb`，`bRc`，则有`aRc`；

这样似乎很模糊，对于没有学过离散数学的朋友来说等价的概念仍然不清楚，那我就举两个例子，第一个就是`“=”`关系；这是一个最经典的等价关系它满足：自反性—— 1 = 1成立；对称性——若 `a = b`，则`b = a`；传递性——若`a = b`，`b = c`，那么`a = c`；不知道这样理解了吗？
如果还没有的话那就在举一个例子吧，有三个人分别是小A，小B和小C，现在有一个关系为“某人和某人是一个学院的”；现在我们就来判断这个关系是不是一个等价关系；首先我们来**判断自反性**——小A和小A是一个学院的吗？答案显而易见，那么自反性满足！接下来是__对称性判断__——如果我们知道了小A和小B是一个学院的，那么小B和小A是一个学院的吗？肯定是的啊；最后就是**传递性判断**了——若小A和小B一个学院，小B和小C一个学院那么我们也可以知道小A和小C一个学院！那么“某人和某人是一个学院的”就是一个等价关系！
所以判断一个关系是不是等价关系就需要对这三个性质进行判断，**若有一个不满足，则不是等价关系**！比如“<=”关系，因为他不满足对称性，即a<=b不能得出b<=a！

## 等价类：
等价类即为一个集合，在这个集合中的**所有元素之间都满足等价关系**，比如对于之前的“某人和某人是一个学院的”关系来将，计算机学院的所有学生就是一个等价类，物理学院的所有学生也是一个等价类，而学校的所有学生对于这个关系就不是等价类了！

## Union：
`Union`功能是用于创建等价关系的，即若对于两个不相干的元素或集合A，B，若执行`Union(A, B)`则会在AB间创建等价关系，而在实际的代码编写中，我们**使用树的思想但用数组来实现`Union`功能**！但接下来我们还是具体看看`Union`操作吧：
假设我们开始是有毫不相干的六个元素1，2 ，......，5，6，他们之间没有任何关系，也就是说他们都是独立的！
![](//img-blog.csdn.net/20180318164438727?watermark/2/text/Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTQyNzQwMA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70)
接下来我们如果发现3和4之间满足等价关系，那么进行一次Union(3, 4)的操作，就会得到下图中的样子；
![](//img-blog.csdn.net/20180318164701171?watermark/2/text/Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTQyNzQwMA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70)
接下来我们又发现了许多等价关系，依次执行了Union(1, 2)，Union(5, 6)，Union(3, 5)
![](//img-blog.csdn.net/20180318165137102?watermark/2/text/Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTQyNzQwMA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70)
执行了这些操作后，集合变成了这个样子，可以发现1，2在一个等价类中，其他元素在另外一个等价类中；这里就要注意啦，因为我们**如果把这个图看做一个树，那么1，3就是树根，而2是1的一个儿子，4，5是3的儿子，6是5的儿子，这不正是树吗**。这就是我们使用树的思想！那么怎么用数组表示呢？我们约定数组S，__那么S[x]就是元素x的父节点，如果这个元素时树根，那么规定S[x]=0__，这样一来上面这棵树就可以表示为下图：
![](//img-blog.csdn.net/20180318170044851?watermark/2/text/Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTQyNzQwMA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70)

这样一来我们就使用了数组来实现！那么编写代码也就是很简单的事情了，首先是一个简单的Union实现：

void Disjoint_Set::SetUnion(SetType Root1, SetType Root2) {
DisjSet[Root2] = Root1;
}
这个函数很简单，就是**把元素Root1变为Root2的父节点(树的思想)，实际操作中就是令S[Root2]=Root1**；
如果没有什么效率的追求，那么Union这样写也没问题，但是我们显然不可能这样，因为上述的Union只是单纯的将Root2作为Root1的子节点处理，这很容易加深树的深度，大家都知道，树的深度越深，那么执行操作的时间也就越长，在上图的树中再执行一次Union(1, 3)，得到的结果显然与我们的期望不同！
![](//img-blog.csdn.net/20180318171001413?watermark/2/text/Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTQyNzQwMA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70)

我们期望它可以将1作为3的子树而不是反过来，**我们总是希望深度更深(高度更高)的树可以作为树根，而不是儿子**，但是很多时候我们并不知道他们的具体情况，那么我们该怎么办呢，这里我们给出了更好的一种方法，那就是在树根处记录树的深度！那么数组就会变成下图所示：
![](//img-blog.csdn.net/20180318171850697?watermark/2/text/Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTQyNzQwMA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70)

可以发现我们只是在树根处做出了改进，让树根储存树高度的负值，这样我们就可以通过检索到树根，比较树的高度后再进行Union操作，以下是改进后的代码：

void Disjoint_Set::SetUnion(SetType Root1, SetType Root2) {
// 找到对应元素所在集合的根部
Root1 = Find(Root1);
Root2 = Find(Root2);

// case1:当Root2集合高度大于Root1时
if (DisjSet[Root2] < DisjSet[Root2])
DisjSet[Root1] = Root2; // 将Root1合并到Root2中

else {
// case2:当Root1集合高度等于Root2时
if (DisjSet[Root1] == DisjSet[Root2])
DisjSet[Root1]--; // 加深Root1高度

// case3:当Root1集合高度大于Root2时
// 将Root2合并到Root1上
DisjSet[Root2] = Root1;
}
}
注意：*在树合并以后，如果合并的两棵树深度相同，主树的深度会加深*；其中用到的Find是接下来介绍的功能，目的是返回元素所在的集合，可以看下文；

## Find:
Find功能是并查集的另外一个功能，目的是返回一个元素所在的集合；从Union的介绍中我们可以看出来，**一个等价类就是一棵树**，那么我们__返回集合也就可以变成返回一个树的树根__；这样就很简单了，接下来是Find的简单实现：

SetType Disjoint_Set::Find(int X) {
// 判断是否是根部
if (DisjSet[X] <= 0)
return X;

else
return Find(DisjSet[X]);
}
当然，这个Find也是有缺陷的，若Union合并的最坏情况总是发生(即高度相等的树合并)，那么Find的时间将比Union多很多，这样并查集的运行时间将会很高，我们采取**路径压缩**的方法来避免这样的事情发生。具体做法就是__遍历过的节点父节点变为其父节点的父节点__，这可能有点拗口，我们画个图来看看：
![](//img-blog.csdn.net/20180318173844904?watermark/2/text/Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTQyNzQwMA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70)

我们可以发现，在执行改进后的Find(6)后，树的高度减少了，这是因为6的根变为了5的根，而5的根变为了3的根1，这样他们都直接与1链接了！接下来是具体的代码：

SetType Disjoint_Set::Find(int X) {
// 判断是否是根部
if (DisjSet[X] <= 0)
return X;

else
return DisjSet[X] = Find(DisjSet[X]);
}
可以看见我们只做了一点小小的改进就得到了我们想要的效果，是不是很神奇！

## 应用：
关于并查集的一个具体应用可已在Kruskal算法中发现，而这可以在我的[另外一篇博客](http://blog.csdn.net/weixin_41427400/article/details/79436369)中找到哦~~

参考文献：《数据结构与算法分析——C语言描述》

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/jzx555/disjoint_sets

Awesome Lists containing this project

README