首页手记并查集入门教程：从零开始理解并查集

并查集入门教程：从零开始理解并查集

标签：

算法与数据结构

概述

并查集是一种高效的数据结构，用于处理不相交集合的合并和查询操作。它广泛应用于图论、社交网络分析、电路设计等领域，能够通过路径压缩和按秩合并等优化手段提升效率。并查集的实现基于树形结构，通过递归或迭代方式实现查找与合并操作。

并查集简介

并查集（Disjoint Set Union，简称DSU）是一种数据结构，用于处理不相交集合的合并（Union）和查询（Find）操作。它能够高效地管理一组数据的分组情况，广泛应用于图论、社交网络分析、电路设计等领域。并查集的核心思想是利用树形结构来表示集合的合并情况，通过路径压缩和按秩合并等优化手段，提升查询与合并操作的效率。

并查集的应用场景

并查集在实际应用中有着广泛的场景，包括但不限于：

社交网络中的连通性检测：例如，Facebook可以利用并查集检测用户之间的连通性，判断两个用户是否属于同一个社交圈子。
电路设计中的连接性检测：在集成电路设计中，需要检测电路图中的不同模块是否已正确连接。
图的最小生成树问题：Kruskal算法中利用并查集来判断边是否形成环。
动态图的连通性问题：在动态图中添加或删除边时，使用并查集可以高效地判断图中不同顶点是否连通。

并查集的实现思路

并查集的实现思路基于树形结构，每个节点代表一个元素，节点的父节点则指向其所在集合的根节点。通过这样的结构，可以实现集合的合并和查找操作。

合并操作：将两个集合合并为一个集合。方法是找到两个集合的根节点，将其中一个集合的根节点设置为另一个集合的根节点。
查找操作：查找某个元素所在的集合。方法是从该元素开始，向上查找直到找到根节点。

这些操作可以通过递归或迭代的方式实现。为了优化查询和合并操作，通常会对并查集进行路径压缩和按秩合并的优化。

并查集的数据结构

并查集的数据结构主要包括数组和树结构两个部分，每个节点存储其父节点信息来表示树结构。在实现时，通常会用一个数组来存储每个节点的父节点信息。

并查集的数组实现

数组 parent 的每个元素 parent[i] 表示节点 i 的父节点。parent[i] 的值为负数时，表示 i 是一个根节点，且其绝对值表示以 i 为根节点的树的大小。

树形结构的基本理解

树形结构中的每个节点指向其父节点，根节点指向自己。通过这种结构，可以递归地查找根节点：

def find(parent, i):
    if parent[i] == i:
        return i
    return find(parent, parent[i])

根节点与祖先节点的概念

根节点：树的根节点是该集合的代表节点，如节点 i 的 parent[i] 等于 i。
祖先节点：任何节点在查找过程中，从该节点到根节点路径上的所有节点都是该节点的祖先节点。

示例代码展示如何通过递归实现查找操作：

def find(parent, i):
    if parent[i] == i:
        return i
    return find(parent, parent[i])

并查集的基本操作

并查集主要包括两种基本操作：查找操作和合并操作。此外，为了优化性能，还引入了路径压缩和按秩合并的优化技术。

查找操作详解

查找操作用于确定一个节点所处的集合的根节点。这个操作可以通过递归或迭代的方式实现。递归查找的基本思路是从当前节点开始，一直向上查找直到找到根节点。

def find(parent, i):
    if parent[i] == i:
        return i
    return find(parent, parent[i])

递归实现虽然简练，但可能会导致堆栈溢出。迭代实现如下：

def find(parent, i):
    while parent[i] != i:
        i = parent[i]
    return i

合并操作详解

合并操作用于将两个集合合并为一个集合。通常，合并操作会将一个集合的根节点连接到另一个集合的根节点。合并操作的基本思想是：

查找两个集合的根节点。
将一个集合的根节点设置为另一个集合根节点的子节点。

def union(parent, x, y):
    rootX = find(parent, x)
    rootY = find(parent, y)

    if rootX != rootY:
        parent[rootX] = rootY

路径压缩与按秩合并

为了提高并查集的操作效率，可以对查找操作使用路径压缩，对合并操作使用按秩合并。

路径压缩：在查找操作中，将每个节点的父节点直接指向根节点，这样在后续的查找中可以快速定位根节点。
```
def find(parent, i):
  if parent[i] != i:
      parent[i] = find(parent, parent[i])
  return parent[i]
```

按秩合并：按秩合并的核心思想是将较小的树合并到较大的树中。这样可以减少树的高度，提高查找效率。

def union(parent, rank, x, y):
  rootX = find(parent, x)
  rootY = find(parent, y)
  if rootX != rootY:
      if rank[rootX] < rank[rootY]:
          parent[rootX] = rootY
      elif rank[rootX] > rank[rootY]:
          parent[rootY] = rootX
      else:
          parent[rootY] = rootX
          rank[rootX] += 1

并查集的代码实现

并查集可以使用不同的编程语言实现，下面分别用Python、C++和Java实现并查集的基本操作。

Python语言实现并查集

Python实现并查集需要定义一个数组 parent 来存储每个节点的父节点，以及可能的数组 rank 来存储每个节点的秩。

class UnionFind:
    def __init__(self, n):
        self.parent = list(range(n))
        self.rank = [0] * n

    def find(self, i):
        if self.parent[i] != i:
            self.parent[i] = self.find(self.parent[i])
        return self.parent[i]

    def union(self, x, y):
        rootX = self.find(x)
        rootY = self.find(y)
        if rootX != rootY:
            if self.rank[rootX] < self.rank[rootY]:
                self.parent[rootX] = rootY
            elif self.rank[rootX] > self.rank[rootY]:
                self.parent[rootY] = rootX
            else:
                self.parent[rootY] = rootX
                self.rank[rootX] += 1

C++语言实现并查集

C++实现并查集需要定义一个数组 parent 来存储每个节点的父节点，以及可能的数组 rank 来存储每个节点的秩。

#include <vector>

class UnionFind {
public:
    std::vector<int> parent;
    std::vector<int> rank;

    UnionFind(int n) {
        parent.resize(n);
        rank.resize(n, 0);
        for (int i = 0; i < n; ++i) {
            parent[i] = i;
        }
    }

    int find(int i) {
        if (parent[i] != i) {
            parent[i] = find(parent[i]);
        }
        return parent[i];
    }

    void unionSet(int x, int y) {
        int rootX = find(x);
        int rootY = find(y);
        if (rootX != rootY) {
            if (rank[rootX] < rank[rootY]) {
                parent[rootX] = rootY;
            } else if (rank[rootX] > rank[rootY]) {
                parent[rootY] = rootX;
            } else {
                parent[rootY] = rootX;
                rank[rootX]++;
            }
        }
    }
};

Java语言实现并查集

Java实现并查集需要定义一个数组 parent 来存储每个节点的父节点，以及可能的数组 rank 来存储每个节点的秩。

public class UnionFind {
    private int[] parent;
    private int[] rank;

    public UnionFind(int n) {
        parent = new int[n];
        rank = new int[n];
        for (int i = 0; i < n; i++) {
            parent[i] = i;
            rank[i] = 0;
        }
    }

    public int find(int i) {
        if (parent[i] != i) {
            parent[i] = find(parent[i]);
        }
        return parent[i];
    }

    public void union(int x, int y) {
        int rootX = find(x);
        int rootY = find(y);
        if (rootX != rootY) {
            if (rank[rootX] < rank[rootY]) {
                parent[rootX] = rootY;
            } else if (rank[rootX] > rank[rootY]) {
                parent[rootY] = rootX;
            } else {
                parent[rootY] = rootX;
                rank[rootX]++;
            }
        }
    }
}

并查集的优化

并查集可以通过路径压缩和按秩合并来优化其性能。路径压缩是一种递归地将查找路径上的每个节点直接指向根节点的技术，从而降低树的高度。按秩合并是一种合并两个节点时选择较小树根节点为较大树根节点的方法。

路径压缩优化

路径压缩优化在每次查找操作时将查找路径上的所有节点直接指向根节点，这样在后续的查询中可以大大减少查找的深度。路径压缩可以通过递归或迭代的方式实现，递归实现如下：

def find(parent, i):
    if parent[i] != i:
        parent[i] = find(parent, parent[i])
    return parent[i]

按秩合并优化

按秩合并优化的核心思想是合并时将较小的树合并到较大的树上，以保持树的高度尽可能低。按秩合并通过存储每个节点的秩（树的高度）来实现：

def union(parent, rank, x, y):
    rootX = find(parent, x)
    rootY = find(parent, y)
    if rootX != rootY:
        if rank[rootX] < rank[rootY]:
            parent[rootX] = rootY
        elif rank[rootX] > rank[rootY]:
            parent[rootY] = rootX
        else:
            parent[rootY] = rootX
            rank[rootX] += 1

组合优化的效果分析

通过路径压缩和按秩合并的组合优化，可以使得并查集的操作在理论上接近常数时间复杂度。具体来说，在路径压缩和按秩合并的双重优化下，查找和合并操作的时间复杂度可以达到接近O(1)的程度。

并查集的实际应用示例

并查集在实际应用中有多种场景，例如社交网络中的连通性检测、图的最小生成树问题等。

社交网络中的连通性检测

在社交网络中，可以通过并查集来检测用户之间的连通性，判断两个用户是否属于同一个社交圈。例如，给定一个用户列表和用户之间的连接关系，可以使用并查集来判断两个用户是否连通。

def is_connected(net, user1, user2):
    uf = UnionFind(len(net))
    for user in net:
        uf.union(user, net[user])
    return uf.find(user1) == uf.find(user2)

# 示例
net = {0: 1, 1: 2, 3: 4}
print(is_connected(net, 0, 2))  # 输出: True
print(is_connected(net, 0, 4))  # 输出: False

图的最小生成树问题

图的最小生成树问题可以用Kruskal算法解决，该算法使用并查集来判断每条边是否形成环。Kruskal算法的基本思路是先对所有边按权重排序，然后依次加入边到生成树中，同时使用并查集检查每条边是否形成环：

def kruskal(graph):
    edges = []
    for node in graph:
        for neighbor, weight in graph[node].items():
            edges.append((weight, node, neighbor))
    edges.sort()

    uf = UnionFind(len(graph))
    mst = []
    for weight, node, neighbor in edges:
        root_node = uf.find(node)
        root_neighbor = uf.find(neighbor)
        if root_node != root_neighbor:
            mst.append((node, neighbor, weight))
            uf.union(node, neighbor)
    return mst

# 示例
graph = {0: {1: 10, 2: 6}, 1: {0: 10, 2: 3, 3: 5}, 2: {0: 6, 1: 3, 3: 1}, 3: {1: 5, 2: 1}}
print(kruskal(graph))
# 输出: [(2, 3, 1), (1, 2, 3), (0, 2, 6)]

电路设计中的连接性检测

在集成电路设计中，可以通过并查集来检测电路图中的不同模块是否已正确连接。例如，给定一个电路图，可以使用并查集来检测模块之间的连接是否正确。

def is_connected_circuit(circuit, module1, module2):
    uf = UnionFind(len(circuit))
    for module in circuit:
        uf.union(module, circuit[module])
    return uf.find(module1) == uf.find(module2)

# 示例
circuit = {0: 1, 1: 2, 3: 4}
print(is_connected_circuit(circuit, 0, 2))  # 输出: True
print(is_connected_circuit(circuit, 0, 4))  # 输出: False

动态图的连通性问题

在动态图中添加或删除边时，可以使用并查集来高效地判断图中不同顶点是否连通。例如，给定一个动态图，可以使用并查集来检测添加或删除边后的连通性。

def is_connected_dynamic_graph(graph, edge):
    uf = UnionFind(len(graph))
    for node in graph:
        for neighbor in graph[node]:
            uf.union(node, neighbor)
    uf.union(edge[0], edge[1])
    return uf.find(edge[0]) == uf.find(edge[1])

# 示例
graph = {0: [1], 1: [2], 3: [4]}
edge = (0, 2)
print(is_connected_dynamic_graph(graph, edge))  # 输出: True
edge = (0, 4)
print(is_connected_dynamic_graph(graph, edge))  # 输出: False

这些应用展示了并查集在处理大规模数据集和复杂数据结构中的强大能力。

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

largeQ

手记
篇

粉丝

93

获赞与收藏

586

关注作者，订阅最新文章

阅读免费教程

后端通用面试教程

41个小节 32879 371

网络编程入门教程

20个小节 13640 256

Pandas 入门教程

25个小节 20282 387

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空