并查集原理及Python实现,朋友圈个数问题

背景问题:给定一些好友的关系,求这些好友关系中,存在多少个朋友圈?

例如给定好友关系为:[0,1], [0, 4], [1, 2], [1, 3], [5, 6], [6, 7], [7, 5], [8, 9]。在这些朋友关系中,存在3个朋友圈,分别是

【0,1,2,3,4】,【5,6,7】,【8,9】

如下图所示:

这个问题,抽象一下,就是:求一个图的连通子图的个数,即连通度是多少。

第一种方法,采用DFS遍历这个图,遍历过程中,可以求出连通度,但是DFS对于大型图,效率缓慢。

第二种方法,采用并查集。并查集可以说是一种算法,或者数据结构。

并查集的主要思想是,对每一个连通的子图,选出一个节点,作为代表。“代表”的个数,就是连通度的大小。

步骤如下:

1. 初始化每个节点的代表为其本身(后面,把代表叫做“父节点”)。

2.针对给定的好友关系[0,1], [0, 4], [1, 2], [1, 3], [5, 6], [6, 7], [7, 5], [8, 9],更新父节点。例如给出(1,2)那么,更新2的父节点为1。

3.重新更新所有节点的父节点,针对每个节点,找到其祖宗节点,即根节点。

对应的步骤如下:上面的是节点本身,下面的是节点对应的父节点或根节点。

这样,就将节点分成了3类,每个类用一个节点作为代表。

Python代码如下:

def union_find(nodes, edges):
    father = [0]*len(nodes)     # 记录父节点
    for node in nodes:  # 初始化为本身
        father[node] = node

    for edge in edges:  # 标记父节点
        head = edge[0]
        tail = edge[1]
        father[tail] = head

    for node in nodes:
        while True:         # 循环,直到找到根节点
            father_of_node = father[node]
            if father_of_node != father[father_of_node]:
                father[node] = father[father_of_node]
            else:           # 如果该节点的父节点与其爷爷节点相同,
                break       # 则说明找到了根节点

    L = {}
    for i, f in enumerate(father):
        L[f] = []
    for i, f in enumerate(father):
        L[f].append(i)

    return L


if __name__ == '__main__':
    nodes = list(range(0, 10))
    test_edges = [[0, 1], [0, 4], [1, 2], [1, 3], [5, 6], [6, 7], [7, 5], [8, 9]]

    L = union_find(nodes, test_edges)
    print(L)
    print('num of pyq:', len(L))

运行结果如下:

参考

1.【图解算法】并查集 —— 联合查找算法

2.并查集解决朋友圈问题

猜你喜欢

转载自blog.csdn.net/ten_sory/article/details/81135422