并查集

概念:
并查集是一种用于分离集合操作的抽象数据类型。它所处理的是集合之间的关系,即动态地维护和处理元素之间的复杂关系。
当给出两个元素的一个无序对(a,b)时,需要快速“合并”a和b分别所在的集合,这其间需要反复“查找”某元素所在的集合。“并”、“查”和“集”三字由此而来。
在这种数据类型中,n个不同的元素被分为若干组。每组是一个集合,这种集合叫做分离集合。
并查集支持查找一个元素所属的集合以及两个元素各自所属的集合的合并。

并查集的实现:
并查集本身不具有结构,必须借助一定的数据结构以得到支持和实现。
并查集的数据结构实现方法很多,数组实现、链表实现和树实现。一般用的比较多的是数组实现。

并查集的成员代表:
并查集的数据结构记录了一组分离的动态集合S={S1,S2,…,Sk}。每个集合通过一个代表加以识别,代表即该元素中的某个元素,哪一个成员被选做代表是无所谓的,重要的是:如果求某一动态集合的代表两次,且在两次请求间不修改集合,则两次得到的答案应该是相同的。(修改集合前数据代表不变)

并查集的操作:
建立新的集合,合并集合,查找含有特殊对象的集合(并返回其集合代表):
动态集合中的每一元素是由一个对象来表示的,设x表示一个对象:
MAKE(x):建立一个新的集合,其仅有的成员(同时就是代表)是x。由于各集合是分离的,要求x没有在其它集合中出现过。
UNIONN(x,y):将包含x和y的动态集合(例如Sx和Sy)合并为一个新的集合,假定在此操作前这两个集合是分离的。结果的集合代表是Sx∪Sy的某个成员。一般来说,在不同的实现中通常都以Sx或者Sy的代表作为新集合的代表。此后,由新的集合S代替了原来的Sx和Sy。
FIND(x):返回一个指向包含x的集合的代表。

并查集实现具体步骤:
例:
元素的合并图示:

再对输入的数据进行判断:是否在同一集合:

    #include<iostream>
  #include<cstdio>
  using namespace std;
  #define maxn 20001
  int father[maxn];
  int m,n,i,x,y,q;
  /*
  int find(int x)                  //用非递归的实现
  {
      while (father[x] != x) x = father[x];
      return x;
  }
  */
  int find(int x)                   //用递归的实现
  {
      if (father[x] != x) return find(father[x]);
      else return x;
  }  
  void unionn(int r1,int r2)
  {
      father[r2] = r1;
  }
 int main()
  {
      cin >> n >> m;
      for (i = 1; i <= n; i++)
          father[i] = i;           //建立新的集合,其仅有的成员是i
      for (i = 1; i <= m; i++)
      {
          scanf("%d%d",&x,&y);
          int r1 = find(x);
          int r2 = find(y);
          if (r1 != r2) unionn(r1,r2);
      }    
      cin >> q;
      for (i = 1; i <= q; i++)
      {
          scanf("%d%d",&x,&y);
          if (find(x) == find(y)) printf("Yes\n");
              else printf("No\n");
      }
      return 0;
  }

当然我们通过图例就可以看出问题,当一条链特别长时,我们使用数据的这种合并与查找一定会超时。
因此我们考虑优化该步骤:
路径压缩:
路径压缩实际上是在找完根结点之后,在递归回来的时候顺便把路径上元素的父亲指针都指向根结点。
这就是说,我们在“合并5和3”的时候,不是简单地将5的父亲指向3,而是直接指向根节点1。
如图:

由此我们得到了一个复杂度几乎为常数的算法。

(1)初始化:
 for (i = 1; i <= n; i++) father[i] = i;
 因为每个元素属于单独的一个集合,所以每个元素以自己作为根结点。
 
(2)寻找根结点编号并压缩路径:
  int find (int x)
  {
      if (father[x] != x) father[x] = find (father[x]);
      return father[x];
  }

(3)合并两个集合: 
void unionn(int x,int y)
{
  x = find(x);y = find(y);
  father[y] = x;
}

(4)判断元素是否属于同一集合:
bool  judge(int x,int y)
{
    x = find(x);
    y = find(y);
    if  (x == y)  return true;
          else return false;
}

这里已经完全阐述了并查集的基本操作和作用。
优化的具体程序如下:

   #include<iostream>
  #include<cstdio>
  using namespace std;
  #define maxn 20001
  int father[maxn];
  int m,n,i,x,y,q;
  /*
  int find(int x)                  //用非递归的实现
  {
      while (father[x] != x) x= father[x];
      return x;
  }
  */
  int find(int x)                  //用递归的实现
  {
      if (father[x] != x) father[x] = find(father[x]);  //路径压缩
      return father[x];
  }
  void unionn(int r1,int r2)
  {
      father[r2] = r1;
  }
    int main()
  	 {
      freopen("relation.in","r",stdin);
      freopen("relation.out","w",stdout);
      cin >> n >> m;
      for (i = 1; i <= n; i++)
          father[i] = i;           //建立新的集合,其仅有的成员是i
      for (i = 1; i <= m; i++)
      {
          scanf("%d%d",&x,&y);
          int r1 = find(x);
          int r2 = find(y);
          if (r1 != r2) unionn(r1,r2);
      }    
      cin >> q;
      for (i = 1; i <= q; i++)
      {
          scanf("%d%d",&x,&y);;
                if (find(x) == find(y)) printf("Yes\n");
                         else printf("No\n");
      }
      return 0;
  }