找出不重复的数

题目描述: 有一组存放 ID 的数据。并且 ID 取值为 0 - (N-1) 之间,其中只有一个 ID 出现的次数为 1,其他的 ID 出现的次数都等于 2,问如何找到这个次数为 1 的 ID ?

      解法一:巧用数组下标
      我的第一想法便是采用下标法来解决,把 ID 作为数组 arr 的下标,在遍历 ID 的过程中,用数组记下每个 ID 出现的次数,即每次遍历到 ID = n,则 arr[n]++。
之后我们在遍历数组 arr,找到 arr[n] = 1 的ID,该下标 n 便是我们要寻找的目的 ID。
这种方法的时间复杂度为 O(N),空间复杂度为 O(N)。

      解法二:巧用哈希表
      显然时间复杂度是无法再降低的了,因为我们必须要遍历所有的 ID,所以时间复杂度最少都得为 O(N)了,所以我们要想办法降低空间复杂度。

大家想一个问题,假如我们检测到某个 ID 已经出现了 2 次了,那么这个 ID 的数据我们还需要存储记录吗?大部分的 ID 都出现了 2 次,这一大部分的数据真的需要存储吗?
答是不用的,因为出现 2 次的 ID 不是我们所要找的。所以我们可以优化解法一,我们可以采用哈希表来记录 ID 出现的次数:利用哈希表记下每个 ID 出现的次数,每次遇见一个 ID,就把这个 ID 放进 哈希表,如果这个 ID 出现了次数已经为 2 了,我们就把这个 ID 从哈希表中移除,最后哈希表只会剩下一个我们要寻找的 ID。
这个方法最好的情况下空间复杂度可以降低到 O(1),最坏的情况仍然了 O(N)。

      解法三:巧用位运算
      那究竟有没办法让空间复杂度在最坏的情况下也是 O(1) 呢?
      答是有的,按就是采用异或运算。异或运算有个特点:
      异或运算特点:相同的两个数异或之后,结果为 0,任何数与0异或运算,其结果不变并且,异或运算支持结合律。
      所以,我们可以把所有的 ID 进行异或运算,由于那些出现两次的 ID 通过异或运算之后,结果都为 0,而出现一次的 ID 与 0 异或之后不变,又因为异或支持结合律,所以,把所有 ID 进行异或之后,最后的结果便是我们要找的 ID。
      例如这组数据是:1, 2, 3, 4, 5, 1, 2, 3, 4。其中 5 只出现了一次,其他都出现了两次,把他们全部异或一下,结果如下:
      由于异或支持交换律和结合律,所以:
      123451234 = (11)(22)(33)(44)5= 00005 = 5。
      也就是说,那些出现了两次的数异或之后会变成0,那个出现一次的数,和 0 异或之后就等于它本身。就问这个解法牛不牛逼?所以代码如下

int find(int[] arr)
{ 
	int tmp = arr[0];
	for (int i = 1; i < arr.length; i++)
	{ 
		tmp = tmp ^ arr[i]; 
	} 
	return tmp; 
}

时间复杂度为 O(n),空间复杂度为 O(1),而且看起来很牛逼。

问题拓展

      假如有 2 个 ID 出现的次数为 1,其他 ID 出现的次数都为 2 呢?有该如何解决呢?是否还是可以用位运算呢?

      答是必须的,假如这两个出现一次的 ID 分别为 A, B,则所有 ID 异或后的结果为 A^B,这时我们遇到的问题是无法确定 A,B的值。

      由于 A 和 B 是不一样的值,所以 A^B 的结果不为 0,也就是说,这个异或值的二进制中某一位为1。显然,A 和 B 中有且仅有一个数的相同位上也为 1。

      这个时候,我们可以把所有 ID 分为两类,一类在这个位上为 1,另一类为 0,那么对于这两类,一类会含有 A,另一类会含有 B。于是,我们可以分别计算这两类 ID 的异或值,几可得到 A 和 B 的值。