给定一个包含 n + 1 个整数的数组 nums,其数字都在 1 到 n 之间(包括 1 和 n),可知至少存在一个重复的整数。假设只有一个重复的整数,找出这个重复的数。
示例 1:
输入: [1,3,4,2,2]
输出: 2
示例 2:
输入: [3,1,3,4,2]
输出: 3
说明:
- 不能更改原数组(假设数组是只读的)。
- 只能使用额外的 O(1) 的空间。
- 时间复杂度小于 O(n2) 。
- 数组中只有一个重复的数字,但它可能不止重复出现一次。
解题思路
我们首先想到的解法就是现将数组nums
排序,建立pre
和cur
两个指针,分别指向前面一个元素和当前元素,然后对于排序好的nums
从头到尾的遍历,判断nums[pre]==nums[cur]
,如果成立,返回nums[pre]
即可,否则的话继续遍历。
class Solution:
def findDuplicate(self, nums):
"""
:type nums: List[int]
:rtype: int
"""
nums.sort()
for i in range(len(nums)-1):
if nums[i] == nums[i+1]:
return nums[i]
但是我们这种做法改变了原有的数组,所以这种做法就被我们排除了。由于是查找问题,我们不难想到通过二分搜索法,但是这里我们要将原来的二分搜索法做一些调整。我们首先计算mid
,然后我们统计数组中小于等于mid
元素的个数k
,如果k<=mid
的话,那么说明重复值在[mid+1,n]
之间,否则的话重复值在[1,mid]
之间。为什么这样子做是合理的呢?实际上这个问题的思想来源于抽屉原理,我们将包含重复元素的所有数放到一个可以容纳所有数的数组中去,如下
1 2 3 4
__________
1 2 3 4
2
如果采用下整除策略,此时我们的mid=2
,我们发现此时左边元素个数大于右边元素个数,这就是由于重复元素造成的两边不平衡,如果没有重复元素,两边数的个数应该是一样的。我们现在再回到我们的算法,看它是怎么和抽屉原理联系起来的。
1 3 4 2 2
mid=2
我们此时的mid=2
(也就是中间抽屉的位置),我们接着统计小于等于2
的数的个数(统计抽屉左边元素个数),也就是k=3
,而3>2
,所以我们在[1,2]
这个区间中找重复元素(抽屉左边找重复元素),再次计算mid=1
,我们发现k=1<=1
,此时我们就知道了2
即为重复元素。
class Solution:
def findDuplicate(self, nums):
"""
:type nums: List[int]
:rtype: int
"""
low, high = 1, len(nums)-1
while low < high:
mid = (high+low)//2
count = sum(num <= mid for num in nums)
if count <= mid:
low = mid+1
else:
high = mid
return low
这个问题有一个非常巧妙的解法,我们看上面的例子
1 3 4 2 2
如果我们使用t=nums[t]
这样的前进方式,我们首先令t=0
t=nums[0]=1
t=nums[1]=3
t=nums[3]=2
t=nums[2]=4
t=nums[4]=2
t=nums[2]=4
...
我们发现进入了循环。我们再使用t=nums[nums[t]]
这样的前进策略
t=nums[nums[0]]=3
t=nums[nums[3]]=4
t=nums[nums[4]]=4
....
其实就是比前面快了一倍。这就变成了之前Leetcode 142:环形链表 II(最详细的解法!!!)的问题,我们可以使用快慢指针解决。
class Solution:
def findDuplicate(self, nums):
"""
:type nums: List[int]
:rtype: int
"""
if len(nums) > 1:
slow = nums[0]
fast = nums[nums[0]]
while slow != fast:
slow = nums[slow]
fast = nums[nums[fast]]
entry = 0
while entry != slow:
entry = nums[entry]
slow = nums[slow]
return entry
return -1
讲道理,这种洞察力真的太厉害了。
reference:
http://keithschwarz.com/interesting/code/?dir=find-duplicate
我将该问题的其他语言版本添加到了我的GitHub Leetcode
如有问题,希望大家指出!!!