532. 数组中的 k-diff 数对 :「哈希表」&「离散化 + 二分」&「离散化 + 双指针」

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第24天,点击查看活动详情

题目描述

这是 LeetCode 上的 532. 数组中的 k-diff 数对 ,难度为 中等

Tag : 「哈希表」、「离散化」、「二分」、「双指针」

给定一个整数数组和一个整数  k k ,你需要在数组里找到 不同的 k-diff 数对,并返回不同的 k-diff 数对 的数目。

这里将 k-diff 数对定义为一个整数对 ( n u m s [ i ] , n u m s [ j ] ) (nums[i], nums[j]) ,并满足下述全部条件:

  • 0 <= i < j < nums.length
  • |nums[i] - nums[j]| == k

注意,|val| 表示 val 的绝对值。

示例 1:

输入:nums = [3, 1, 4, 1, 5], k = 2

输出:2

解释:数组中有两个 2-diff 数对, (1, 3) 和 (3, 5)。
尽管数组中有两个1,但我们只应返回不同的数对的数量。
复制代码

示例 2:

输入:nums = [1, 2, 3, 4, 5], k = 1

输出:4

解释:数组中有四个 1-diff 数对, (1, 2), (2, 3), (3, 4) 和 (4, 5)。
复制代码

示例 3:

输入:nums = [1, 3, 1, 5, 4], k = 0

输出:1

解释:数组中只有一个 0-diff 数对,(1, 1)。
复制代码

提示:

  • 1 < = n u m s . l e n g t h < = 1 0 4 1 <= nums.length <= 10^4
  • 1 0 7 < = n u m s [ i ] < = 1 0 7 -10^7 <= nums[i] <= 10^7
  • 0 < = k < = 1 0 7 0 <= k <= 10^7

哈希表

一个简单的想法是先使用「哈希表」进行计数。

扫描二维码关注公众号,回复: 14281412 查看本文章

对于每个 x = n u m s [ i ] x = nums[i] 而言,根据 k k 是否为 0 0 进行分情况讨论:

  • k k 0 0 :此时只能 ( x , x ) (x, x) 组成数对,此时判断 n u m s [ i ] nums[i] 出现次数是否大于 1 1 次,若满足则进行计数加一;
  • k k 不为 0 0 :此时 x x 能够与 a = x k a = x - k b = x + k b = x + k 组成数对,分别查询 a a b b 是否出现过,若出现过则进行计数加一。

为了防止相同的 x x 进行重复计数,我们需要统计完 x x 后,清空其出现次数。

代码:

class Solution {
    public int findPairs(int[] nums, int k) {
        Map<Integer, Integer> map = new HashMap<>();
        for (int i : nums) map.put(i, map.getOrDefault(i, 0) + 1);
        int ans = 0;
        for (int i : nums) {
            if (map.get(i) == 0) continue;
            if (k == 0) {
                if (map.get(i) > 1) ans++;
            } else {
                int a = i - k, b = i + k;
                if (map.getOrDefault(a, 0) > 0) ans++;
                if (map.getOrDefault(b, 0) > 0) ans++;
            }
            map.put(i, 0);
        }
        return ans;
    }
}
复制代码
  • 时间复杂度: O ( n ) O(n)
  • 空间复杂度: O ( n ) O(n)

离散化 + 二分

我们知道可以使用「数组」充当「哈希表」来减少常数,但由于 n u m s [ i ] nums[i] 的值域大小为 2 × 1 0 7 2 \times 10^7 ,可能会有 MLE 风险。

我们需要对 n u m s nums 进行离散化,预处理出一个去重且有序的数组 list

在统计答案时,我们不再需要在 nums 基础上统计,而可以直接在去重数组 list 上进行统计,同时将对「数值」的统计操作转换为对「下标」的统计操作。

代码:

class Solution {
    static int[] cnt = new int[10010];
    List<Integer> list;
    int find(int x) {
        int n = list.size(), l = 0, r = n - 1;
        while (l < r) {
            int mid = l + r >> 1;
            if (list.get(mid) >= x) r = mid;
            else l = mid + 1;
        }
        return list.get(r) == x ? r : -1;
    }
    public int findPairs(int[] nums, int k) {
        Arrays.sort(nums);
        list = new ArrayList<>();
        for (int i : nums) {
            if (list.isEmpty() || i != list.get(list.size() - 1)) list.add(i);
        }
        Arrays.fill(cnt, 0);
        for (int i : nums) cnt[find(i)]++;
        int ans = 0, idx = 0;
        for (int i : list) {
            if (k == 0) {
                if (cnt[idx] > 1) ans++;
            } else {
                int a = find(i - k), b = find(i + k);
                if (a != -1 && cnt[a] > 0) ans++;
                if (b != -1 && cnt[b] > 0) ans++;
            }
            cnt[idx++] = 0;
        }
        return ans;
    }
}
复制代码
  • 时间复杂度:排序离散化复杂度为 O ( n log n ) O(n\log{n}) ,统计答案复杂度为 O ( n log n ) O(n\log{n}) 。整体复杂度为 O ( n log n ) O(n\log{n})
  • 空间复杂度: O ( n ) O(n)

离散化 + 双指针

跟进一步的,对于 x = n u m s [ i ] x = nums[i] 而言,我们每次都在整段的 list 中二分找 a = n u m s [ i ] k a = nums[i] - k b = n u m s [ i ] + k b = nums[i] + k 的下标,导致我们统计 n u m s [ i ] nums[i] 对答案的贡献时复杂度为 O ( log n ) O(\log{n}) ,统计所有 n u m s [ i ] nums[i] 对答案的贡献为 O ( n log n ) O(n\log{n})

实际上,利用 list 本身的有序性,我们在从前往后处理每个 n u m s [ i d x ] nums[idx] 时,对应的 a a b b 也必然是逐步增大,因此我们可以使用「双指针」来避免「二分」操作,使得统计所有 n u m s [ i ] nums[i] 对答案贡献的复杂度从 O ( n log n ) O(n\log{n}) 下降到 O ( n ) O(n)

代码:

class Solution {
    static int[] cnt = new int[10010];
    public int findPairs(int[] nums, int k) {
        Arrays.sort(nums);
        List<Integer> list = new ArrayList<>();
        for (int i : nums) {
            if (list.isEmpty() || i != list.get(list.size() - 1)) list.add(i);
        }
        Arrays.fill(cnt, 0);
        for (int i = 0, j = 0; i < nums.length; i++) {
            if (nums[i] != list.get(j)) j++;
            cnt[j]++;
        }
        int n = list.size(), idx = 0, ans = 0, l = 0, r = 0;
        for (int i : list) {
            if (k == 0) {
                if (cnt[idx] > 1) ans++;
            } else {
                int a = i - k, b = i + k;
                while (l < n && list.get(l) < a) l++;
                while (r < n && list.get(r) < b) r++;
                if (l < n && list.get(l) == a && cnt[l] > 0) ans++;
                if (r < n && list.get(r) == b && cnt[r] > 0) ans++;
            }
            cnt[idx++] = 0;
        }
        return ans;
    }
}
复制代码
  • 时间复杂度:排序离散化复杂度为 O ( n log n ) O(n\log{n}) ,统计答案复杂度为 O ( n ) O(n) ,整体复杂度为 O ( n log n ) O(n\log{n})
  • 空间复杂度: O ( n ) O(n)

最后

这是我们「刷穿 LeetCode」系列文章的第 No.532 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。

在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:github.com/SharingSour…

在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

猜你喜欢

转载自juejin.im/post/7109711072055001102