LeetCode—438.找到字符串中所有字母异位词(Find All Anagrams in a String)——分析及代码(Java)

LeetCode—438.找到字符串中所有字母异位词[Find All Anagrams in a String]——分析及代码[Java]

一、题目

给定一个字符串 s 和一个非空字符串 p,找到 s 中所有是 p 的字母异位词的子串,返回这些子串的起始索引。

字符串只包含小写英文字母,并且字符串 s 和 p 的长度都不超过 20100。

说明:

  • 字母异位词指字母相同,但排列不同的字符串。
  • 不考虑答案输出的顺序。

示例 1:

输入:
s: "cbaebabacd" p: "abc"

输出:
[0, 6]

解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的字母异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的字母异位词。

示例 2:

输入:
s: "abab" p: "ab"

输出:
[0, 1, 2]

解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的字母异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的字母异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的字母异位词。

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/find-all-anagrams-in-a-string
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

二、分析及代码

1. 滑动窗口

(1)思路

设计一个与字符串 p 等长的滑动窗口,在字符串 s 中从左往右依次移动,判断在各个位置窗口中的字母是否与字符串 p 相同。
为提高判断效率,可用一个数字和数组记录当前窗口中各个字母相同的个数,并结合队列记录窗口中字母类型,快速维护窗口。
遇到字符串 p 中不存在的字母时,可快速将窗口的左索引移动到该位置之后。

(2)代码

class Solution {
    
    
    public List<Integer> findAnagrams(String s, String p) {
    
    
        List<Integer> ans = new ArrayList<>();
        if (s.length() == 0 || p.length() == 0)
            return ans;
        
        char[] cs = s.toCharArray();
        char[] cp = p.toCharArray();
        int wLen = p.length();//窗口长度
        int len = 0, index = 0;//窗口中字符个数,窗口首字符位置
        boolean[] hasChar = new boolean[26];//记录p中是否存在该字母
        int[] numChar = new int[26];//记录当前窗口中还需出现各字母个数
        for (int i = 0; i < 26; i++) {
    
    //初始化
            hasChar[i] = false;
            numChar[i] = 0;
        }
        for (int i = 0; i < wLen; i++) {
    
    //记录p中数据
            hasChar[cp[i] - 'a'] = true;
            numChar[cp[i] - 'a']++;
        }
        
        Queue<Character> win = new LinkedList<Character>();
        for (int i = 0; i < s.length(); i++) {
    
    
            if (hasChar[cs[i] - 'a'] == false) {
    
    //出现p中不存在的字母,直接将窗口起点跳到下一字符处
                while (len > 0) {
    
    
                    numChar[win.poll() - 'a']++;
                    len--;
                }
                index = i + 1;
                continue;
            }
            if (numChar[cs[i] - 'a'] > 0) {
    
    //出现p中存在且当前窗口中个数不足的字母
                win.offer(cs[i]);
                numChar[cs[i] - 'a']--;
                len++;
                if (numChar[cs[i] - 'a'] == 0 && len == wLen) {
    
    //此时窗口范围为p的字母异位词的子串
                    ans.add(index);
                    numChar[win.poll() - 'a']++;
                    len--;
                    index++;
                }
                continue;
            }
            while (len > 0 && win.peek() != cs[i]) {
    
    //出现p中存在但当前窗口中个数已达到需求的字母
                numChar[win.poll() - 'a']++;
                len--;
                index++;
            }
            win.poll();
            index++;
            win.offer(cs[i]);           
        }
        
        return ans;
    }
}

(3)结果

执行用时 :10 ms, 在所有 Java 提交中击败了 69.58% 的用户;
内存消耗 :40.2 MB, 在所有 Java 提交中击败了 30.75% 的用户。

2. 滑动窗口优化

(1)思路

上述方法中,队列里的元素按照在数组中的位置有序排列,且可直接通过下标访问,这种情况下,可不创建 Queue 实体,直接通过起点和长度在数组中标记窗口范围,减小队列的维护开销。

(2)代码

class Solution {
    
    
    public List<Integer> findAnagrams(String s, String p) {
    
    
        List<Integer> ans = new ArrayList<>();
        if (s.length() == 0 || p.length() == 0)
            return ans;
        
        char[] cs = s.toCharArray();
        char[] cp = p.toCharArray();
        int wLen = p.length();//窗口长度
        int len = 0, index = 0;//窗口中字符个数,窗口首字符位置
        boolean[] hasChar = new boolean[26];//记录p中是否存在该字母
        int[] numChar = new int[26];//记录当前窗口中还需出现各字母个数
        for (int i = 0; i < 26; i++) {
    
    //初始化
            hasChar[i] = false;
            numChar[i] = 0;
        }
        for (int i = 0; i < wLen; i++) {
    
    //记录p中数据
            hasChar[cp[i] - 'a'] = true;
            numChar[cp[i] - 'a']++;
        }
        
        for (int i = 0; i < s.length(); i++) {
    
    
            if (hasChar[cs[i] - 'a'] == false) {
    
    //出现p中不存在的字母,直接将窗口起点跳到下一字符处
                while (len > 0)
                    numChar[cs[index + --len] - 'a']++;
                index = i + 1;
                continue;
            }
            if (numChar[cs[i] - 'a'] > 0) {
    
    //出现p中存在且当前窗口中个数不足的字母
                numChar[cs[i] - 'a']--;
                len++;
                if (numChar[cs[i] - 'a'] == 0 && len == wLen) {
    
    //此时窗口范围为p的字母异位词的子串
                    ans.add(index);
                    numChar[cs[index++] - 'a']++;
                    len--;
                }
                continue;
            }
            while (len > 0 && cs[index] != cs[i]) {
    
    //出现p中存在但当前窗口中个数已达到需求的字母
                numChar[cs[index++] - 'a']++;
                len--;
            }
            index++;
        }
        
        return ans;
    }
}

(3)结果

执行用时 :5 ms, 在所有 Java 提交中击败了 93.68% 的用户;
内存消耗 :39.7 MB, 在所有 Java 提交中击败了 84.86% 的用户。

三、其他

暂无。

猜你喜欢

转载自blog.csdn.net/zml66666/article/details/112640906