LeetCode—438.找到字符串中所有字母异位词[Find All Anagrams in a String]——分析及代码[Java]
一、题目
给定一个字符串 s 和一个非空字符串 p,找到 s 中所有是 p 的字母异位词的子串,返回这些子串的起始索引。
字符串只包含小写英文字母,并且字符串 s 和 p 的长度都不超过 20100。
说明:
- 字母异位词指字母相同,但排列不同的字符串。
- 不考虑答案输出的顺序。
示例 1:
输入:
s: "cbaebabacd" p: "abc"
输出:
[0, 6]
解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的字母异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的字母异位词。
示例 2:
输入:
s: "abab" p: "ab"
输出:
[0, 1, 2]
解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的字母异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的字母异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的字母异位词。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/find-all-anagrams-in-a-string
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
二、分析及代码
1. 滑动窗口
(1)思路
设计一个与字符串 p 等长的滑动窗口,在字符串 s 中从左往右依次移动,判断在各个位置窗口中的字母是否与字符串 p 相同。
为提高判断效率,可用一个数字和数组记录当前窗口中各个字母相同的个数,并结合队列记录窗口中字母类型,快速维护窗口。
遇到字符串 p 中不存在的字母时,可快速将窗口的左索引移动到该位置之后。
(2)代码
class Solution {
public List<Integer> findAnagrams(String s, String p) {
List<Integer> ans = new ArrayList<>();
if (s.length() == 0 || p.length() == 0)
return ans;
char[] cs = s.toCharArray();
char[] cp = p.toCharArray();
int wLen = p.length();//窗口长度
int len = 0, index = 0;//窗口中字符个数,窗口首字符位置
boolean[] hasChar = new boolean[26];//记录p中是否存在该字母
int[] numChar = new int[26];//记录当前窗口中还需出现各字母个数
for (int i = 0; i < 26; i++) {
//初始化
hasChar[i] = false;
numChar[i] = 0;
}
for (int i = 0; i < wLen; i++) {
//记录p中数据
hasChar[cp[i] - 'a'] = true;
numChar[cp[i] - 'a']++;
}
Queue<Character> win = new LinkedList<Character>();
for (int i = 0; i < s.length(); i++) {
if (hasChar[cs[i] - 'a'] == false) {
//出现p中不存在的字母,直接将窗口起点跳到下一字符处
while (len > 0) {
numChar[win.poll() - 'a']++;
len--;
}
index = i + 1;
continue;
}
if (numChar[cs[i] - 'a'] > 0) {
//出现p中存在且当前窗口中个数不足的字母
win.offer(cs[i]);
numChar[cs[i] - 'a']--;
len++;
if (numChar[cs[i] - 'a'] == 0 && len == wLen) {
//此时窗口范围为p的字母异位词的子串
ans.add(index);
numChar[win.poll() - 'a']++;
len--;
index++;
}
continue;
}
while (len > 0 && win.peek() != cs[i]) {
//出现p中存在但当前窗口中个数已达到需求的字母
numChar[win.poll() - 'a']++;
len--;
index++;
}
win.poll();
index++;
win.offer(cs[i]);
}
return ans;
}
}
(3)结果
执行用时 :10 ms, 在所有 Java 提交中击败了 69.58% 的用户;
内存消耗 :40.2 MB, 在所有 Java 提交中击败了 30.75% 的用户。
2. 滑动窗口优化
(1)思路
上述方法中,队列里的元素按照在数组中的位置有序排列,且可直接通过下标访问,这种情况下,可不创建 Queue 实体,直接通过起点和长度在数组中标记窗口范围,减小队列的维护开销。
(2)代码
class Solution {
public List<Integer> findAnagrams(String s, String p) {
List<Integer> ans = new ArrayList<>();
if (s.length() == 0 || p.length() == 0)
return ans;
char[] cs = s.toCharArray();
char[] cp = p.toCharArray();
int wLen = p.length();//窗口长度
int len = 0, index = 0;//窗口中字符个数,窗口首字符位置
boolean[] hasChar = new boolean[26];//记录p中是否存在该字母
int[] numChar = new int[26];//记录当前窗口中还需出现各字母个数
for (int i = 0; i < 26; i++) {
//初始化
hasChar[i] = false;
numChar[i] = 0;
}
for (int i = 0; i < wLen; i++) {
//记录p中数据
hasChar[cp[i] - 'a'] = true;
numChar[cp[i] - 'a']++;
}
for (int i = 0; i < s.length(); i++) {
if (hasChar[cs[i] - 'a'] == false) {
//出现p中不存在的字母,直接将窗口起点跳到下一字符处
while (len > 0)
numChar[cs[index + --len] - 'a']++;
index = i + 1;
continue;
}
if (numChar[cs[i] - 'a'] > 0) {
//出现p中存在且当前窗口中个数不足的字母
numChar[cs[i] - 'a']--;
len++;
if (numChar[cs[i] - 'a'] == 0 && len == wLen) {
//此时窗口范围为p的字母异位词的子串
ans.add(index);
numChar[cs[index++] - 'a']++;
len--;
}
continue;
}
while (len > 0 && cs[index] != cs[i]) {
//出现p中存在但当前窗口中个数已达到需求的字母
numChar[cs[index++] - 'a']++;
len--;
}
index++;
}
return ans;
}
}
(3)结果
执行用时 :5 ms, 在所有 Java 提交中击败了 93.68% 的用户;
内存消耗 :39.7 MB, 在所有 Java 提交中击败了 84.86% 的用户。
三、其他
暂无。