Leetcode 30 串联所有单词的子串
我的 leetcode 代码仓库
题目描述
Leetcode题目地址:https://leetcode-cn.com/problems/substring-with-concatenation-of-all-words/
给定一个字符串 s 和一些长度相同的单词 words找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。
注意子串要与 words 中的单词完全匹配,中间不能有其他字符,但不需要考虑 words 中单词串联的顺序。
示例 1:
输入:
s = "barfoothefoobarman",
words = ["foo","bar"]
输出:[0,9]
解释:
从索引 0 和 9 开始的子串分别是 "barfoor" 和 "foobar" 。
输出的顺序不重要, [9,0] 也是有效答案。
示例 2:
输入:
s = "wordgoodgoodgoodbestword",
words = ["word","good","best","word"]
输出:[]
解答
使用哈希表以及滑窗处理
-
将输入数组
words
包装为一个名为dict的map降低查找复杂度 -
将以字符为单位转为以单词为单位
比如示例1中的每个单词长度为3,那么只需要从s的0,1,2开始每3个字符遍历,就可以遍历所有的单词
因为最后的合法串是连续的,所以遍历单词也是连续的,这样就可以遍历所有符合要求的单词
-
在每一个单词串遍历中使用滑窗降低复杂度
开辟一个新的map用来判断滑窗内单词合法性
以滑窗初始位置left 以及滑窗长度 len 表示一个滑窗(如果长度是一个合法串应有的长度则将left加入到res 中,如果当前单词是非法的(不再dict中)则,重新定义滑窗(left为当前非法位置的下一个,len = 0),否则判断是否出现重复,如果有,则重新定位left(第一个重复单词处)以及应有的len值,否则len++以及更新的map里的值
代码如下
注意:
如果一开始初始化tempDict
为dict
,然后通过每次将tempDict的单词减1,即每次要重新构造map而不是使用map的clear方法,会花大量的时间,尽管思路是一样的,可能是构造的复杂度比clear更高了
class Solution {
public:
vector<int> findSubstring(string s, vector<string>& words) {
vector<int> res;
if(words.empty() || s.empty() || s.length() < words.size()*words[0].length()) return res; // 一定不行的情况
int lenOfWord = words[0].length(); // 记录单词的长度
unordered_map<string,int> dict; // 存最初的单词以及出现次数
for(int i = 0;i < words.size();i++) { // 初始化最初的dict
if(dict.find(words[i]) == dict.end()) {
dict.insert(make_pair(words[i],1));
} else {
dict[words[i]]++;
}
}
// 以单词位单位进行遍历
// strBeg: 每个单词串的开头
for(int strBeg = 0;strBeg < lenOfWord;strBeg++) { // 每一个单词串开头
unordered_map<string,int> tempDict;
int left = strBeg, len = 0;
for(int cur = strBeg;cur <= s.length()-lenOfWord;cur += lenOfWord) {
string substr = s.substr(cur,lenOfWord);
if(dict.count(substr) == 0) { // 非法单词
tempDict.clear();
len = 0;
left = cur + lenOfWord;
} else {
if(tempDict[substr] < dict[substr]) { // 没有重复
tempDict[substr]++;
len++;
} else { // 有重复
string temp;
while((temp = s.substr(left,lenOfWord)) != substr) {
tempDict[temp]--;
left += lenOfWord;
len--;
}
left += lenOfWord;
}
if(len == words.size()) { // 此时滑窗内为所要求串
res.push_back(left);
tempDict[s.substr(left,lenOfWord)]--;
len--;
left += lenOfWord;
}
}
}
}
return res;
}
};