https://ac.nowcoder.com/acm/contest/4853/C
给定长度为n的小写字母序列,求其有多少个长度为k的不同子序列。
输入
n, k
字符串s
输出 :
长度为k的不同子序列的个数
首先这题我的水平有点无能为力,毕竟dp的题做太少了,
所幸有这么多大佬愿意写博客分享知识,在反复揣摩之后,俺懂啦!总结一波。
本题的关键点:去重
首先,定义状态:
dp[ i ][ j ] 表示前 i 个字符形成的长度为 j 的子序列个数。
其次转移方程:
dp[i][j]=dp[i−1][j]+dp[i−1][j−1];
将选了当前的字符和不选当前的字符的个数加起来。
其实这个转移方程有问题,那就是没有舍去重复的情况。
因为这样会重复计算 形成的长度一样字母一样的子序列。
那么如何进行去重呢?
要考虑重复了的原因:前面有长度为j-1的子序列接上了和当前字符相同的字符,也就是已经接过了这个字符。
所以我们要先在[ 1, i ] 这个区间里找到第一个与当前字符相等的字符,标记下标pos,然后dp[ pos-1 ][ j - 1 ]就是应该要减去的值,
所以新的转移方程就诞生啦:
dp[i][j]=dp[i−1][j]+dp[i−1][j−1]-dp[pos-1][j-1];
代码:
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int maxn = 1005;
const int mod = 1e9 + 7;
ll dp[maxn][maxn];
ll n, k, pos[maxn];
char s[maxn];
int main()
{
scanf("%d %d", &n, &k);
scanf("%s", s + 1);
dp[0][0] = 1;
for (int i = 1; i <= n; ++i) {
dp[i][0] = 1;
for (int j = 1; j <= i; ++j) {
dp[i][j] = dp[i - 1][j] + dp[i - 1][j - 1];
if (pos[s[i] - 'a'])dp[i][j] -= dp[pos[s[i] - 'a'] - 1][j - 1];
dp[i][j] %= mod;
}
pos[s[i] - 'a'] = i;
}
ll res = dp[n][k];
if (res < 0) res += mod;
printf("%lld\n", res);
return 0;
}