子序列的个数

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/BBHHTT/article/details/81875092

子序列的个数

给定一个正整数序列,序列中元素的个数和元素值大小都不超过105, 求其所有子序列的个数。注意相同的只算一次:例如 {1,2,1}有子序列{1} {2} {1,2} {2,1}和{1,2,1}。最后结果对10^9 + 7取余数。

分析: 万能枚举,时间复杂度O(2^n)——因为每一项都可以选择取或者不取嘛。这个不可行,n太大了。

我们想想动态规划?严格来讲这个题不是一个dp的问题,因为它是一个数数(组合数学)的问题,不是一个优化的问题。我们来想想2^n个子序列是怎么来的——之前已经有2^(n-1)个了,再加上最后一个或者不加上最后一个,还有两种选择。


假设dp[i]表示前i项形成的子序列(含空)的个数。下标从1开始,初值是dp[0] = 1,对应代表空子序列。我们考虑第i项,如果所有的数都不相等,应该有dp[i] = dp[i – 1] * 2,其实就是考虑把第i个数放到最后或者不放到最后的情况。

然而,因为有可能有相同的数,我们假设第i个数出现之前最近的在j (j < i)位置也出现过,那么实际上我们这种简单*2会有重复,哪些子序列重复呢? 我们设数列为a, 并且下标从1开始。

原来恰好以第j个数结尾的那些被我们算了两次,因为以第j个数结尾可以换成以第i个数结尾是一样的。如何计算出这个数的个数呢? 其实这个数等于dp[j – 1],因为前面(j – 1)个数的子序列最后跟上第j个数就可以了。


于是我们有了递推式:

dp[i] = dp[i – 1] * 2  如果a[i]不在之前出现
dp[i] = dp[i – 1] * 2 – dp[j – 1],如果a[i]最近在j的位置出现过。

这里有一个问题:我们如何找到a[i]最近在哪里出现呢?我们可以用一个hash,更简单的方式是直接把a[i]放到数组下标里,记录它最后一次出现的位置,因为数据范围并不大,可以承受。 所以我们有了一个时间复杂度O(n)的动态规划解法。


注意最后答案是dp[n] – 1 因为我们需要减掉一个全空子序列。


伪代码:

dp[0] = 1
for  i = 1 to n do
	dp[i] = dp[i – 1] * 2
	if have[a[i]] > 0 then dp[i] -= dp[have[a[i]] – 1]
return dp[n] – 1


输入: a[1..n]
辅助变量: have[x]表示目前x在a中最后一次出现的位置,如果没出现就是0,否则是一个正数。

另外,题目为了避免大数运算采用了取余数操作,请别忘记取余数操作。

输入

第1行:一个数N,表示序列的长度(1 <= N <= 100000)
第2 - N + 1行:序列中的元素(1 <= a[i] <= 100000)

输出

输出a的不同子序列的数量Mod 10^9 + 7。

输入示例

4
1
2
3
2
输出示例

13

#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
const int mod=1e9+7;
int mat[100005];
int dp[100005];
int have[100005];
int main()
{
	int n;
	memset(dp,0,sizeof(dp));
	memset(have,0,sizeof(have));
	scanf("%d",&n);
	for(int i=1;i<=n;i++) {
		scanf("%d",&mat[i]);
	}
	dp[0]=1;//初始化,空串 
	for(int i=1;i<=n;i++) {
		dp[i]=dp[i-1]*2%mod;//不能加mod后在%mod,会超int 
		if(have[mat[i]]) {
			dp[i]=(dp[i]-dp[have[mat[i]]-1]+mod)%mod;
		}
		have[mat[i]]=i;//每次只记录前一次出现的位置就行 
	}
	printf("%d\n",dp[n]-1);//空串计算两次,减一
	return 0;
}

猜你喜欢

转载自blog.csdn.net/BBHHTT/article/details/81875092