题目描述
众所周知,自然界的所有生物都有自己的基因序列。但是各个生物之间,或多或少是有一些基因序列是相同的,现在请你来帮帮忙,计算一下两个生物之间的基因序列相似度。
例如生物A的基因序列为ABC ,那么生物A的基因序列可以拆分成 A , B , C , AB , AC , BC , ABC
例如生物B的基因序列为QBC,那么生物B的基因序列可以拆分成 Q , B , C , QB , QC , BC , QBC
那么这两种生物共有的最长相似基因序列为BC,BC各占生物A和B总基因序列的 66.67%
请注意,相似的基因序列必须序列顺序也相同,ab与ba不是相似基因序列。
输入
测试样例由多组测试数据组成。每组测试数据第一行输入一个字符串s1 ( 1 <= s1.length <= 2000),第二行输入一个字符串s2 ( 1 <= s.length <= 2000 ) ,分别代表两个生物的基因序列。基因序列均由小写字母组成
输出
输出两个生物相似的最长基因序列占自己本身的基因序列的百分比,保留2位小数。
样例输入 Copy
qdwde
qwe
样例输出 Copy
60.00% 100.00%
思路:
一道dp题目。通过dp挖出最长公共子序列。
核心代码: dp [ i + 1 ] [ j + 1 ] = max ( dp [ i ] [ j + 1 ] , dp [ i + 1 ] [ j ] ) ;
如果没有看懂的代码,可以用画图法来理清楚代码的终极奥义。
把所有字符跑一遍就可以了。
% 输出是 %%
AC代码:
#include<bits/stdc++.h>
using namespace std;
string s1,s2;
int dp[2005][2005];
double a,b,c;
int main(){
while(cin>>s1){
cin>>s2;
memset(dp,0,sizeof dp);
for(int i=0;i<s1.length();i++){
for(int j=0;j<s2.length();j++){
if(s1[i]==s2[j]){
dp[i+1][j+1]=dp[i][j]+1;
}else{
dp[i+1][j+1]=max(dp[i][j+1],dp[i+1][j]);
}
}
}
c=dp[s1.length()][s2.length()];
a=(double)c/s1.length()*100;
b=(double)c/s2.length()*100;
printf("%.2lf%% %.2lf%%\n",a,b);
}
return 0;
}