GFOJ problem 470: [HbFS-]Red is good 解题报告

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_33468963/article/details/64918847

题目:http://www.gdfzoj.com/oj/problem/470

桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。.其中 R,B<5000

这是一道 玄学的 动态规划题
用 double f[i][j] 表示 翻开 i 张红牌和 j 张黑牌后的期望值
(当期望值小于0是选择不翻于是 “f[i][j] = max(f[i][j],0);”)
而从 f[i-1][j] 和 f[i][j-1] 转移到 f[i][j] 的可能性分别是 “i / (i+j)”和 “j / (i+j)”
答案就是 f[r][b];
关于这类数学期望题,引用一位神犇的总结:

和的期望就是期望的和

然而我不懂

帖代码:(不转double只有95分)

#include <cstdio>
#define max(a,b) (a>b ? a : b)

int r,b,i,j;
double f[5010][5010];

int main() {
    scanf("%d%d",&r,&b);
    for (i=0;i<=r;i++) for (j=0;j<=b;j++) {
        if (i) f[i][j] += (f[i-1][j] + (double)1) / (double)(i+j) * (double)i;
        if (j) f[i][j] += (f[i][j-1] - (double)1) / (double)(i+j) * (double)j;
        f[i][j] = max(f[i][j],0);
    }
    printf("%.6lf\n",f[r][b] - 0.0000005);
}

猜你喜欢

转载自blog.csdn.net/qq_33468963/article/details/64918847
今日推荐