D. Bag of mice(概率dp)

题目传送门

题意: 口袋里有 w w w只白色老鼠, b b b只黑色老鼠,你和你的对手轮流抓老鼠,谁先抓到白色老鼠谁就赢了。有以下约束条件:

  1. 你先手
  2. 你的对手抓老鼠的时候不管抓到什么颜色的,都会随机逃跑一只老鼠,而你抓的时候并不会。
  3. 当你们都没有抓到白色老鼠的情况下,口袋里没有老鼠了,这时候你的对手就赢了。
  4. w , b ∈ [ 0 , 1000 ] w,b∈[0,1000] w,b[0,1000]

问你能够获胜的概率是多少?

思路: 我们用 f [ i ] [ j ] f[i][j] f[i][j]表示当轮到我们抓老鼠时,抓到白色的老鼠的概率。那么我们首先 f [ i ] [ j ] = i i + j f[i][j]=\cfrac{i}{i+j} f[i][j]=i+ji,然后这是我们一抓就中的方法,那么如果我们这次没抓中,那么也只能希望对手不要抓中,这样我们才有赢的希望。所以我们这次抓不中并且对手也抓不中的概率是 k = j i + j ∗ j − 1 i + j − 1 k=\cfrac{j}{i+j}*\cfrac{j-1}{i+j-1} k=i+jji+j1j1,然后我们考虑对手抓完之后,逃跑的是白色老鼠还是黑色老鼠。

  • 如果是白色,那么就要保证 j > = 2 j>=2 j>=2,这时候我们抓到白色老鼠的概率为 k ∗ f [ i − 1 ] [ j − 2 ] ∗ i i + j − 2 k*f[i-1][j-2]*\cfrac{i}{i+j-2} kf[i1][j2]i+j2i
  • 如果是黑色,那么就要保证 j > = 3 j>=3 j>=3,这时候我们抓到白色老鼠的概率为 k ∗ f [ i ] [ j − 3 ] ∗ j − 2 i + j − 2 k*f[i][j-3]*\cfrac{j-2}{i+j-2} kf[i][j3]i+j2j2

最后我们把这两个得到的结果加到 f [ i ] [ j ] f[i][j] f[i][j]上就行了。

代码:

#include<bits/stdc++.h>
#define endl '\n'
#define null NULL
#define ls p<<1
#define rs p<<1|1
#define fi first
#define se second
#define mp make_pair
#define pb push_back
#define ll long long
//#define int long long
#define pii pair<int,int>
#define ull unsigned long long
#define pdd pair<double,double>
#define lowbit(x) x&-x
#define all(x) (x).begin(),(x).end()
#define sz(x) (int)(x).size()
#define IOS ios::sync_with_stdio(false);cin.tie(0);cout.tie(0);
char *fs,*ft,buf[1<<20];
#define gc() (fs==ft&&(ft=(fs=buf)+fread(buf,1,1<<20,stdin),fs==ft))?0:*fs++;
inline int read()
{
    
    
    int x=0,f=1;
    char ch=gc();
    while(ch<'0'||ch>'9')
    {
    
    
        if(ch=='-')
            f=-1;
        ch=gc();
    }
    while(ch>='0'&&ch<='9')
    {
    
    
        x=x*10+ch-'0';
        ch=gc();
    }
    return x*f;
}
using namespace std;
const int N=1e3+55;
const int inf=0x3f3f3f3f;
const int mod=998244353;
const double eps=1e-6;
const double PI=acos(-1);

double f[N][N];

void solve()
{
    
    
    int w,b;
    cin>>w>>b;
    for(int i=1; i<=w; i++)
        f[i][0]=1;
    for(int i=1; i<=b; i++)
        f[0][i]=0;
    for(int i=1; i<=w; i++)
    {
    
    
        for(int j=1; j<=b; j++)
        {
    
    
            f[i][j]=i*1.0/(i+j);
            double k=(1-f[i][j])*((j-1)*1.0/(i+j-1)),sum=0;
            if(j>=2)
                sum+=k*f[i-1][j-2]*i*1.0/(i+j-2);
            if(j>=3)
                sum+=k*f[i][j-3]*(j-2)*1.0/(i+j-2);
            f[i][j]+=sum;
        }
    }
    printf("%.9f\n",f[w][b]);
}

signed main()
{
    
    
    //int T;cin>>T;
    //while(T--)
    solve();


    return 0;
}

猜你喜欢

转载自blog.csdn.net/Joker_He/article/details/109898449
今日推荐