Description
桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。
Input
一行输入两个数R,B,其值在0到5000之间
Output
在最优策略下平均能得到多少钱。
Sample Input
5 1
Sample Output
4.166666
HINT
输出答案时,小数点后第六位后的全部去掉,不要四舍五入.
解法:
///f[i][j]表示有i张红j张黑情况下的期望收益
///f[i][j]=max(0,i/(i+j)(f[i-1][j]+1)+j/(i+j)(f[i][j-1]-1))
///转移是和很好理解的,如果选了的期望收益<0,那么不如不选
///BZOJ 1419
#include <bits/stdc++.h>
using namespace std;
const int maxn = 5010;
int n, m;
double dp[2][maxn];
///f[i][j]表示有i张红j张黑情况下的期望收益
///f[i][j]=max(0,i/(i+j)*(f[i-1][j]+1)+j/(i+j)*(f[i][j-1]-1))
///转移是和很好理解的,如果选了的期望收益<0,那么不如不选 int now=0,pre=1; int main(){ scanf("%d%d",&n,&m); dp[0][0]=0; for(int i=1; i<=n; i++){ swap(now, pre); dp[now][0]=i; for(int j=1; j<=m; j++){ dp[now][j] = max(0.0, 1.0*i/(i+j)*(dp[pre][j]+1)+1.0*j/(i+j)*(dp[now][j-1]-1)); } } long long ans=floor(dp[now][m]*1000000); printf("%lld.%.06lld\n", ans/1000000, ans%1000000); return 0; }