牛客练习赛114E Kevin的抽奖黑幕

题目链接

E的官解用的是期望dp的标准做法，其实赛时通过的大部分选手用的是概率dp拆开算期望。很多地方会看到这样的说法：通常情况下，期望dp从后往前递推，概率dp从前往后递推。这里的“前”和“后”其实指的并不是正序循环和逆序循环，而是起始状态和终止状态。在本题中，起始状态为未开始抽奖，终止状态为 $m$ 轮抽奖过后。那么期望dp是从 $m$ 轮抽奖之后的状态递推到未开始抽奖的状态，概率dp是从未开始抽奖的状态递推到 $m$ 轮抽奖结束的状态。记抽中概率为win = k / n , 未抽中概率lose = 1 - k / n。

概率dp

思路

这里的概率dp用到了期望的定义和线性性质，为了方便理解，此处不引入公式，只探讨直观上的理解。如果不考虑“黑幕”，显然 $m$ 轮抽奖过后奖品总数的期望为 $mk$ ，那么我们只需要再加上“黑幕”部分的贡献即可。

定义

$f[i][j]$ 表示当前第 $i$ 轮结束后，该同学连续 $j$ 轮（包括当前轮）没有抽到奖的概率。注意这里1至 $m$ 轮对应的 $i$ 范围为 $[1, m]$ ， $j$ 的范围为 $[0, d-1]$ 。

转移

初始状态 $f[0][0] = 1$ , 表示未开始抽奖时概率为1。其余全为0，从初始状态正序循环计算转移。

1. 第 $i$ 轮结束时抽中奖

此时的结果为 $f[i][0]$ ，由两部分构成。要么第 $i$ 轮是连续 $d$ 轮未抽中奖，由 $f[i-1][d-1]$ 转移而来; 要么第 $i$ 轮抽中奖，由 $f[i-1][j]$ 转移而来：

alt

2.第 $i$ 轮结束时未中奖

此时的结果为 $f[i][j] (j > 0)$ , 由上一轮一直未中奖的状态乘当前轮未中奖的概率转移而来：

alt

计算答案

每次计算转移前，将当前触发“黑幕”（连续 $d$ 轮未获奖）的概率 $f[i-1][d-1] \times lose$ 累加到 $res$ 中。这样累加 $m$ 轮的结果 $res$ 表示每一个人由于“黑幕”而获得奖品的概率总和。由于每次黑幕一个人只获得一个奖品，而这 $n$ 个人又是独立的，由期望的线性性质, $n\times res$ 就是“黑幕”对于奖品总数的期望的贡献。

期望dp

思路

官解的思路是标准的期望dp做法。设计状态时考虑从当前状态到终止状态这个过程的期望，然后从终止状态（抽完奖）一步一步转移到起始状态（还没开始抽奖）。

定义

$f[i][j]$ 表示某个同学当前第 $i$ 轮开始前，之前已经连续 $j$ 轮没有抽到奖, 从此状态一直到 $n$ 轮抽奖结束时，该同学获得奖品数量的期望（也就是算第 $[i, m]$ 轮能获得的奖品数量，注意需要计算当前轮抽中的奖品）。 $f[0][0]$ 表示该同学获得奖品数量的期望。奖品总数是 $n$ 个人获得的，由抽奖的随机性和期望的线性性，答案即为 $f[0][0]\times n$ 。需要说明的是，这里1至 $m$ 轮对应的 $i$ 的下标为 $[0, m-1]$ , 和前面概率dp的下标有所不同。