解题思路

这是一个动态规划问题,需要计算期望值。游戏规则如下:

  1. 张牌从上到下编号 ,每张牌上有一个数字
  2. 两人轮流取牌,每次只能取最上面或最下面的牌
  3. 小明先手,以概率 取上面的牌,概率 取下面的牌
  4. 小方后手,以概率 取上面的牌,概率 取下面的牌
  5. 求小明获得的数字之和的期望值

解决方案:

  1. 使用区间DP, 表示区间 的期望值
  2. 初始化单张牌和相邻两张牌的情况
  3. 按照区间长度递推,考虑所有可能的取牌情况

代码

#include <bits/stdc++.h>
using namespace std;

int main() {
    int n, P, Q;
    scanf("%d%d%d", &n, &P, &Q);
    
    // 读入牌面值
    int a[n];
    for(int i = 0; i < n; i++)
        scanf("%d", &a[i]);
    
    // 转换概率值
    double p = P/100.0, q = Q/100.0;
    double dp[n][n];
    memset(dp, 0, sizeof(dp));
    
    // 初始化单张牌和相邻两张牌的情况
    for(int i = 0; i < n; i++) {
        dp[i][i] = a[i];
        if(i < n-1)
            dp[i][i+1] = p*a[i] + (1-p)*a[i+1];
    }
    
    // 区间DP
    for(int k = 2; k < n; k++) {
        for(int i = 0; i < n-k; i++) {
            int j = i + k;
            // 小明取上面的牌时的期望
            double px = a[i] + q*dp[i+2][j] + (1-q)*dp[i+1][j-1];
            // 小明取下面的牌时的期望
            double py = a[j] + q*dp[i+1][j-1] + (1-q)*dp[i][j-2];
            // 综合两种情况
            dp[i][j] = p*px + (1-p)*py;
        }
    }
    
    printf("%.3f\n", dp[0][n-1]);
    return 0;
}
import java.util.*;

public class Main {
    public static void main(String[] args) {
        Scanner sc = new Scanner(System.in);
        int n = sc.nextInt();
        int P = sc.nextInt();
        int Q = sc.nextInt();
        
        // 读入牌面值
        int[] a = new int[n];
        for(int i = 0; i < n; i++) {
            a[i] = sc.nextInt();
        }
        
        // 转换概率值
        double p = P/100.0, q = Q/100.0;
        double[][] dp = new double[n][n];
        
        // 初始化单张牌和相邻两张牌的情况
        for(int i = 0; i < n; i++) {
            dp[i][i] = a[i];
            if(i < n-1)
                dp[i][i+1] = p*a[i] + (1-p)*a[i+1];
        }
        
        // 区间DP
        for(int k = 2; k < n; k++) {
            for(int i = 0; i < n-k; i++) {
                int j = i + k;
                // 小明取上面的牌时的期望
                double px = a[i] + q*dp[i+2][j] + (1-q)*dp[i+1][j-1];
                // 小明取下面的牌时的期望
                double py = a[j] + q*dp[i+1][j-1] + (1-q)*dp[i][j-2];
                // 综合两种情况
                dp[i][j] = p*px + (1-p)*py;
            }
        }
        
        System.out.printf("%.3f\n", dp[0][n-1]);
    }
}
def solve():
    n, P, Q = map(int, input().split())
    a = list(map(int, input().split()))
    
    # 转换概率值
    p, q = P/100.0, Q/100.0
    
    # 初始化DP数组
    dp = [[0.0] * n for _ in range(n)]
    
    # 初始化单张牌和相邻两张牌的情况
    for i in range(n):
        dp[i][i] = a[i]
        if i < n-1:
            dp[i][i+1] = p*a[i] + (1-p)*a[i+1]
    
    # 区间DP
    for k in range(2, n):
        for i in range(n-k):
            j = i + k
            # 小明取上面的牌时的期望
            px = a[i] + q*dp[i+2][j] + (1-q)*dp[i+1][j-1]
            # 小明取下面的牌时的期望
            py = a[j] + q*dp[i+1][j-1] + (1-q)*dp[i][j-2]
            # 综合两种情况
            dp[i][j] = p*px + (1-p)*py
    
    print(f"{dp[0][n-1]:.3f}")

solve()

算法及复杂度

  • 算法:区间动态规划
  • 时间复杂度: - 需要计算所有可能的区间
  • 空间复杂度: - 需要存储所有状态的期望值