模型量化最小误差

题目分析

神经网络有 $N$ 层，每层有 $H$ 个实数权重。每层需要选择一个量化位宽 $q \in \{2, 4, 8\}$ ，所有层的位宽之和不能超过 $Q_{\max}$ 。

对于位宽 $q$ ，每个权重 $w$ 的量化过程为：

放大并取整： $w_q = \text{int}(w \times 2^q)$
还原： $w_r = w_q / 2^q$

每层的量化误差为该层所有权重的 $(w - w_r)$ 之和，总误差为所有层误差之和。求最小总误差乘以 $100$ 后向下取整的结果。

思路

分组背包 DP

这是一个经典的分组背包问题。每一层是一个"组"，每组有 $3$ 种选择（位宽 $2$ 、 $4$ 、 $8$ ），对应的"体积"就是位宽值，"价值"就是该层在对应位宽下的量化误差。背包容量为 $Q_{\max}$ ，目标是在总位宽不超过预算的前提下，最小化总误差。

预处理： 对于每一层，分别计算选择位宽 $2$ 、 $4$ 、 $8$ 时的量化误差。具体地，对每个权重 $w$ ，计算 $w - \lfloor w \times 2^q \rfloor / 2^q$ ，然后对该层所有权重求和。

DP 转移： 设 $dp[j]$ 表示已经处理完前若干层、总位宽恰好为 $j$ 时的最小总误差。对于第 $i$ 层，枚举三种位宽选择 $q \in \{2, 4, 8\}$ ，转移为：

$ $dp'[j + q] = \min(dp'[j + q],\ dp[j] + \text{error}[i][q])$ $

最终答案为 $\lfloor \min(dp[0 \dots Q_{\max}]) \times 100 \rfloor$ 。

以样例验证： $N=2, H=3, Q_{\max}=8$ 。

第 $1$ 层 $[0.1, 0.5, 0.9]$ ： $q=2$ 误差 $=0.25$ ， $q=4$ 误差 $=0.0625$ ， $q=8$ 误差 $\approx 0.00195$
第 $2$ 层 $[0.3, 0.75, 0.2]$ ： $q=2$ 误差 $=0.25$ ， $q=4$ 误差 $=0.0625$ ， $q=8$ 误差 $\approx 0.00195$

选 $q_1=4, q_2=4$ ，总位宽 $=8 \le 8$ ，总误差 $=0.125$ ，结果 $=\lfloor 12.5 \rfloor = 12$ 。

复杂度

时间复杂度： $O(N \times H + N \times Q_{\max})$ ，预处理每层误差 $O(NH)$ ，DP 转移 $O(N \times Q_{\max})$
空间复杂度： $O(N \times H + Q_{\max})$ ，存储权重和 DP 数组

代码

import sys
import math

def main():
    input_data = sys.stdin.read().split()
    idx = 0
    N = int(input_data[idx]); idx += 1
    H = int(input_data[idx]); idx += 1
    Qmax = int(input_data[idx]); idx += 1

    # 预处理每层在三种位宽下的量化误差
    layer_errors = []
    for i in range(N):
        weights = []
        for j in range(H):
            weights.append(float(input_data[idx])); idx += 1
        errors = {}
        for q in [2, 4, 8]:
            err = 0.0
            scale = 2 ** q
            for w in weights:
                wq = int(w * scale)
                wr = wq / scale
                err += (w - wr)
            errors[q] = err
        layer_errors.append(errors)

    # 分组背包 DP
    INF = float('inf')
    dp = [INF] * (Qmax + 1)
    dp[0] = 0.0

    for i in range(N):
        new_dp = [INF] * (Qmax + 1)
        for used in range(Qmax + 1):
            if dp[used] == INF:
                continue
            for q in [2, 4, 8]:
                new_used = used + q
                if new_used <= Qmax:
                    val = dp[used] + layer_errors[i][q]
                    if val < new_dp[new_used]:
                        new_dp[new_used] = val
        dp = new_dp

    min_err = min(dp)
    print(math.floor(min_err * 100))

main()