题解 | #Kevin的矩阵#

这道题属于组合最优化与根号分治逻辑的结合。解决该问题的关键在于深入理解填数规则，并利用矩阵行数与列数在乘积固定（长度为 $n$ ）下的互制关系，结合根号平衡思想优化搜索空间。

问题分析

首先，设调整后的矩阵列数为 $M$ 。矩阵的总行数为 $R = \lceil n/M \rceil$ 。根据规则，第 $c$ 列（ $1 \le c \le M$ ）的元素索引构成一个公差为 $M$ 的等差数列： $\{c, c + M, c + 2M, \dots, c + (R_c - 1)M \}$ 其中 $R_c$ 是第 $c$ 列的实际元素个数：

如果 $c \le n \pmod M$ （或 $n \pmod M = 0$ 时对所有 $c$ ），则 $R_c = \lfloor n/M \rfloor + 1$ 。
否则， $R_c = \lfloor n/M \rfloor$ 。

若要使第 $c$ 列全部为目标数字 $k$ ，所需的操作总次数为： $\text{Cost}(M, c) = |M - m| + (R_c - \text{count}(M, c))$ 其中 $\text{count}(M, c)$ 表示原序列中位于该列且数值已经是 $k$ 的元素个数。

我们的目标是求： $\min_{M \ge 1, 1 \le c \le M} \left( |M - m| + R_c - \text{count}(M, c) \right)$

算法：根号分治

由于 $m$ 可能达到 $10^9$ ，直接枚举 $M$ 是不可行的。然而，注意到 $n$ 的范围较小 ( $2 \cdot 10^5$ )，我们可以根据 $M$ 的大小进行分治讨论：

情况 A： $M$ 较小或 $M$ 靠近初始值 $m$

当 $M$ 较小时，行数 $R$ 会很大；当 $M$ 接近 $m$ 时，操作代价 $|M-m|$ 较小。我们观察到，如果 $|M-m| > \sqrt{n}$ 且 $M > \sqrt{n}$ ，则行数 $R = \lceil n/M \rceil$ 也小于 $\sqrt{n}$ 。这意味着在这些区间内，除非 $\text{count}(M, c)$ 非常大，否则代价很难优于 $M=m$ 或 $M$ 在 $\sqrt{n}$ 附近时的表现。

由此，我们可以确定需要显式检查的 $M$ 范围。定义阈值 $B = \sqrt{n} \approx 450$ ：

小范围枚举：枚举 $M \in [1, B]$ 。
邻域枚举：枚举 $M \in [\max(1, m-B), \min(n, m+B)]$ 。
边界情况：检查 $M=m$ 以及使其行数为 1 的最小列数 $M = \max(n, m)$ 。

情况 B： $M$ 很大 ( $M > n$ )

当 $M > n$ 时，矩阵只有 1 行。每一列只有一个元素。

若序列 $a$ 中存在 $k$ ，选该列，代价为 $|M-m|$ 。最小代价方案是 $M=\max(n, m)$ ，代价为 $|\max(n, m) - m|$ 。
若序列 $a$ 中不存在 $k$ ，选任意一列并修改，代价为 $|M-m| + 1$ 。

复杂度分析

时间复杂度：
- 候选集 $\mathcal{M}$ 的大小约为 $2B + 2$ 。
- 对于每个 $M$ ，我们在 $O(|K|)$ 时间内统计该 $M$ 下各列的分布（ $|K| \le n$ ）。
- 总复杂度为 $O(N_{total} \cdot \sqrt{N_{total}})$ 。
空间复杂度：
- $O(n)$ ，主要用于存储序列 $a$ 、下标集合 $K$ 以及频率统计数组。

总结

算法核心是通过候选空间剪枝降低计算维度。

为什么要检查 $M \le \sqrt{n}$ ？ 因为此范围内 $R$ 极大，改变 $M$ 带来的 $|M-m|$ 代价增长远小于通过减少行数 $R$ 获得的收益。
为什么要检查 $m$ 附近的 $M$ ？ 因为此范围内操作代价的核心在于 $R - \text{count}$ ，且 $|M-m|$ 项保持极小。
容错项：对于处于两者之间（即 $B < M < m-B$ ）且 $M \le n$ 的值，由于 $|M-m| > B \approx \sqrt{n}$ ，而该区域内行数 $R < \sqrt{n}$ ，即使该列全为 $k$ （ $\text{count}=R$ ），此时的总代价 $|M-m| + 0$ 也会大于在 $M=m$ 时的代价（ $M=m$ 时代价最多为 $R_m \le \sqrt{n}$ ）。因此该范围被证明不是最优解空间，可以安全忽略。