Leetcode 剑指 Offer II 071.按权重随机选择

题目难度: 中等

原题链接

今天继续更新 Leetcode 的剑指 Offer（专项突击版）系列, 大家在公众号 算法精选 里回复 剑指offer2 就能看到该系列当前连载的所有文章了, 记得关注哦~

题目描述

给定一个正整数数组 w ，其中 w[i] 代表下标 i 的权重（下标从 0 开始），请写一个函数 pickIndex ，它可以随机地获取下标 i，选取下标 i 的概率与 w[i] 成正比。

例如，对于 w = [1, 3]，挑选下标 0 的概率为 1 / (1 + 3) = 0.25 （即，25%），而选取下标 1 的概率为 3 / (1 + 3) = 0.75（即，75%）。

也就是说，选取下标 i 的概率为 w[i] / sum(w) 。

示例 1：

输入：
- inputs = ["Solution","pickIndex"]
- inputs = [[[1]],[]]
输出：
- [null,0]
解释：
- Solution solution = new Solution([1]);
- solution.pickIndex(); // 返回 0，因为数组中只有一个元素，所以唯一的选择是返回下标 0。

示例 2：

输入：
- inputs = ["Solution","pickIndex","pickIndex","pickIndex","pickIndex","pickIndex"]
- inputs = [[[1,3]],[],[],[],[],[]]
输出：
- [null,1,1,1,1,0]
解释：
- Solution solution = new Solution([1, 3]);
- solution.pickIndex(); // 返回 1，返回下标 1，返回该下标概率为 3/4 。
- solution.pickIndex(); // 返回 1
- solution.pickIndex(); // 返回 1
- solution.pickIndex(); // 返回 1
- solution.pickIndex(); // 返回 0，返回下标 0，返回该下标概率为 1/4 。
- 由于这是一个随机问题，允许多个答案，因此下列输出都可以被认为是正确的:
- [null,1,1,1,1,0]
- [null,1,1,1,1,1]
- [null,1,1,1,0,0]
- [null,1,1,1,0,1]
- [null,1,0,1,0,0]
- ......
- 诸若此类。

提示：

1 <= w.length <= 10000
1 <= w[i] <= 10^5
pickIndex 将被调用不超过 10000 次

题目思考

如何设计随机算法?
如何优化时间复杂度?

解决方案

思路

分析题目, 要考虑每个下标的权重, 我们显然不能直接随机取[0,n)的下标, 这样会导致每个下标取到的概率相同, 如何解决呢?
根据题目例子, 我们可以发现, 每个下标的取值概率等于其权重除以权重总和
利用这一点, 假设权重总和是 total, 我们随机取[0,total)之间的某个数字, 然后判断它落在了哪个下标的范围内, 这样就把下标权重考虑在内了
举个例子, 假设数组 w 是[3,2,4], 那么总权重和就是3+2+4=9
下标 0 的权重是 3, 它负责的范围是[0,2]
下标 1 的权重是 2, 它负责的范围是[3,4]
下标 2 的权重是 4, 它负责的范围是[5,8]
我们随机取[0,9)之间的某个数字, 它落在哪个下标范围就返回哪个下标, 这样就保证了每个下标的取值概率等于其权重除以权重总和
有了思路后, 如何写出代码呢?
不难发现每个下标的负责范围的起点就是其前缀和, 即[0,3,5,9], 注意最后的 9 代表了总和, 不属于某个下标起点
所以我们可以在初始化时求出原始数组对应的前缀和数组 sms, 最后一个元素sms[-1]就是总和
然后 pickIndex 时随机取[0,sms[-1])之间的数字 x, 并从头开始遍历前缀和数组, 找到第一个满足sms[i]<=x<sms[i+1]的下标 i, 即为考虑权重后随机选取的下标
不过上述查找过程需要线性遍历, 时间复杂度是 O(N), 能否继续优化呢?
注意到题目给出的是正整数数组, 所以前缀和是单调递增的, 我们可以利用二分查找来优化
这里我们能够完美利用 Python 提供的右二分 bisect_right, 它的语义是:
- 如果数字存在于查找数组, 返回对应下标加 1
- 如果数字不存在, 则返回首个大于该数字的下标或数组长度(如果已有数字都不大于查找数字时)
这样右二分查找到的下标正是所需下标的下一个下标, 同样拿上面例子举例:
- 假如查找数字是 0, 则右二分返回下标 1, 所需下标是 0
- 假如查找数字是 1, 则右二分返回下标 1, 所需下标是 0
- 假如查找数字是 2, 则右二分返回下标 1, 所需下标是 0
- 假如查找数字是 3, 则右二分返回下标 2, 所需下标是 1
- 假如查找数字是 4, 则右二分返回下标 2, 所需下标是 1
- ...
大家如果感兴趣的话也可以自己尝试实现这个二分查找的过程, 基本类似前面的题目Leetcode 剑指 Offer II 068.搜索插入位置, 只需要稍作改动, target 存在时返回对应下标加 1, 而不是下标本身
下面代码中有详细的注释, 方便大家理解

复杂度

时间复杂度 O(logN): 每次 pickIndex 使用二分查找, 时间复杂度是 O(logN)
空间复杂度 O(N): 需要额外存储前缀和数组

代码

class Solution:
    def __init__(self, w: List[int]):
        # 前缀和+二分查找
        self.sms = [0]
        for x in w:
            # 统计前缀和数组
            self.sms.append(x + self.sms[-1])

    def pickIndex(self) -> int:
        # 随机选择[0,数字总和)之间的一个数字x
        x = random.randrange(0, self.sms[-1])
        # 二分查找当前数字落在了哪个下标的范围内
        # 这里使用右二分bisect_right, 且二分得到的下标要减1
        return bisect.bisect_right(self.sms, x) - 1

大家可以在下面这些地方找到我~😊

我的 GitHub

我的 Leetcode

我的 CSDN

我的知乎专栏

我的头条号

我的牛客网博客

我的公众号: 算法精选, 欢迎大家扫码关注~😊

算法精选 - 微信扫一扫关注我