衡量探索




基于不确定性的探索

Thompson Sampling


UCB1


贝叶斯UCB


基于MCTS的规划

规划








MCTS