想回老家的潜伏者躺平又起来了

未归档《强化学习》探索方法

未归档

Git(1) Lasso(1) Linux(1) Python(2) Scala(7) SVM(1) TensorFlow(3) 其他(1) 图表示学习(1) 工具介绍(1) 强化学习(1) 推荐系统(1) 机器学习(8) 深度学习(2) 聚类和EM算法(1)

/ 注册

《强化学习》探索方法

747 浏览 0 回复 2018-06-21

想回老家的潜伏者躺平又起来了

+关注

衡量探索

基于不确定性的探索

Thompson Sampling

UCB1

贝叶斯UCB

基于MCTS的规划

规划

MCTS

举报

收藏

赞

评论加载中...