想回老家的潜伏者躺平又起来了
想回老家的潜伏者躺平又起来了
全部文章
强化学习
Git(1)
Lasso(1)
Linux(1)
Python(2)
Scala(7)
SVM(1)
TensorFlow(3)
其他(1)
图表示学习(1)
工具介绍(1)
推荐系统(1)
未归档(73)
机器学习(8)
深度学习(2)
聚类和EM算法(1)
归档
标签
去牛客网
登录
/
注册
浅梦的学习笔记
记录&分享工作学习中的算法技术原理和实践
全部文章
/ 强化学习
(共1篇)
CMU 10703 |Lecture 3 Planning in Markov decision processes
本文转载自微信公众号 机器人学家,根据其上发布的CMU翻译讲义进行整理。 大纲 Exact solution methods: Policy iteration Policy Evaluation (a.k.a. DP) Policy ...
强化学习
2017-02-08
0
928