苏学算法
苏学算法
全部文章
强化学习
C++(12)
CTR预估(2)
git(2)
gpu(1)
linux(7)
mac(1)
Matlab(1)
python(201)
shell(2)
spark(1)
sql(1)
vim(1)
windows(1)
互联网算法面经(1)
其他(4)
写论文工具(2)
异常检测(2)
推荐系统(1)
数据结构(20)
未归档(1)
机器学习(20)
深度学习(8)
环境配置(2)
算法(23)
链表(1)
归档
标签
去牛客网
登录
/
注册
苏学算法的博客
全部文章
/ 强化学习
(共3篇)
李宏毅深度强化学习笔记(一)Proximal Policy Optimization (PPO)
个人听课笔记,先贴上PPT版笔记,后续有空再行整理。 课程链接: 李宏毅深度强化学习1. 李宏毅深度强化学习2.
2021-03-30
0
1194
李宏毅深度强化学习笔记(二)Imitation Learning
个人听课笔记,先贴上PPT版笔记,后续有空再行整理。 课程链接: 李宏毅深度强化学习1. 李宏毅深度强化学习2.
2021-03-30
0
757
Ubantu 18.04配置 DeepMimic环境笔记
原始论文 论文:DeepMimic: Example-Guided Deep Reinforcement Learning of Physics-Based Character Skills. 阅读笔记:读论文 DeepMimic: Example-Guided Deep Reinforceme...
2021-03-30
0
806