苏学算法

强化学习

C++(12) CTR预估(2) git(2) gpu(1) linux(7) mac(1) Matlab(1) python(201) shell(2) spark(1) sql(1) vim(1) windows(1) 互联网算法面经(1) 其他(4) 写论文工具(2) 异常检测(2) 推荐系统(1) 数据结构(20) 未归档(1) 机器学习(20) 深度学习(8) 环境配置(2) 算法(23) 链表(1)

归档

标签

去牛客网

/ 注册

全部文章 / 强化学习（共3篇）

李宏毅深度强化学习笔记（一）Proximal Policy Optimization (PPO)

个人听课笔记，先贴上PPT版笔记，后续有空再行整理。课程链接: 李宏毅深度强化学习1. 李宏毅深度强化学习2.

2021-03-30

0 1328

李宏毅深度强化学习笔记（二）Imitation Learning

个人听课笔记，先贴上PPT版笔记，后续有空再行整理。课程链接: 李宏毅深度强化学习1. 李宏毅深度强化学习2.

2021-03-30

0 811

Ubantu 18.04配置 DeepMimic环境笔记

原始论文论文：DeepMimic: Example-Guided Deep Reinforcement Learning of Physics-Based Character Skills. 阅读笔记：读论文 DeepMimic: Example-Guided Deep Reinforceme...

2021-03-30

0 941