♻️ refactor: [book] PPO重构暂存
继《蘑菇书EasyRL》之后,我们对于想要更多地深入了解强化学习实践的读者准备了一套全新的教程,帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架JoyRL,便于读者适应业界应用研究风格的代码。
JoyRL
与《蘑菇书》的区别:
SoftQ
RainbowDQN
JoyRL旨在建立一套帮助初学者或交叉学科研究者快速入门强化学习的代码生态。它以PiP包的形式开发开源框架,英文注释,会比离线版更加集成,更加高效,并且会去掉一些实际并不常用的基础算法,例如Q-learning等等,适合需要大规模环境应用的读者进阶使用。
PiP
Q-learning
此外,本书中的演示代码会在以Jupyter Notebook的形式呈现,具体在notebooks文件夹中。
Jupyter Notebook
地址:https://datawhalechina.github.io/joyrl-book/
教程设计与算法实战 北京大学硕士
教程设计 上海交通大学博士生 中国科学院大学硕士
教程设计 牛津大学博士生 清华大学硕士
扫描下方二维码关注公众号:Datawhale,回复关键词“强化学习”,即可加入“EasyRL & JoyRL 读者交流群”
JoyRL Book
继《蘑菇书EasyRL》之后,我们对于想要更多地深入了解强化学习实践的读者准备了一套全新的教程,帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架
JoyRL
,便于读者适应业界应用研究风格的代码。与《蘑菇书》的区别:
SoftQ
、RainbowDQN
等,代码内容更偏向业界风格。除此之外,本教程还开发一套开源框架joyrl,便于读者应用到更复杂以及自定义的环境中,适合做交叉应用的读者。关于
JoyRL
JoyRL旨在建立一套帮助初学者或交叉学科研究者快速入门强化学习的代码生态。它以
PiP
包的形式开发开源框架,英文注释,会比离线版更加集成,更加高效,并且会去掉一些实际并不常用的基础算法,例如Q-learning
等等,适合需要大规模环境应用的读者进阶使用。此外,本书中的演示代码会在以
Jupyter Notebook
的形式呈现,具体在notebooks文件夹中。在线阅读(内容实时更新)
地址:https://datawhalechina.github.io/joyrl-book/
内容导航
主要贡献者
John Jim
教程设计与算法实战
北京大学硕士
Qi Wang
教程设计
上海交通大学博士生
中国科学院大学硕士
Yiyuan Yang
教程设计
牛津大学博士生
清华大学硕士
特别感谢
关注我们
扫描下方二维码关注公众号:Datawhale,回复关键词“强化学习”,即可加入“EasyRL & JoyRL 读者交流群”