前段时间看到朋友分享的《强化学习7日打卡营-世界冠军带你从零实践》免费课程,第一时间报名参加了。虽然自己也在做RL的研究并做了和RL相关的项目,学习下来还是收获颇丰,温故知新。课程从最基本的PARL环境搭建以及强化学习介绍入手,逐步过渡到RL的经典算法SARSA, Q-Learning, DQN, DDPG的介绍和实例分析,深入浅出,讲解的非常细致。实例分析基本可以说是对核心代码进行“手撕”了,讲解非常细致,相信即便没有RL基础的同学也可以很好地理解。最深刻的印象是课程中使用的例子/比喻都很形象,比如把DQN的Target网络使用原因比喻成用剑射兔子,如果不把兔子固定下来(移动靶),就很难很好的训练。下边附上这个例子的截图,感受下有多形象。
除了课程内容本身之外的最大感受就是主办方真的充满热情、诚意满满。每次的课程直播完之后,主讲科科老师都会尽快上传录播,并按照内容分成不同的小视频。“尽快”的意思是,晚上21点30多直播结束,当晚录播就整理并上传到平台了。印象中第一次录播上传并在群里通知大家的时候,已经是国内时间凌晨一点半多了。另外班班也是相当用心了,比如,最后一天结营的时候因为电脑原因录屏失败了,所以她国内时间凌晨二三点自己重录了一次以便上传到平台。重录的时候刚好我没有关直播页面,我这边是晚上八九点,正吃着零食呢,听着电脑里发出异响,还纳闷了好一会。于是就这么成了班班的唯一的观众。
好了,说完了感想,还是把资料汇总一下。以下内容均复制自AI Studio里课程的资料汇总中的不同的帖子,仅是进行了整合以便于查看。此外其实还有更多的课程实例,大家的实践项目,以及很多同学做的详细的课程笔记,可以直接去AI Studio或者相应的链接查看。
- 强化学习7日打卡营-世界冠军带你从零实践
- 伯克利2018 Deep RL课程
- 强化学习库 PARL – 含RLschool/tutorial/这次课的作业答案等
- 经典书籍推荐:《Reinforcement Learning:An Introduction(强化学习导论)》(强化学习教父Richard Sutton 的经典教材)
- 经典理论课程推荐: 2015 David Silver经典强化学习公开课、 UC Berkeley CS285 、斯坦福 CS234
- 强化学习经典论文
- 强化学习前沿研究方向:
Model-base RL、 Hierarchical RL、 Multi Agent RL、 Meta Learning - RL编程实践:GYM
- PARL 对agent的框架抽象
- Pip库安装常见问题:网络超时 (针对国内用户)
解决办法1:使用清华源 -i https://pypi.tuna.tsinghua.edu.cn/simple
解决办法2:https://pypi.org/ 下载whl包或者源码包安装
此外有很多同学做了详细的学习笔记,比如: