Technic

百度2020年6月强化学习打卡营学习感想/资料汇总

2020-06-27 Qingnan

前段时间看到朋友分享的《强化学习7日打卡营-世界冠军带你从零实践》免费课程，第一时间报名参加了。虽然自己也在做RL的研究并做了和RL相关的项目，学习下来还是收获颇丰，温故知新。课程从最基本的PARL环境搭建以及强化学习介绍入手，逐步过渡到RL的经典算法SARSA, Q-Learning, DQN, DDPG的介绍和实例分析，深入浅出，讲解的非常细致。实例分析基本可以说是对核心代码进行“手撕”了，讲解非常细致，相信即便没有RL基础的同学也可以很好地理解。最深刻的印象是课程中使用的例子/比喻都很形象，比如把DQN的Target网络使用原因比喻成用剑射兔子，如果不把兔子固定下来（移动靶），就很难很好的训练。下边附上这个例子的截图，感受下有多形象。

除了课程内容本身之外的最大感受就是主办方真的充满热情、诚意满满。每次的课程直播完之后，主讲科科老师都会尽快上传录播，并按照内容分成不同的小视频。“尽快”的意思是，晚上21点30多直播结束，当晚录播就整理并上传到平台了。印象中第一次录播上传并在群里通知大家的时候，已经是国内时间凌晨一点半多了。另外班班也是相当用心了，比如，最后一天结营的时候因为电脑原因录屏失败了，所以她国内时间凌晨二三点自己重录了一次以便上传到平台。重录的时候刚好我没有关直播页面，我这边是晚上八九点，正吃着零食呢，听着电脑里发出异响，还纳闷了好一会。于是就这么成了班班的唯一的观众。

好了，说完了感想，还是把资料汇总一下。以下内容均复制自AI Studio里课程的资料汇总中的不同的帖子，仅是进行了整合以便于查看。此外其实还有更多的课程实例，大家的实践项目，以及很多同学做的详细的课程笔记，可以直接去AI Studio或者相应的链接查看。

强化学习7日打卡营-世界冠军带你从零实践
伯克利2018 Deep RL课程
强化学习库 PARL – 含RLschool/tutorial/这次课的作业答案等
经典书籍推荐：《Reinforcement Learning：An Introduction（强化学习导论）》（强化学习教父Richard Sutton 的经典教材）
经典理论课程推荐： 2015 David Silver经典强化学习公开课、 UC Berkeley CS285 、斯坦福 CS234
强化学习经典论文
强化学习前沿研究方向：
Model-base RL、 Hierarchical RL、 Multi Agent RL、 Meta Learning
RL编程实践：GYM
PARL 对agent的框架抽象
Pip库安装常见问题：网络超时（针对国内用户）
解决办法1：使用清华源 -i https://pypi.tuna.tsinghua.edu.cn/simple
解决办法2：https://pypi.org/ 下载whl包或者源码包安装

此外有很多同学做了详细的学习笔记，比如：

SQN

百度2020年6月强化学习打卡营学习感想/资料汇总

Related

Leave a Reply Cancel reply

百度2020年6月强化学习打卡营学习感想/资料汇总

Share this:

Related

Leave a Reply Cancel reply