Technic

百度2020年6月强化学习打卡营学习感想/资料汇总

2020-06-27

前段时间看到朋友分享的《强化学习7日打卡营-世界冠军带你从零实践》免费课程,第一时间报名参加了。虽然自己也在做RL的研究并做了和RL相关的项目,学习下来还是收获颇丰,温故知新。课程从最基本的PARL环境搭建以及强化学习介绍入手,逐步过渡到RL的经典算法SARSA, Q-Learning, DQN, DDPG的介绍和实例分析,深入浅出,讲解的非常细致。实例分析基本可以说是对核心代码进行“手撕”了,讲解非常细致,相信即便没有RL基础的同学也可以很好地理解。最深刻的印象是课程中使用的例子/比喻都很形象,比如把DQN的Target网络使用原因比喻成用剑射兔子,如果不把兔子固定下来(移动靶),就很难很好的训练。下边附上这个例子的截图,感受下有多形象。

除了课程内容本身之外的最大感受就是主办方真的充满热情、诚意满满。每次的课程直播完之后,主讲科科老师都会尽快上传录播,并按照内容分成不同的小视频。“尽快”的意思是,晚上21点30多直播结束,当晚录播就整理并上传到平台了。印象中第一次录播上传并在群里通知大家的时候,已经是国内时间凌晨一点半多了。另外班班也是相当用心了,比如,最后一天结营的时候因为电脑原因录屏失败了,所以她国内时间凌晨二三点自己重录了一次以便上传到平台。重录的时候刚好我没有关直播页面,我这边是晚上八九点,正吃着零食呢,听着电脑里发出异响,还纳闷了好一会。于是就这么成了班班的唯一的观众。

好了,说完了感想,还是把资料汇总一下。以下内容均复制自AI Studio里课程的资料汇总中的不同的帖子,仅是进行了整合以便于查看。此外其实还有更多的课程实例,大家的实践项目,以及很多同学做的详细的课程笔记,可以直接去AI Studio或者相应的链接查看。

此外有很多同学做了详细的学习笔记,比如:

  1. https://blog.csdn.net/qq_39779233/category_10132871.html
  2. https://zhuanlan.zhihu.com/p/149735521

Leave a Reply

Your email address will not be published. Required fields are marked *