
文章插图
【强化学习同一个学习率的图一样吗】强化学习同一个学习率的图不一样 。监督学习要求训练集和测试集数据分布越相近越好,但是包含的数据不一样,不能把分类任务中的一张图片,同时放到训练集和测试集中,因为实际情况中可能出现训练集不包含的图片,这时要保证监督学习算法具有一定的泛化能力,能够在没见过这张图片的情况下,对其正确处理 。强化学习的目的是优化马尔科夫决策过程中的智能体的策略,每次学习是专门针对一个任务进行的 。因此,不能让强化学习优化好一个走迷宫的任务,然后拿学习好的策略去干其他事,哪怕是让训练好的智能体走一个布局稍有变化的迷宫,效果也会下降 。
以上关于本文的内容,仅作参考!温馨提示:如遇专业性较强的问题(如:疾病、健康、理财等),还请咨询专业人士给予相关指导!
「辽宁龙网」www.liaoninglong.com小编还为您精选了以下内容,希望对您有所帮助:- 学习社交礼仪有什么作用
- 什么是终身学习
- 宁波火车站和高铁站是同一个站吗
- 寻仙上品天星精粹强化什么的
- 学习心得怎么写
- 希望保持这种学习态度后面怎么接
- 怎样学习做奶茶
- 学习通怎么减少观看时长
- 为什么微博搜索不到学习通
- vip陪练的客服是同一个人吗
