自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 坚持学习 -- 强化学习(3)

莫烦强化学习课程的小例子 探索值搜寻宝藏,一维地图,方向只有左右。不断尝试,找到最短的路径。 运行效果: 按视频写的代码: 详细内容请参考莫烦Python:https://mofanpy.com/tutorials/machine-learning/reinforcement-learning/general-rl/ ...

2021-08-24 13:40:44 74

原创 坚持学习 -- 强化学习(2)

Q-Learning (1). 什么是Q-Learning : Q-Learning是一种决策过程,选择潜在奖励大的行为。本次行为选择后,产生下一次状态。 根据Q-table中的状态(s1,s2,s3...)选择相应的奖励值(R)较大的行为(a1,a2,a3...)。 (2). 此处有两个值需要注意:估计值和现实值。 估计值: 当到达某一状态(s1),根据Q-table估计下一步的行为是奖励值较大的行为(a2)。也就是估计出的Q值是Q(s1,a2) 现实值...

2021-08-24 13:11:13 116

原创 坚持学习 -- 强化学习(1)

萌新一枚,目前研究V2X。 最近想要探索一下人工智能领域,各种网站寻找资源,最后选定莫烦大神的课程。 毕竟是从头学习,没有一点基础,想要凭借平台记录自己的学习点滴,当做一种笔记形式。 第一步想要先学习 Reinforcement Learning 强化学习。 以下是第一次课堂笔记。 强化学习概念: 是一类算法,使计算机能够从无到有,不断试错不断学习最后找到达到目标的过程。 强化学习方法分类:按分类标准不同的分类 详情内容参考莫烦Python:https://mofanpy.com.

2021-08-24 10:26:57 173

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除