彩虹极光-CSDN博客

原创坚持学习 -- 强化学习（3）

莫烦强化学习课程的小例子探索值搜寻宝藏，一维地图，方向只有左右。不断尝试，找到最短的路径。运行效果：按视频写的代码：详细内容请参考莫烦Python：https://mofanpy.com/tutorials/machine-learning/reinforcement-learning/general-rl/ ...

2021-08-24 13:40:44 74

Q-Learning (1). 什么是Q-Learning : Q-Learning是一种决策过程，选择潜在奖励大的行为。本次行为选择后，产生下一次状态。根据Q-table中的状态（s1,s2,s3...）选择相应的奖励值（R）较大的行为（a1,a2,a3...）。 (2). 此处有两个值需要注意：估计值和现实值。估计值: 当到达某一状态(s1)，根据Q-table估计下一步的行为是奖励值较大的行为（a2）。也就是估计出的Q值是Q(s1,a2) 现实值...

2021-08-24 13:11:13 116

原创坚持学习 -- 强化学习（1）

萌新一枚，目前研究V2X。最近想要探索一下人工智能领域，各种网站寻找资源，最后选定莫烦大神的课程。毕竟是从头学习，没有一点基础，想要凭借平台记录自己的学习点滴，当做一种笔记形式。第一步想要先学习 Reinforcement Learning 强化学习。以下是第一次课堂笔记。强化学习概念：是一类算法，使计算机能够从无到有，不断试错不断学习最后找到达到目标的过程。强化学习方法分类：按分类标准不同的分类详情内容参考莫烦Python：https://mofanpy.com.

2021-08-24 10:26:57 173

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_42374915的博客

原创坚持学习 -- 强化学习（3）

原创坚持学习 -- 强化学习（2）

原创坚持学习 -- 强化学习（1）

空空如也

空空如也

原创 坚持学习 -- 强化学习（3）

原创 坚持学习 -- 强化学习（2）

原创 坚持学习 -- 强化学习（1）

空空如也

空空如也

原创坚持学习 -- 强化学习（3）

原创坚持学习 -- 强化学习（2）

原创坚持学习 -- 强化学习（1）