- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 gym库中CartPole-v0环境代码详解
代码源码在gym\envs\classic_control\cartpole中。当agent完成任务或任务失败后将环境重置为初始状态,以便进行新一轮训练。 接受agent的动作、计算下一时刻状态和奖励、检查任务是否已完成。针对源码的详细解释都备注在下方代码块具体程序里。随机数生成器,以便在实验中获得可重复的结果。用于可视化环境状态,一般直接调用就行。
2023-10-28 16:38:59 394 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人