自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

初学者

Wubba Lubba Dub Dub

  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 个人笔记使用(wolai,OneNote)

笔记工具:wolai,OneNote,PDF阅读器,以及wordwolai记完笔记之后如果有再次查阅需求的话,wolai用起来就很不舒服。同屏下不能多页显示,笔记之间切换需要等待加载时间。相比之下查阅PDF文件就会舒服很多,同屏多页显示,利用搜索和索引检索,不能轻易修改内容(鼠标可随意拖拽不用担心误操作),可标注……记笔记OneNote的使用是辅助自己理解更复杂的内容,比如某一个算法,利用辅助线、图片以及文字描述 在一个屏幕下将它们的逻辑关系 提炼出来,一目了然,再次查看尽可能快的回忆起内容,减轻

2021-11-26 15:19:38 1769 2

原创 重要性采样(强化学习)

一点个人看法表达,针对强化学习应用1. 首先看以下资料【强化学习】随便说说重要性采样(Importance Sampling)_哔哩哔哩_bilibili虽然好像是一个很trivial的问题,但是在网上没有看到很好的解释,发个视频整理一下自己的理解,希望是对的233第一次录视频实在太难了QAQhttps://www.bilibili.com/video/BV1NK4y1s77S?from=search&seid=1677344818426392139&spm_id_from=333.

2021-11-24 21:48:28 714

原创 [回顾]windows安装mujoco200

主要步骤先装最新的mujoco-py 下载mujoco200 放到user下自己新建的.mujoco目录。并将mjkey文件放进同一个目录。 最后配置环境变量番:中间有过搭建虚拟环境失败、mujoco200文件存放位置错误、配置环境错误……简单记录,有具体请留言...

2021-11-18 18:36:47 1083

原创 (已解决)untimeError: nms is not compiled with GPU support

我报错的原因是 mmdet版本 和 mmcv 版本不匹配。解决办法。step1:大家按照网上的教程 克隆完mmdetection文件夹后,使用下面语句检查一下版本。import mmdetprint(mmdet.**version**)step2:去找到类似如下图的版本对应表。如果你是从open-mmlab克隆,mmcv可以用最高版本。其他则根据表格找到对应版本安装。(我出错原因就在这里。克隆mmdetection版本是2.5,而安装的mmcv是1.3.5,导致不适配。).

2021-06-08 16:44:41 1460

原创 【shusen wang】【笔记】深度强化学习(2/5):价值学习

1,价值函数一张图回忆一下动作价值函数公式。2,DQN(Deep Q-Network)输入状态利用Q*来输出最佳动作。Q*从何而来?这里用神经网络学习近似得到一个Q*。(感性认识:Q*如果看作给所有动作打分的话,神经网络就要学习打分如何打的越来越准)3,TD learning(Tempor Difference)-1,正常情况下如何训练一个神经网络:例1: 导航模型预测NYC到atlanta需要1000分钟,实际测试是860分钟。预测值...

2021-03-29 20:04:04 185

原创 【shusen wang】【课后笔记】深度强化学习(1/5):基本概念

1、state and action-当前游戏画面 看作状态。输入当前画面得出动作,环境更新状态,并返回智能体奖励值,如此往复。-发出动作的主体即为智能体(agent)2、policy π-用处?观察当前状态,决定agent动作a。-图片中1:动作A若不确定,π就是概率密度函数。-图片中2:A确定后,π有固定值,表示为该状态s下选取动作a的概率值。-图片中3:状态s下,有多种动作a可供选择,例如2中有向左、向右、向上。依据他们的概率进行随机抽样。(并不是选择概率最高的动作,随机抽

2021-03-29 16:37:20 386

原创 jupyter导出PDF文件

谷歌浏览器,右键,打印,另存为PDF,格式自选。

2020-10-21 21:56:08 555

合肥师范学院计算机专业毕业设计、论文范文、撰写规则、文本模板

合肥师范学院计算机专业毕业设计、论文范文、撰写规则、文本模板。用于毕业考生的论文编写参考,并无涉及别人知识产权,只是简单地总结了规则,以作参考。

2020-04-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除