自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

微念的博客

等不到天黑,烟火不会太完美。

  • 博客(89)
  • 资源 (6)
  • 收藏
  • 关注

原创 TFLearn之RNN

引子     &a

2018-05-23 10:42:30 1228

原创 关于tf.distributions的那些事儿

引子       在学习各类Machine Learning方法时,免不了要与“分布”打交道。我们有时候需要计算某个分布的熵,有时候需要计算两个分布之间的交叉熵或KL散度。当然,这可以通过使用Numpy中的numpy.random.normal之类的函数来实现,但是我们更希望能够按照TensorFlow计算图的形式来实现,这

2018-10-26 09:56:03 9166 1

原创 关于rand()和srand()

引子        相信大家对于rand()函数并不陌生,我们常用它来生成伪随机数,但是为什么有时候我们生成的随机数并不符合预期呢?或者说,为什么有时候我们生成的随机数并不随机?如何有效地生成伪随机数呢?rand()       

2018-09-04 11:30:39 64955 18

原创 关于VC维的理解

简介        VC维,全称为Vapnik-Chervonenkis Dimension,它反映了模型的学习能力,VC维越大,则模型的容量越大。通俗定义  

2018-06-27 21:16:06 21379 5

原创 关于rospy中图像的实时处理

引子        前一段时间做项目时遇到了一个图像处理的问题,当时的任务是要在ROS中实时地获取图像并作为网络的输入进行前向计算。如果是使用C++的话将没有什么问题,直接获取图像处理就是了,但是如果使用Python的话,就会遇到数据格式的问题。下面我们对此进行简要介绍。rosmsg中的数据格式

2018-06-26 17:31:06 1395

原创 Keras/TFLearn 之 Time Distributed

引子        前段时间写过一篇有关于TFLearn中time_distributed()函数的博客,在这篇博客中,我们提到过这个函数并不能那么直接地实现参数共享。最近看Keras的时候,发现Keras的TimeDistributed() Wrapper却是默认参数共享的。TFLearn ...

2018-06-12 11:35:56 3731

原创 实时绘制机械臂关节速度

引子        我们在做机器人实验的时候,一般需要实时地观察机械臂的各个状态信息,所以动态绘图是不可避免

2018-06-01 11:39:49 4749 2

原创 ROS中getCurrentPose()函数调用时间过长问题的解决方法

引子       &a

2018-05-30 11:42:56 2497 3

原创 TensorFlow之name_scope/variable_scope

引子        前面写过一篇博文《TensorFlow学习笔记(六)》,其内容主要介绍的就是name_scope/variable_scope的使用,不过并没有明确地对

2018-05-26 09:29:44 461

原创 TFLearn之Time Distributed

引子   &a

2018-05-24 12:00:46 6099 6

原创 Linux中的帮助文档

大小写        在Linux环境中,大小写是不一样的东西,date–>ok,Date–>未找到命令,DATE–>未找到命令;         但是,在MacOS下,默认是

2018-05-19 18:14:03 2240

原创 C++中的特殊注释

引子        我们知道,在C++中常用“//”进行单行注释,用“/**/”进行多行注释,那什么是特殊注释?介绍        特殊注释是一些通用的,能够被编译器识别的特殊字符。比如说,我们常用的特殊注释有“

2018-05-19 14:03:05 1142

原创 Python语法糖之@property

引子        今天阅读OpenAI Gym的robotics/robot_env.py时,遇到了@property这个语法糖,因此记录一下,以备下次使用。简介        我们知道,在Python中,

2018-04-26 10:34:31 1305

原创 关于Tensorflow与Gym MuJoCo同时使用的问题

引子        大家好,今天我们稍微介绍一下如何处理TensorFlow与Gym MuJoCo同时使用将会出错的问题。问题        在同时使用TensorFlow-GPU和Gym MuJoCo时,可

2018-04-25 15:47:32 1366

原创 Miniconda + OpenAI Gym + MuJoCo + Tensorflow-gpu

引子        大家好,最近因为实验需要,得搭好一个机械臂的强化学习仿真环境。在去年我基于Ros + Gazebo搭过一个baxter机器人的强化学习环境,但是为了能够与别人的baseline进行对比,所以现在我准备使用OpenAI Gym新发布的Fetch机械臂环境。环境配置 &nbsp...

2018-04-20 19:33:36 3819 12

原创 《Selective Experience Replay for Lifelong Learning》与水塘抽样

引子        最近在调研论文,这个过程中我常常能学到一些好东西,比如本文要聊到的水塘抽样(reservoir sampling)。         先大致说明一下论文要解决的问题以及想法。 &nbs

2018-04-01 17:47:40 952

原创 Python对象序列化

引言        我们知道在Python中,一切皆为对象,实例是对象,类是对象,元类也是对象。本文正是要聊聊如何将这些对象有效地保存起来,以供后续使用。pickle与cPickle        pickl

2018-03-22 11:23:21 6150

原创 numpy.newaxis的使用

作用        numpy.newaxis从字面上来理解就是用来创建新轴的,或者说是用来对array进行维度扩展的。举例>>> import numpy as np>>> x = np.array([1, 2, 3, 4])>>

2018-03-21 01:03:53 10970 1

原创 关于Python中*与**的区别与使用

(*)与(**)的区别        一个星(*)表示将参数作为元组来处理;两个星(**)表示将参数作为字典来处理。实例a)在函数参数列表中使用        在函数参数列表中使用*或者**表示将调用时传

2018-03-19 13:01:59 1841

原创 说一说\r与\n

动机        今天在用Python读取txt文件的时候,遇到了一个比较坑的问题,那就是“\n”和“\r”究竟有什么区别?”历史        在计算机还没有出现之前,人们设计了一种机器叫做电传打字机,这种机

2018-03-18 21:53:46 13000

原创 Anaconda + TensorFlow

更新Anaconda        当我正兴致勃勃地输入:$ conda create -n tensorflow python=2.7        conda告诉我说,你需要更新conda啦~那更新就更新

2018-03-18 00:15:21 889

原创 浅说Anaconda

动机        在我对MacOS进行更新之后,我的TensorFlow不能用了。整了半天,感觉自己把电脑整得很乱了,于是我想到了备受夸赞的Anaconda。安装与卸载        我是在MacOS Si

2018-03-17 19:30:32 1100

原创 关于tf.stop_gradient的使用及理解

        写这篇文章的原因是今天有人问我,DQN中为什么要对q_target进行stop_gradient啊?    &a

2018-03-17 10:42:00 43692 10

原创 k近邻法的实现:kd树

k近邻法(k-NN)        k近邻法并没有显式的训练过程,对于某个新的实例,根据其k个最近邻的训练实例的类别,通过多数表决等方式进行预测。换句话说,其本质就是利用训练数据集对特征向量空间进行划分。        &nbs

2018-03-16 17:31:47 300

原创 LeetCode(12):longest-consecutive-sequence

题目描述    Given an unsorted array of integers, find the length of the longest consecutive elements sequence.     For example, Given [100, 4, 200, 1, 3, 2], The...

2018-03-15 21:59:08 258

原创 关于Novikoff定理与感知机算法的收敛性

感知机模型       感知机是一种二类分类的线性模型,它是由误分类驱动的,属于判别模型。说白了,它的实质就是输入空间或特征空间中的一个分离超平面。        《统计学习方法》中的定义: 学习策略 &n

2018-03-15 12:18:18 4233 6

原创 Ubuntu14.04 + Python3.4.3 + OpenCV3.1.0的安装配置

       本文主要介绍在配置OpenCV3.1.0中的几个坑。如何设置cmake Python3       因为我没有使用Anaconda,所以,cmake将会检测到两个版本的python,而cmake倾向于使用低版本的python,也就是会

2018-03-15 10:30:16 432

原创 关于baselines示例程序train_cartpole.py的ImportError

问题导出       为了更方便地实现自己的一些想法,我最终还是向OpenAI的baselines屈服了,因为自己的一些实现总是难与各大论文给出的结果进行对比。于是我今天安装了baselines,其中还是有一些坑的,这里主要介绍在安装完成之后,运行示例时cartpole.py所遇到的坑,它叫做ImportError。...

2018-03-14 11:41:24 1640

原创 LeetCode(11):single-number-ii

题目描述       Given an array of integers, every element appears three times except for one. Find that single one.       Note: Your algorithm should have a linear runtime complexity. Could you implement i...

2018-03-13 17:34:32 174

原创 LeetCode(10):single-number

题目描述       Given an array of integers, every element appears twice except for one. Find that single one.       Note: Your algorithm should have a linear runtime complexity. Could you implement it with...

2018-03-13 10:44:18 157

原创 关于Hoeffding不等式及泛化误差上界

       在监督学习中,我们通常会定义一个目标函数来衡量模型的好坏,定义一个风险函数从而计算模型预测结果与真实值之间的误差是一种惯用手段。一般而言,我们将考虑训练集上的训练误差和测试集上的泛化误差,事实上,训练误差的持续降低并不是那么令人愉快,因为这可能是“过拟合”在背后操纵着一切。总的来说,只有泛化误差的降低才能真的让人感觉美滋滋。       如果给我们一个模型,我们该从什么方面去降低泛化...

2018-03-12 15:11:02 5828 6

原创 LeetCode(9):copy-list-with-random-pointer

题目描述      A linked list is given such that each node contains an additional random pointer which could point to any node in the list or null.       Return a deep copy of the list.思考      本题在传统链表节点的结构体...

2018-03-11 13:03:20 175

原创 LeetCode(8):word-break

题目描述      Given a string s and a dictionary of words dict, determine if s can be segmented into a space-separated sequence of one or more dictionary words.       For example, given s ="leetcode", dict...

2018-03-07 22:44:18 385

原创 Python每日小结(十三)之 unexpected indent

      本文讲一下常见的IndentatinoError: unexpected indent。      在写代码时,尤其是在复制粘贴一段代码时,常常会遇到上面的这种错误,主要原因是原始代码用的缩进方式与我们后面修改时的缩进方式不一致造成的。这个时候一些可以查看缩进方式的编辑器就很有帮助了,比如Sublime Text:      仔细观察上面的图,最后一行前面先有几个小点,然后才是一段一段...

2018-03-05 19:27:40 1383

原创 LeetCode(7):linked-list-cycle-ii

题目描述       Given a linked list, return the node where the cycle begins. If there is no cycle, return null.       Follow up: Can you solve this without using extra space?思考       在《LeetCode(6):linked-l...

2018-03-05 10:29:30 195

原创 LeetCode(6):linked-list-cycle

题目描述       Given a linked list, determine if it has a cycle in it.       Follow up: Can you solve it without using extra space?思考       看到这道题的第一眼其实是有点懵的,怎么样知道一个链表是否有环呢?显然我们不能简单地用某个指针q遍历链表,然后看是不是有q-&gt...

2018-03-05 01:22:07 148

原创 LeetCode(5):reorder-list

题目描述       Given a singly linked list L: L 0→L 1→…→L n-1→L n, reorder it to: L 0→L n →L 1→L n-1→L 2→L n-2→…       You must do this in-place without altering the nodes' values.       For example, Given...

2018-03-04 20:45:29 195

原创 LeetCode(4):binary-tree-preorder-traversal

题目描述       Given a binary tree, return the preorder traversal of its nodes' values.思考      昨天在《binary-tree-preorder-traversal》中我们讲到了二叉树的后根序遍历,其中我们聊了如何使用递归方法和非递归方法解题,这里的前根序遍历也有这两种解法。      递归:/** * Def...

2018-03-04 13:43:15 122

原创 LeetCode(3):binary-tree-postorder-traversal

题目描述       Given a binary tree, return the postorder traversal of its nodes' values.思考       本题考查的是对于后序遍历的理解。后序遍历,全称叫做“后根序遍历”,即先遍历左子树,再遍历右子树,最后遍历根节点的遍历方式。对于二叉树的遍历,很容易想到的解决方法是递归,当然,我们也可以考考自己,尝试着用迭代的方法实...

2018-03-03 11:14:13 523

原创 David Silver强化学习课程笔记(八)(下)

第八课(下):基于Simulation的搜索方法        在《第八课(上):学习与规划的结合》中,我们讲到了Model-Based RL方法,在该方法中,我们首先拟合得到一个模型,然后可以利用各种规划方法进行规划,或者,可以引申出Sample-Based Planning,也即我们并不是去采用贝尔曼方程计算,而是用模型进行采样,然后利用Model-Free方法进行学习。本文中要讲的Simul...

2018-03-02 22:59:23 1815

David Silver强化学习课程课件

该资源是David Silver的强化学习课程所对应的ppt。 该资源是David Silver的强化学习课程所对应的ppt。 该资源是David Silver的强化学习课程所对应的ppt。

2018-05-23

DQN实现的两种版本

关于DQN的两种版本(使用stop_gradient与不使用stop_gradient) 对不起.....我不知道怎么将文件放到CSDN博客中下载,所以只能放这边了,没有资源分为0的选项.....

2018-03-17

引导策略搜索介绍 - GPS

简要介绍了论文《Guided Policy Search》,包括DDP,重要性采样等。 简要介绍了论文《Guided Policy Search》,包括DDP,重要性采样等。 简要介绍了论文《Guided Policy Search》,包括DDP,重要性采样等。

2017-11-24

Batch Normalization简介

对Batch Normalization论文进行了解读,用通俗的视角理解Batch Normalization。 对Batch Normalization论文进行了解读,用通俗的视角理解Batch Normalization。 对Batch Normalization论文进行了解读,用通俗的视角理解Batch Normalization。

2017-11-24

机器人中的强化学习技术

简要介绍了强化学习在机器人方向上的挑战以及可行性方法。 简要介绍了强化学习在机器人方向上的挑战以及可行性方法。 简要介绍了强化学习在机器人方向上的挑战以及可行性方法。

2017-11-24

贝叶斯线性回归 - Bayes

介绍了极大似然、最大后验、贝叶斯估计以及贝叶斯线性回归方法。 介绍了极大似然、最大后验、贝叶斯估计以及贝叶斯线性回归方法。 介绍了极大似然、最大后验、贝叶斯估计以及贝叶斯线性回归方法。

2017-11-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除