自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

qiusuoxiaozi的博客

做独立思考,敢于尝试的研究者!

  • 博客(110)
  • 资源 (13)
  • 收藏
  • 关注

原创 使用sublime text打造一个好用的latex编辑器的姿势

有一个sublime text编辑器安装一个package: LaTeXTools安装完后,试着用sublime打开一个tex文件。修改latextools的设置,配置texpath和sumatra地址。根据个人情况不同想应配置,我的如下: "windows": { // Path used when invoking tex & friends; "&qu

2018-12-24 09:41:41 1699 2

原创 RCNN->SPPnet->Fast RCNN->Faster RCNN的训练数据分配策略

物体检测算法本身训练起来是一个比较繁复的过程,搞懂算法的训练数据分配策略对于理解算法很重要。RCNNRCNN解决检测问题的思路比较粗暴; 先把ImageNet分类网络末层改成21个节点(针对VOC数据),然后finetune一个分类网络当作一个feature extractor。现在想来确实太大材小用了。finetune CNN分类网络,作者采取的数据分配策略是:postive s...

2018-05-12 17:59:34 506

原创 2017 Fall CS294 Lecture 8 Advanced Q-learning algorithms

今天接着上一讲,继续讲value functions相关的内容 先回顾Q-learning。上一讲讲到QϕQϕQ_{\phi}除了tabular的情形之外,用任何function approximator(比如NN),那么算法的收敛性就无法得到保证。但本讲主要讲,怎么在实际中,让算法以较大的概率收敛。两个问题,一个是correlation,另一个是not gradient desce...

2018-03-20 09:43:15 512

原创 2017 Fall CS294 Lecture 7: Value Function Methods

回忆Aπ(st,at)Aπ(st,at)A^\pi(s_t,a_t)的含义,如果使用下述的π′(at|st)π′(at|st)\pi'(a_t|s_t)来取代at∼π(at|st)at∼π(at|st)a_t\sim \pi(a_t|s_t),那么由于π′π′\pi'是取了max的,那么至少不会比ππ\pi要差。那么算法的流程就如右小角的那个图一样,不断的用π′π′\pi'来更新ππ\pi,然后用...

2018-03-20 09:42:46 328

原创 2017 Fall CS294 Lecture 6: Actor-critic introduction

很奇怪,没有看到Lecture 5的视频,不过Lecture 5貌似是回顾NN,也没关系,所以就跳过直接从Lecture 6开始了!我们重现一下actor-critic的诞生过程:上图中,其实PPT中是有动画的,但是上面无法显示出来,实际的推演过程是: Qπ(st,at)=r(st,at)+Est+1∼p(st+1|st,at)[Vπ(st+1)]Qπ(st,at)=r(st,at)...

2018-03-20 09:40:59 395

原创 2017 Fall CS294 Lecture 4: Policy gradients introduction

看完CS294 Lecture 4,感觉收获好多,满满的都是干货啊。太多精华和亮点了,以至于我些笔记都很有压力,我觉得最好的方法就是对照Lecture 4的PPT一页一页地看并理解。我先前有一篇博客My Roadmap in Reinforcement Learning ,Karpathy从直觉的角度阐述了Poliy Gradient的思想,如果从严格的数学形式来理解证明,可以看CS294的l...

2018-03-20 09:40:27 522

原创 码隆科技WebVision2017冠军模型思想

WebVision2017是一个半监督的任务,本文全部提取自码隆科技做的一个讲座ImageNet和WebVision数据集的对比: WebVision数据集: 第一个思想是:Data, model architecture, loss, training strategy都同等重要。 数据不均衡的问题,多的有10000+张,少的只有几百张: 主要的挑战在于noi...

2018-03-19 00:53:41 1379 1

原创 Semantic Segmentation: A thorough Review

语义分割可以划分到目标检测领域,不同的是,一般意义上目标检测只需要输出被检测物体的bounding box,而语义分割则需要输出一个mask,所以要求更高了。从技术上说,语义分割归根结底就是对context information的建模。研究意义语义分割(Semantic Segmentation)的目标是给定一张图片,对于图片中的每一个像素做分类。例如下中给出的原始输入图片,语义...

2018-03-15 14:25:07 1121 1

原创 图像数据的预处理,从'P','RGBA','RGB'多种mode的图像说起

‘P’,’RGBA’,’RGB’这是PIL Image读图可能出现的三种mode,每种mode的图片数据都有不同的组织形式,当训练/测试数据都是一堆图片时,尤其是那种没人帮你清洗的数据时,自己就要留神了,否则模型还没跑起来就给提前自己挖了个坑。首先,先容许我吐槽一下OpenCV的两个抽风,我用的python接口的(估计没怎么维护吧,所以有bug),用cv2.imread读图:对’RGBA’...

2018-03-15 09:23:38 10086 5

原创 怎么让git clone到本地的库更新到github上的版本

最保险的做法如下:# 第一句话,切换到master branchgit checkout master# 第二句话,新建一个branch来备份本地现有的“旧库”,因为一旦git fetch之后本地的数据都会被覆盖git branch new-branch-to-save-current-commits# 第三句话和第四句话就是更新到最新的库(与github上的远程库同步)git fe...

2018-03-13 22:08:57 5555 1

原创 SSD代码中MatchBBox函数的理解

卧了个槽。。这个函数竟然看了我这么久。先把整个函数体摘抄如下:void MatchBBox(const vector<NormalizedBBox>& gt_bboxes, const vector<NormalizedBBox>& pred_bboxes, const int label, const MatchType mat...

2018-03-12 00:42:04 1655 1

原创 做独立思考,敢于尝试的研究者!

今晚实验室年会,聚餐刚回来。回来的路上,龙哥和我们说了一些话,感觉很受启发,所以记录下来。龙哥比我们只大一届,现在已经有了一篇ICIP,一篇PR,一篇ICCV(oral)在手,一篇PAMI在投,感觉真乃神人也。他告诉我们,文章一定要写,一定要敢投,不要怕。文章只有投了才有可能中,不投是永远不可能中的。关于创新方面,不要担心创新性不够,也不要只关注实验结果数字高低,审稿人其实看重的想法是不是

2018-02-02 22:48:15 560

原创 A thorough understanding of on-policy and off-policy in Reinforcement learning

一句话区分on-policy and off-policy: 看behaviour policy和current policy是不是同一个就OK了!我这篇文章主要想借着理解on-policy和off-policy的过程来加深对其他RL算法的认识。因为万事万物总是相互联系的,所以在自己探究,琢磨为什么有些算法是on-policy或者off-policy的过程中,对于它们的本质也有了更深的认识。

2018-01-24 19:57:31 626

原创 The awkward Bellman optimality equation in RL

通过博文2017 Fall CS294 Lecture 6: Actor-critic introduction,一文中插播的Reinforcement Learning: An introduction(Sutton1998)书中的一页截图,对于 Vπ(s)V^\pi(s): the state-value function for policy π\pi. Qπ(s,a)Q^\pi(s,a

2018-01-21 14:29:15 1133

原创 MADDPG翻译

论文全称:Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments 项目地址: https://blog.openai.com/learning-to-cooperate-compete-and-communicate/本文是对MADDPG的翻译,huanghe摘要一, 引言二, 相关工作三...

2018-01-19 10:49:28 29053 21

原创 Python中的Attempted relative import in non-package问题

最近在帮一个伙伴debug的时候发现,在一个package的内部,直接run一个.py文件,会报错说ValueError: Attempted relative import in non-package。原来这是因为,当我run的这个.py文件,如果它在某个package的文件夹下,而且这个.py文件夹内有诸如: from . import from .. import

2018-01-15 10:41:30 21522 4

原创 What in the hell is the AP and mAP?

Average Precision and mean Average Precision

2017-12-18 19:29:52 1575

原创 深度学习炼丹师的养成之路之——Batch size/Epoch/Learning Rate的设置和学习策略

这个名字好长啊。。 但是,考虑到每一次训练都要耗费长达数日的GPU时间,每次启动训练前,细致而缜密的前期准备工作其实非常必要而且至关重要,这直接影响着数日之后的loss和最终的performance。首先推荐的一个文章是前几日看到的,知乎上谭旭的一个回答,谈到了最近facebook的training ImageNet in one hour,比较详细地阐释了batch size的大小对收敛性

2017-11-06 13:34:49 20575 1

原创 深度学习炼丹师的养成之路之——How to subtract the mean value

今天这个文章题目的名字好啰嗦啊,其实主要是为了提醒自己要有“工匠精神”,在深度学习的修炼之路上学会有耐心,慢工出细活。如果到头来只会盲目地堆网络和试参数,这就背离了修炼的正轨了。好了,闲话不多说。今天主要写的是一个关于在transfer learning的时候,需要注意的问题。虽然是一个看似不起眼的细节,但是须知这些小小的细节有时候却能左右DL的learning过程,从而对最后的模型产生潜移默化的影

2017-11-02 21:45:15 2377

原创 SSD: Single Shot MultiBox Detector思想精要&技术细节

一、理解SSD:这大半个月来一直在捣弄SSD。一篇文章在handle一个task的时候,总是有其隐藏在其背后,独特的处理问题的思想,为了避免过目就忘,决定把SSD的思想提炼总结一下,原则就是简而精:往大了看,SSD其实就是由两个subtask构成的。这两个subtask绝大多数时候是相互独立的,各做各的事,自己优化自己,不存在交叉优化或者joint training,可以说是并不相关的。只有在最后t

2017-10-31 15:10:27 570

原创 NMS—非极大值抑制算法

概括NMS的思想(假定是人脸检测bbox NMS): 按照置信度将所有的bbox升序排列(或者降序也行,只是后面的操作都相应改一下)作为一个set,然后: 1. 选取set的最后一个bbox,并将该bbox加入pick集合 2. 将set中该bbox之前的所有bbox与其计算overlap,将那些overlap大于指定threshold的bbox(包括该bbox自己)从set中删除,更新set

2017-10-25 18:30:32 886

原创 Ubuntu之学会从源码编译安装package(无root权限)

Windows下编辑的.sh文件复制到ubuntu下会因为格式的问题而导致运行报错,解决的办法就是使用一款叫做dos2unix的package在ubuntu下将.sh转换成unix的格式。那么要安装dos2unix,可是没有root权限,所有不能直接使用apt-get的方法了,解决的方法是从官网下载源码然后编译安装。 下载源码的网址:https://launchpad.net/ubuntu/...

2017-10-19 21:37:27 3067

原创 pkg-config与多版本opencv安装

想要在服务器上为自己安装一个opencv3.3.0。运行pkg-config --modversion opencv 发现现有的opencv是2.4.8。但是仔细没有找到opencv.lib相关文件。。只在/usr/include下找到了一些头文件。学习pkg-config命令,可以参考下面这个blog http://blog.csdn.net/luotuo44/article/details/2

2017-10-12 10:54:32 7135

原创 TensorFlow之保存/恢复模型

模型保存# save the specific variablessaver = tf.train.Saver(...variables list...)# this will only save trainable variablessaver = tf.train.Saver(tf.trainable_variables()) # this will save all the variabl

2017-10-11 11:29:01 1330

原创 理解Batch Normalization

一直以来对batch normalization的理解都是似懂非懂。在机器学习和深度学习炼丹师的修炼之路上,似懂非懂是一件很危险的事。今天,虽然还是没有能够把谷歌原始的论文好好研读一遍,但是看了一篇很不错的博客,不啰嗦了,也不重复造轮子,链接: https://r2rt.com/implementing-batch-normalization-in-tensorflow.html有一个一直的认识误

2017-09-15 22:18:24 2263 1

原创 Spatial Transfomer Networks

本着不重新造轮子的原则。。链接如下: Deep Learning Paper Implementations: Spatial Transformer Networks - Part I Deep Learning Paper Implementations: Spatial Transformer Networks - Part II

2017-08-29 15:17:34 407 1

原创 烦人的MikTeX

这两天为了做一个实习简历,被MikTeX搞得死去活来,快要疯掉。 现在发现主要原因就是原先安装的MikTeX无法自动获取更新package了,完全失去了MikTeX的存在的意义,自己尝试设置了一下更新没有成功 https://miktex.org/howto/update-miktex-2-9 http://www.jianshu.com/p/5fa9fc0a911f最后卸载旧版的Mik

2017-08-27 18:28:43 13433

原创 My Roadmap in Reinforcement Learning

一、前言前段时间接受导师的建议,学习了一些强化学习和GANs的内容,第一周先看的强化学习,二三周看的GANs。强化学习(RL)是一个很有趣的领域,一直以来也是我很喜欢的一个AI的分支,被誉为是AI皇冠上的明珠,因为通过RL能很直观地反映出“智能”。第一周看完之后有不少收获,当时想着要写一篇博客记录下来,结果一拖再拖… 时至今日,已经是第四周了,本来给自己定的本周计划是入门object tra

2017-08-25 22:34:06 657

原创 Deconvolution/Transposed convolution

老早就琢磨过deconvolution的问题,不过今天又想起这个,发现理解得还是比较模糊,具体就是还是不知道caffe或者tensorflow中实现deconvolution是怎么实现的,刚才看到下面这篇文章https://arxiv.org/ftp/arxiv/papers/1609/1609.07009.pdf里面的两张图一下子就把我的所有疑惑解开了:Fig.2描述的是卷积过程,caffe中的i

2017-08-16 20:01:46 5054

原创 Notes on Tensorflow

保存和恢复模型保存和恢复模型: http://cv-tricks.com/tensorflow-tutorial/save-restore-tensorflow-models-quick-complete-tutorial/区分好variable和tensor灵活利用dir()函数来解析对象的属性和方法tf.layers.dense和tf.layer.cov2d返回的都是tensorflow.py

2017-08-15 14:20:30 571

原创 LeetCode on the way, two sum

完整代码如下使用Hash表(时间复杂度为O(1),但是需要建立Hash表,以空间换时间!)有两种使用Hash表的方法,第一种为:#include <iostream>#include <unordered_map>#include <vector>using namespace std;class Solution{publi...

2017-07-03 00:47:40 280

原创 MinGW在Windows上的安装和环境配置

想在win下搭建C++的开发环境,但是又不喜欢VS的大体量 ,太吃电脑了。幸而发现MinGW,转投之。本着不重复造轮子的原则,我这里就不细写怎么安装配置了,给出下面几个链接,照着做就行了。。(这竟然也是一篇博客,真是服了我自己了)http://blog.csdn.net/shawyeok/article/details/47026257 http://blog.csdn.net/ksksjipen

2017-07-01 19:32:06 726

原创 无法进入ubuntu怎么清理\boot旧版系统内核

这里有一个看起来比较靠谱的答案: You can boot a LiveCD from CD/USB, mount Ubuntu and chroot into it. https://askubuntu.com/questions/641452/brand-new-to-ubuntu-cant-get-into-recovery-mode上面这个解决方案包括在下面这套方案中了: How t

2017-07-01 19:15:25 747

原创 EasyBCD and UEFI

在帮室友装Win10(已装)+Ubuntu16.04双系统时遇到了这个方面的概念问题。 首先先插叙一下,我中途在刻录制作U盘启动盘时,浪费了很多精力,最后发现是自己的.iso文件污染了,MD5值和官方的不同,后来从别人那里又拷贝了一个ubuntu.iso,发现新的.iso使用Win32DiskImager软件生成的MD5和官方给出的MD5值一致当时出现的问题是,我把Ubuntu16.

2017-06-21 13:11:56 33614 8

原创 语义分割中的训练策略和参数设置

下面主要总结一下语义分割和边缘检测中,使用VGG作为base network的论文中,训练参数和策略的情况:

2017-06-20 10:51:23 5953 1

原创 Caffe—Developing New Layer

Developing new layersAdd a class declaration for your layer to include/caffe/layers/your_layer.hpp. Include an inline implementation of type overriding the method virtual inline const char* type() c

2017-06-15 10:08:03 510

原创 Caffe—SigmoidCrossEntropyLossLayer

首先看一下来自CaffeCN的一个帖子(突然发现CaffeCN是一个交流Caffe的好地方) 地址:http://caffecn.cn/?/question/25 截图如下上图之所以要分xnx_n正负讨论是为了让e的指数为负数,以防止溢出。整个表达式对应下面的代码第18行开始template <typename Dtype>void SigmoidCrossEntropyLossLayer<D

2017-06-14 18:34:22 2155 2

原创 General Trainning Strategy in Caffe

首先祭出caffe.proto中对于solver.prototxt的一些参数定义: // The number of iterations for each test net. repeated int32 test_iter = 3; // The number of iterations between two testing phases. optional int32 test_

2017-06-04 14:32:31 403

原创 Using Office2010 for free

首先去msdn itellyou下载office2010,这里要注意的是,由于后面要使用KMS激活,所以只能下载VOL版本的,而不能是Retailed版的,后者KMS不能激活。因为KMS本来就是给大厂定制的批量激活的工具,零售版当然会免疫。 比如我下载的就是下图红线的版本(没有明确标识VOL版本的应该都是Retailed版) http://www.itellyou.cn/?pqncds=t11y

2017-05-31 14:19:28 484

原创 WinEdt, eso-pic.sty not found

http://www.ctan.org/pkg/eso-pichttp://www.cnblogs.com/csucat/p/5142459.html

2017-05-30 00:41:31 1356

PRML 模式识别与机器学习(英文)

PRML 模式识别与机器学习

2017-08-01

Python numpy

直接下载双击即可安装numpy, 免去考虑compile的麻烦。 关于scipy的安装(也比较麻烦)也有类似的软件,具体请见我的blog

2016-04-24

提高matlab代码速度的Tips

To speed up your matlab code, which is downloaded from UFLDL website

2016-04-14

UFLDL exercise9 Convolution and Pooling

In this exercise you will use the features you learned on 8x8 patches sampled from images from the STL-10 dataset in the earlier exercise on linear decoders for classifying images from a reduced STL-10 dataset applying convolution and pooling. The reduced STL-10 dataset comprises 64x64 images from 4 classes (airplane, car, cat, dog).

2016-04-13

UFLDL exercise8 Linear Decoder

In this exercise, you will implement a linear decoder (a sparse autoencoder whose output layer uses a linear activation function). You will then apply it to learn features on color images from the STL-10 dataset. These features will be used in an later exercise on convolution and pooling for classifying STL-10 images.

2016-04-12

UFLDL exercise7 Stacked Autoencoder

In this exercise, you will use a stacked autoencoder for digit classification.

2016-04-11

UFLDL exercise5 Softmax Regression

Softmax Regression, which will be useful in later exercise.

2016-04-11

UFLDL exercise6 Self-Taught Learning

The self-taught learning paradigm with the sparse autoencoder and softmax classifier to build a classifier for handwritten digits.

2016-04-09

UFLDL exercise3&4 PCA and Whitening

里面有两个exercises 分别是PCA, PCA whitening and ZCA whitening in 2D 和 PCA and Whitening on natural images

2016-04-09

UFLDL exercise1 Sparse Autoencoder

已经矢量化了

2016-04-09

UFLDL exercise2 Learn features for handwritten digits

可以参考下载的log.txt文件

2016-04-09

有关图论的ppt

2014年暑期数模培训时老师讲的一些图论的东西,印象深刻。

2016-03-21

stanford CS229 课程讲义

Andrew Ng 主讲 CS229 关于马尔科夫决策过程的课程讲义

2016-03-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除