qiusuoxiaozi-CSDN博客

原创使用sublime text打造一个好用的latex编辑器的姿势

有一个sublime text编辑器安装一个package: LaTeXTools安装完后，试着用sublime打开一个tex文件。修改latextools的设置，配置texpath和sumatra地址。根据个人情况不同想应配置，我的如下： &quot;windows&quot;: { // Path used when invoking tex &amp;amp; friends; &quot;&qu

2018-12-24 09:41:41 1699 2

原创 RCNN->SPPnet->Fast RCNN->Faster RCNN的训练数据分配策略

物体检测算法本身训练起来是一个比较繁复的过程，搞懂算法的训练数据分配策略对于理解算法很重要。RCNNRCNN解决检测问题的思路比较粗暴；先把ImageNet分类网络末层改成21个节点（针对VOC数据），然后finetune一个分类网络当作一个feature extractor。现在想来确实太大材小用了。finetune CNN分类网络，作者采取的数据分配策略是：postive s...

2018-05-12 17:59:34 506

原创 2017 Fall CS294 Lecture 8 Advanced Q-learning algorithms

今天接着上一讲，继续讲value functions相关的内容先回顾Q-learning。上一讲讲到QϕQϕQ_{\phi}除了tabular的情形之外，用任何function approximator（比如NN），那么算法的收敛性就无法得到保证。但本讲主要讲，怎么在实际中，让算法以较大的概率收敛。两个问题，一个是correlation，另一个是not gradient desce...

2018-03-20 09:43:15 512

原创 2017 Fall CS294 Lecture 7: Value Function Methods

2018-03-20 09:42:46 328

原创 2017 Fall CS294 Lecture 6: Actor-critic introduction

很奇怪，没有看到Lecture 5的视频，不过Lecture 5貌似是回顾NN，也没关系，所以就跳过直接从Lecture 6开始了！我们重现一下actor-critic的诞生过程:上图中，其实PPT中是有动画的，但是上面无法显示出来，实际的推演过程是： Qπ(st,at)=r(st,at)+Est+1∼p(st+1|st,at)[Vπ(st+1)]Qπ(st,at)=r(st,at)...

2018-03-20 09:40:59 395

原创 2017 Fall CS294 Lecture 4: Policy gradients introduction

看完CS294 Lecture 4，感觉收获好多，满满的都是干货啊。太多精华和亮点了，以至于我些笔记都很有压力，我觉得最好的方法就是对照Lecture 4的PPT一页一页地看并理解。我先前有一篇博客My Roadmap in Reinforcement Learning ，Karpathy从直觉的角度阐述了Poliy Gradient的思想，如果从严格的数学形式来理解证明，可以看CS294的l...

2018-03-20 09:40:27 522

原创码隆科技WebVision2017冠军模型思想

WebVision2017是一个半监督的任务，本文全部提取自码隆科技做的一个讲座ImageNet和WebVision数据集的对比： WebVision数据集：第一个思想是：Data, model architecture, loss, training strategy都同等重要。数据不均衡的问题，多的有10000+张，少的只有几百张：主要的挑战在于noi...

2018-03-19 00:53:41 1379 1

原创 Semantic Segmentation: A thorough Review

语义分割可以划分到目标检测领域，不同的是，一般意义上目标检测只需要输出被检测物体的bounding box，而语义分割则需要输出一个mask，所以要求更高了。从技术上说，语义分割归根结底就是对context information的建模。研究意义语义分割（Semantic Segmentation）的目标是给定一张图片，对于图片中的每一个像素做分类。例如下中给出的原始输入图片，语义...

2018-03-15 14:25:07 1121 1

原创图像数据的预处理，从'P','RGBA','RGB'多种mode的图像说起

‘P’,’RGBA’,’RGB’这是PIL Image读图可能出现的三种mode，每种mode的图片数据都有不同的组织形式，当训练/测试数据都是一堆图片时，尤其是那种没人帮你清洗的数据时，自己就要留神了，否则模型还没跑起来就给提前自己挖了个坑。首先，先容许我吐槽一下OpenCV的两个抽风，我用的python接口的（估计没怎么维护吧，所以有bug），用cv2.imread读图：对’RGBA’...

2018-03-15 09:23:38 10086 5

原创怎么让git clone到本地的库更新到github上的版本

最保险的做法如下：# 第一句话，切换到master branchgit checkout master# 第二句话，新建一个branch来备份本地现有的“旧库”，因为一旦git fetch之后本地的数据都会被覆盖git branch new-branch-to-save-current-commits# 第三句话和第四句话就是更新到最新的库（与github上的远程库同步）git fe...

2018-03-13 22:08:57 5555 1

原创 SSD代码中MatchBBox函数的理解

卧了个槽。。这个函数竟然看了我这么久。先把整个函数体摘抄如下：void MatchBBox(const vector<NormalizedBBox>& gt_bboxes, const vector<NormalizedBBox>& pred_bboxes, const int label, const MatchType mat...

2018-03-12 00:42:04 1655 1

原创做独立思考，敢于尝试的研究者！

今晚实验室年会，聚餐刚回来。回来的路上，龙哥和我们说了一些话，感觉很受启发，所以记录下来。龙哥比我们只大一届，现在已经有了一篇ICIP，一篇PR，一篇ICCV(oral)在手，一篇PAMI在投，感觉真乃神人也。他告诉我们，文章一定要写，一定要敢投，不要怕。文章只有投了才有可能中，不投是永远不可能中的。关于创新方面，不要担心创新性不够，也不要只关注实验结果数字高低，审稿人其实看重的想法是不是

2018-02-02 22:48:15 560

原创 A thorough understanding of on-policy and off-policy in Reinforcement learning

一句话区分on-policy and off-policy：看behaviour policy和current policy是不是同一个就OK了！我这篇文章主要想借着理解on-policy和off-policy的过程来加深对其他RL算法的认识。因为万事万物总是相互联系的，所以在自己探究，琢磨为什么有些算法是on-policy或者off-policy的过程中，对于它们的本质也有了更深的认识。

2018-01-24 19:57:31 626

原创 The awkward Bellman optimality equation in RL

通过博文2017 Fall CS294 Lecture 6: Actor-critic introduction，一文中插播的Reinforcement Learning: An introduction(Sutton1998)书中的一页截图，对于 Vπ(s)V^\pi(s): the state-value function for policy π\pi. Qπ(s,a)Q^\pi(s,a

2018-01-21 14:29:15 1133

原创 MADDPG翻译

论文全称：Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments 项目地址： https://blog.openai.com/learning-to-cooperate-compete-and-communicate/本文是对MADDPG的翻译，huanghe摘要一，引言二，相关工作三...

2018-01-19 10:49:28 29053 21

原创 Python中的Attempted relative import in non-package问题

最近在帮一个伙伴debug的时候发现，在一个package的内部，直接run一个.py文件，会报错说ValueError: Attempted relative import in non-package。原来这是因为，当我run的这个.py文件，如果它在某个package的文件夹下，而且这个.py文件夹内有诸如： from . import from .. import

2018-01-15 10:41:30 21522 4

原创 What in the hell is the AP and mAP?

Average Precision and mean Average Precision

2017-12-18 19:29:52 1575

原创深度学习炼丹师的养成之路之——Batch size/Epoch/Learning Rate的设置和学习策略

这个名字好长啊。。但是，考虑到每一次训练都要耗费长达数日的GPU时间，每次启动训练前，细致而缜密的前期准备工作其实非常必要而且至关重要，这直接影响着数日之后的loss和最终的performance。首先推荐的一个文章是前几日看到的，知乎上谭旭的一个回答，谈到了最近facebook的training ImageNet in one hour，比较详细地阐释了batch size的大小对收敛性

2017-11-06 13:34:49 20575 1

原创深度学习炼丹师的养成之路之——How to subtract the mean value

今天这个文章题目的名字好啰嗦啊，其实主要是为了提醒自己要有“工匠精神”，在深度学习的修炼之路上学会有耐心，慢工出细活。如果到头来只会盲目地堆网络和试参数，这就背离了修炼的正轨了。好了，闲话不多说。今天主要写的是一个关于在transfer learning的时候，需要注意的问题。虽然是一个看似不起眼的细节，但是须知这些小小的细节有时候却能左右DL的learning过程，从而对最后的模型产生潜移默化的影

2017-11-02 21:45:15 2377

原创 SSD: Single Shot MultiBox Detector思想精要&技术细节

一、理解SSD：这大半个月来一直在捣弄SSD。一篇文章在handle一个task的时候，总是有其隐藏在其背后，独特的处理问题的思想，为了避免过目就忘，决定把SSD的思想提炼总结一下，原则就是简而精：往大了看，SSD其实就是由两个subtask构成的。这两个subtask绝大多数时候是相互独立的，各做各的事，自己优化自己，不存在交叉优化或者joint training，可以说是并不相关的。只有在最后t

2017-10-31 15:10:27 570

原创 NMS—非极大值抑制算法

概括NMS的思想（假定是人脸检测bbox NMS）：按照置信度将所有的bbox升序排列（或者降序也行，只是后面的操作都相应改一下）作为一个set，然后： 1. 选取set的最后一个bbox，并将该bbox加入pick集合 2. 将set中该bbox之前的所有bbox与其计算overlap，将那些overlap大于指定threshold的bbox（包括该bbox自己）从set中删除，更新set

2017-10-25 18:30:32 886

原创 Ubuntu之学会从源码编译安装package（无root权限）

Windows下编辑的.sh文件复制到ubuntu下会因为格式的问题而导致运行报错，解决的办法就是使用一款叫做dos2unix的package在ubuntu下将.sh转换成unix的格式。那么要安装dos2unix，可是没有root权限，所有不能直接使用apt-get的方法了，解决的方法是从官网下载源码然后编译安装。下载源码的网址：https://launchpad.net/ubuntu/...

2017-10-19 21:37:27 3067

原创 pkg-config与多版本opencv安装

想要在服务器上为自己安装一个opencv3.3.0。运行pkg-config --modversion opencv 发现现有的opencv是2.4.8。但是仔细没有找到opencv.lib相关文件。。只在/usr/include下找到了一些头文件。学习pkg-config命令，可以参考下面这个blog http://blog.csdn.net/luotuo44/article/details/2

2017-10-12 10:54:32 7135

原创 TensorFlow之保存/恢复模型

模型保存# save the specific variablessaver = tf.train.Saver(...variables list...)# this will only save trainable variablessaver = tf.train.Saver(tf.trainable_variables()) # this will save all the variabl

2017-10-11 11:29:01 1330

原创理解Batch Normalization

一直以来对batch normalization的理解都是似懂非懂。在机器学习和深度学习炼丹师的修炼之路上，似懂非懂是一件很危险的事。今天，虽然还是没有能够把谷歌原始的论文好好研读一遍，但是看了一篇很不错的博客，不啰嗦了，也不重复造轮子，链接： https://r2rt.com/implementing-batch-normalization-in-tensorflow.html有一个一直的认识误

2017-09-15 22:18:24 2263 1

原创 Spatial Transfomer Networks

本着不重新造轮子的原则。。链接如下： Deep Learning Paper Implementations: Spatial Transformer Networks - Part I Deep Learning Paper Implementations: Spatial Transformer Networks - Part II

2017-08-29 15:17:34 407 1

原创烦人的MikTeX

这两天为了做一个实习简历，被MikTeX搞得死去活来，快要疯掉。现在发现主要原因就是原先安装的MikTeX无法自动获取更新package了，完全失去了MikTeX的存在的意义，自己尝试设置了一下更新没有成功 https://miktex.org/howto/update-miktex-2-9 http://www.jianshu.com/p/5fa9fc0a911f最后卸载旧版的Mik

2017-08-27 18:28:43 13433

原创 My Roadmap in Reinforcement Learning

一、前言前段时间接受导师的建议，学习了一些强化学习和GANs的内容，第一周先看的强化学习，二三周看的GANs。强化学习（RL）是一个很有趣的领域，一直以来也是我很喜欢的一个AI的分支，被誉为是AI皇冠上的明珠，因为通过RL能很直观地反映出“智能”。第一周看完之后有不少收获，当时想着要写一篇博客记录下来，结果一拖再拖… 时至今日，已经是第四周了，本来给自己定的本周计划是入门object tra

2017-08-25 22:34:06 657

原创 Deconvolution/Transposed convolution

老早就琢磨过deconvolution的问题，不过今天又想起这个，发现理解得还是比较模糊，具体就是还是不知道caffe或者tensorflow中实现deconvolution是怎么实现的，刚才看到下面这篇文章https://arxiv.org/ftp/arxiv/papers/1609/1609.07009.pdf里面的两张图一下子就把我的所有疑惑解开了：Fig.2描述的是卷积过程，caffe中的i

2017-08-16 20:01:46 5054

原创 Notes on Tensorflow

保存和恢复模型保存和恢复模型： http://cv-tricks.com/tensorflow-tutorial/save-restore-tensorflow-models-quick-complete-tutorial/区分好variable和tensor灵活利用dir()函数来解析对象的属性和方法tf.layers.dense和tf.layer.cov2d返回的都是tensorflow.py

2017-08-15 14:20:30 571

原创 LeetCode on the way, two sum

完整代码如下使用Hash表（时间复杂度为O(1)，但是需要建立Hash表，以空间换时间！）有两种使用Hash表的方法，第一种为：#include <iostream>#include <unordered_map>#include <vector>using namespace std;class Solution{publi...

2017-07-03 00:47:40 280

原创 MinGW在Windows上的安装和环境配置

想在win下搭建C++的开发环境，但是又不喜欢VS的大体量，太吃电脑了。幸而发现MinGW，转投之。本着不重复造轮子的原则，我这里就不细写怎么安装配置了，给出下面几个链接，照着做就行了。。（这竟然也是一篇博客，真是服了我自己了）http://blog.csdn.net/shawyeok/article/details/47026257 http://blog.csdn.net/ksksjipen

2017-07-01 19:32:06 726

原创无法进入ubuntu怎么清理\boot旧版系统内核

这里有一个看起来比较靠谱的答案： You can boot a LiveCD from CD/USB, mount Ubuntu and chroot into it. https://askubuntu.com/questions/641452/brand-new-to-ubuntu-cant-get-into-recovery-mode上面这个解决方案包括在下面这套方案中了： How t

2017-07-01 19:15:25 747

原创 EasyBCD and UEFI

在帮室友装Win10（已装）+Ubuntu16.04双系统时遇到了这个方面的概念问题。首先先插叙一下，我中途在刻录制作U盘启动盘时，浪费了很多精力，最后发现是自己的.iso文件污染了，MD5值和官方的不同，后来从别人那里又拷贝了一个ubuntu.iso，发现新的.iso使用Win32DiskImager软件生成的MD5和官方给出的MD5值一致当时出现的问题是，我把Ubuntu16.

2017-06-21 13:11:56 33614 8

原创语义分割中的训练策略和参数设置

下面主要总结一下语义分割和边缘检测中，使用VGG作为base network的论文中，训练参数和策略的情况：

2017-06-20 10:51:23 5953 1

原创 Caffe—Developing New Layer

Developing new layersAdd a class declaration for your layer to include/caffe/layers/your_layer.hpp. Include an inline implementation of type overriding the method virtual inline const char* type() c

2017-06-15 10:08:03 510

原创 Caffe—SigmoidCrossEntropyLossLayer

首先看一下来自CaffeCN的一个帖子（突然发现CaffeCN是一个交流Caffe的好地方）地址：http://caffecn.cn/?/question/25 截图如下上图之所以要分xnx_n正负讨论是为了让e的指数为负数，以防止溢出。整个表达式对应下面的代码第18行开始template <typename Dtype>void SigmoidCrossEntropyLossLayer<D

2017-06-14 18:34:22 2155 2

原创 General Trainning Strategy in Caffe

首先祭出caffe.proto中对于solver.prototxt的一些参数定义： // The number of iterations for each test net. repeated int32 test_iter = 3; // The number of iterations between two testing phases. optional int32 test_

2017-06-04 14:32:31 403

原创 Using Office2010 for free

首先去msdn itellyou下载office2010，这里要注意的是，由于后面要使用KMS激活，所以只能下载VOL版本的，而不能是Retailed版的，后者KMS不能激活。因为KMS本来就是给大厂定制的批量激活的工具，零售版当然会免疫。比如我下载的就是下图红线的版本（没有明确标识VOL版本的应该都是Retailed版） http://www.itellyou.cn/?pqncds=t11y

2017-05-31 14:19:28 484

原创 WinEdt, eso-pic.sty not found

http://www.ctan.org/pkg/eso-pichttp://www.cnblogs.com/csucat/p/5142459.html

2017-05-30 00:41:31 1356

PRML 模式识别与机器学习（英文）

PRML 模式识别与机器学习

2017-08-01

Python numpy

直接下载双击即可安装numpy，免去考虑compile的麻烦。关于scipy的安装（也比较麻烦）也有类似的软件，具体请见我的blog

2016-04-24

提高matlab代码速度的Tips

To speed up your matlab code, which is downloaded from UFLDL website

2016-04-14

UFLDL exercise9 Convolution and Pooling

In this exercise you will use the features you learned on 8x8 patches sampled from images from the STL-10 dataset in the earlier exercise on linear decoders for classifying images from a reduced STL-10 dataset applying convolution and pooling. The reduced STL-10 dataset comprises 64x64 images from 4 classes (airplane, car, cat, dog).

2016-04-13

UFLDL exercise8 Linear Decoder

In this exercise, you will implement a linear decoder (a sparse autoencoder whose output layer uses a linear activation function). You will then apply it to learn features on color images from the STL-10 dataset. These features will be used in an later exercise on convolution and pooling for classifying STL-10 images.

2016-04-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

PRML 模式识别与机器学习（英文）

Python numpy

提高matlab代码速度的Tips

UFLDL exercise9 Convolution and Pooling

UFLDL exercise8 Linear Decoder

UFLDL exercise7 Stacked Autoencoder

UFLDL exercise5 Softmax Regression

UFLDL exercise6 Self-Taught Learning

UFLDL exercise3&4 PCA and Whitening

UFLDL exercise1 Sparse Autoencoder

UFLDL exercise2 Learn features for handwritten digits

有关图论的ppt

stanford CS229 课程讲义

空空如也