自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

JacobKong的博客

Be the one to change the world! github: https://github.com/JacobKong

  • 博客(25)
  • 收藏
  • 关注

原创 2017-02-27-深度学习论文笔记:R-FCN

Abstract提出了一个region-based, fully convolutional的网络来准确高效的进行物体检测。不同于Faster R-CNN,本论文的region-based detector是完全卷积化的,几乎一张图像上所有的计算都是共享的。为了实现这一目标,我们提出position-sensitive score maps,以解决在图像分类的平移不变性(translation

2017-02-27 22:39:56 2309

原创 深度学习读书笔记:DeepLearningBook - Chapter 9 - Conventional Networks

Chapter 9 Convolutional Networks(卷积神经网络)卷积网络仅仅是在其至少一个层中使用卷积代替一般矩阵乘法的神经网络。The Convolution OperationThe convolution operation is typically denoted with an asterisk:在卷积网络术语中,卷积的第一个参数(在本例中为函数x)通常称为 输入 ,

2017-02-20 23:15:49 886

原创 深度学习论文笔记:SSD

知识点Jaccard overlap, Jaccard similarity: Jaccard coefficient: J(A,B)=|A∩B||A∪B| J(A,B)=\frac{|A\cap B|}{|A\cup B|} A,B分别代表符合某种条件的集合:两个集合交集的大小/两个集合并集的大小,交集=并集意味着2个集合完全重合。 所以Jaccard overlap其实就是I

2017-02-20 23:06:16 3531

原创 深度学习论文笔记:YOLO9000

AbstractYOLO9000: a state-of-the-art, real-time 的目标检测系统,可以检测超过9000种的物体分类。本论文提出两个模型,YOLOv2和YOLO9000。YOLOv2: 是对YOLO改进后的提升模型。利用新颖的,多尺度训练的方法,YOLOv2模型可以在多种尺度上运行,在速度与准确性上更容易去trade off。YOLO9000: 是提出的一种

2017-02-18 21:21:18 1307

原创 深度学习论文笔记:YOLO

Abstract之前的物体检测的方法是使用分类器来进行检测。相反,本论文将对象检测作为空间分离的边界框和相关类概率的回归问题。本论文的YOLO模型能达到45fps的实时图像处理效果。Fast YOLO:小型的网络版本,可达到155fps。与目前的检测系统相比,YOLO会产生更多的定位错误,但是会更少的去在背景中产生false positive。IntroductionDPM: use

2017-02-18 21:20:36 4242

原创 深度学习实践经验:用Faster R-CNN训练Caltech数据集——训练检测

前言前面已经介绍了如何准备数据集,以及如何修改数据集读写接口来操作数据集,接下来我来说明一下怎么来训练网络和之后的检测过程。修改模型文件faster rcnn有两种各种训练方式:Alternative training(alt-opt)Approximate joint training(end-to-end)两种方法有什么不同,可以参考我这篇博客,推荐使用第二种,因为第二种使用的显存更小,而

2017-02-18 21:18:00 6976 5

原创 深度学习实践经验:用Faster R-CNN训练Caltech数据集——修改读写接口

前言这部分主要讲如何修改Faster R-CNN的代码,来训练自己的数据集,首先确保你已经编译安装了py-faster-rcnn,并且准备好了数据集,具体可参考我上一篇文章。py-faster-rcnn文件结构caffe-fast-rcnn 这里是caffe框架目录,用来进行caffe编译安装data 用来存放pre trained模型,比如ImageNet上的,要训练的数据集以及读取文件的

2017-02-18 21:17:23 3731 3

原创 深度学习实践经验:用Faster R-CNN训练行人检测数据集Caltech——准备工作

前言Faster R-CNN是Ross Girshick大神在Fast R-CNN基础上提出的又一个更加快速、更高mAP的用于目标检测的深度学习框架,它对Fast R-CNN进行的最主要的优化就是在Region Proposal阶段,引入了Region Proposal Network (RPN)来进行Region Proposal,同时可以达到和检测网络共享整个图片的卷积网络特征的目标,使得reg

2017-02-18 21:16:35 18935 266

原创 深度学习论文笔记:Faster R-CNN

AbstractRegion Proposal的计算是基于Region Proposal算法来假设物体位置的物体检测网络比如:SPPnet, Fast R-CNN运行时间的瓶颈。Faster R-CNN引入了Region Proposal Network(RPN)来和检测网络共享整个图片的卷积网络特征,因此使得region proposal几乎是cost free的。RPN->预测物体边界(o

2017-02-18 21:15:44 1702

原创 深度学习论文笔记:Fast R-CNN

知识点mAP:detection quality.Abstract本文提出一种基于快速区域的卷积网络方法(快速R-CNN)用于对象检测。快速R-CNN采用多项创新技术来提高训练和测试速度,同时提高检测精度。采用VGG16的网络:VGG: 16 layers of 3x3 convolution interleaved with max pooling + 3 fully-connected

2017-02-18 21:13:29 1763

原创 深度学习论文笔记:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

Abstract现有的深卷积神经网络(CNN)需要固定尺寸(例如,224×224)的输入图像。新的网络结构,称为SPP-net,可以生成固定长度的表示,而不管图像大小/规模。使用SPP-net,我们从整个图像只计算一次特征图,然后在任意区域(子图像)中池特征以生成固定长度表示以训练检测器。INTRODUCTION在CNN的训练和测试中存在技术问题:普遍的CNN需要固定的输入图像大小(例如,

2017-02-18 21:12:33 1000

原创 深度学习论文笔记:Rich feature hierarchies for accurate object detection and semantic segmentation

AbstractmAP: mean average precision,平均准确度我们的方法结合两个关键的见解:第一:采用高容量的卷积神经网络来从上到下的进行region proposal,从而实现定位和分割物体。当标记的训练数据稀缺时,可以先对辅助数据集(任务)进行受监督的预训练, 随后是基于域进行特定调整,产生显着的性能提升。Introduction关于各种视觉识别任务的上一个十年的进

2017-02-18 21:09:37 1907

原创 行人检测论文笔记:Taking a Deeper Look at Pedestrians

layout: post title: 行人检测论文笔记:Fused DNN - A deep neural network fusion approach to fast and robust pedestrian detection categories: 论文笔记 tags: - Deep Learning - 深度学习 - Object Detection - 目标检测

2017-02-18 21:07:56 2189

原创 行人检测论文笔记:Robust Real-Time Face Detection

知识点傅里叶变换的一个推论: 一个时域下的复杂信号函数可以分解成多个简单信号函数的和,然后对各个子信号函数做傅里叶变换并再次求和,就求出了原信号的傅里叶变换。卷积定理(Convolution Theorem):信号f和信号g的卷积的傅里叶变换,等于f、g各自的傅里叶变换的积 整个过程的核心就是“(反转),移动,乘积,求和”二维卷积数学定义 二维卷积在图像处理中会经常遇到,图像处理中用到的

2017-02-18 21:04:16 2657

原创 行人检测论文笔记:How Far are We from Solving Pedestrian Detection?

文章疑问点Human Baseline 的标准是如何确定的?Ground-truth是什么意思?Groun-truth 指的是正确的标注(真实值)在有监督学习中,数据是有标注的,以(x, t)的形式出现,其中x是输入数据,t是标注.正确的t标注是ground truth,错误的标记则不是。(也有人将所有标注数据都叫做ground truth)。

2017-02-18 21:01:29 4689

原创 行人检测论文笔记:Ten Years of Pedestrian Detection, What Have We Learned?

Abstract这种新的决策林探测器在挑战性的Caltech-USA数据集上实现了当前最好的已知性能。Introduction更重要的是,这是一个有着已建立的基准和评估指标的良好定义的问题。用于对象检测的的主要范例有——”Viola&Jones变体“,HOG + SVM模板,可变形部分检测器(DPM)和卷积神经网络(ConvNets)都已经被探索用于此任务。DatasetsINRIA,

2017-02-18 21:00:33 1511

原创 深度学习读书笔记:DeepLearningBook - Chapter 9 - Conventional Networks

Chapter 9 Convolutional Networks(卷积神经网络)卷积网络仅仅是在其至少一个层中使用卷积代替一般矩阵乘法的神经网络。The Convolution OperationThe convolution operation is typically denoted with an asterisk: * 在卷积网络术语中,卷积的第一个参数(在本例中为函数x)通常称为

2017-02-18 20:58:39 2767 1

原创 行人检测论文笔记:Histograms of Oriented Gradients for Human Detection

相关知识点从TP、FP、TN、FN到ROC曲线、miss rateTP:true positive,实际是正例,预测为正例FP:false positive,实际为负例,预测为正例TN:true negative,实际为负例,预测为负例FN:false negative,实际为正例,预测为负例fnr+tpr=1, fpr+tnr=1miss rate = FNR = 1 - true po

2017-02-18 20:57:38 2731

原创 行人检测论文笔记:Fast Feature Pyramids for Object Detection?

相关知识点Overcomplete Representations:Overcomplete:Such a complete system is overcomplete if removal of a ϕj\phi _{j} from the system results in a system (i.e., ϕi((i∈J∖j)){\phi _{i}}_((i\in J\backslash {

2017-02-18 20:56:49 1466

原创 行人检测论文笔记:Fast Feature Pyramids for Object Detection?

相关知识点Overcomplete Representations:Overcomplete:Such a complete system is overcomplete if removal of a ϕj\phi _{j} from the system results in a system (i.e., ϕi((i∈J∖j))){\phi _{i}}_((i\in J\backslash

2017-02-18 20:26:29 3783

原创 行人检测论文笔记:Pedestrian Detection - An Evaluation of the State of the Art

知识点对数正态分布(lognormally distributed):对数为正态分布的任意随机变量的概率分布。 如果 X 是正态分布的随机变量,则 exp(X)为对数正态分布.如果 Y 是对数正态分布,则 ln(Y) 为正态分布。如果一个变量可以看作是许多很小独立因子的乘积,则这个变量可以看作是对数正态分布。对数正态分布的概率密度函数为:对数平均:对数平均与几何平均相等,并且比算数平均,对

2017-02-18 20:21:21 3798 2

原创 行人检测论文笔记:Pedestrian Detection - A Benchmark

知识点k折交叉验证Non-Maximum Suppression:非极大值抑制算法,非极大值抑制(NMS)可以看做是抑制不是极大值的元素,搜索局部的极大值的搜索问题,NMS是许多计算机视觉算法的部分。 这个局部代表的是一个邻域,邻域有两个参数可变,一是邻域的维数,二是邻域的大小。在行人检测中,滑动窗口经提取特征,经分类器分类识别后,每个窗口都会得到一个分数。但是滑动窗口会导致很多窗口与其他窗

2017-02-18 20:18:39 2782

原创 南清北复交北航哈工大中科院华科保研记

7月23号从中科院软件所参加完夏令营回来,我的漫长的保研路也算是告一段落。8月12号东软实训结束,8月13号坐上回家的火车,8月14号到家,然后就一直吃喝睡到今天,拿回来的几本书也没看几眼,本来打算着回来继续充实一下,去备战9,10月份的推免,现在看来时间又都荒废了……开学还是乖乖到学校吧,再这样下去一直待在家感觉要成废人一个了,我还是喜欢忙碌充实的感觉。一直想着要把这次宝贵的保研经历记录一下。

2017-02-18 20:17:06 8852 5

原创 iOS中多线程知识总结:进程、线程、GCD、串行队列、并行队列、全局队列、主线程队列、同步任务、异步任务等

iOS中多线程知识总结:进程、线程、GCD、串行队列、并行队列、全局队列、主线程队列、同步任务、异步任务等(有示例代码)进程正在运行中的程序被称作进程,负责程序运行的内存分配;每一个进程都有自己独立的虚拟内存空间。线程进程中的一个对立的执行路径被称为线程,一个进程中至少包含一条线程,该线程被称为主线程。多线程多创建一条或者多条线程的,目的就是为了开启一条新的执行路径,运行指定的代码,与主线程中的代码

2015-08-22 12:38:37 4004 1

原创 Xcode运行后报错: this class is not key value coding-compliant for the key的原因

现象:有时候在写完代码之command+R运行后,程序会突然崩掉,并在console中出现一下错误:this class is not key value coding-compliant for the key。       原因:其实造成这个错误的原因是因为:当初在使用storyboard连接控件与代码时,可能连接错了,比如本想将一个控件声明为IBAction,结果连成了IBOut

2015-08-10 19:07:19 977

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除