3 chaibubble

尚未进行身份认证

相信美好的事情,终将发生

等级
TA的排名 2k+

图像生成:GAN

GAN,即生成对抗模型,是图像生成领域内的一种重要方法,它在2014年由Goodfellow提出,它的论文是《GenerativeAdversarialNetworks》,GAN是在训练两个相互对抗的网络,一个生成器(Generator)和一个判别器(Descriminator)。当训练达到平衡时,对于一个输入噪声z。G(z)就是最后生成出来的图像。

2019-09-16 00:07:41

C++ using用法

using作用:引入命名空间,指定别名,在子类中引用基类的成员。

2019-09-10 20:43:46

人脸检测:SSH

SSH是一个用于人脸检测的one-stage检测器,提出于2017年8月,在当时取得了state-of-art的效果,论文是《SSH:SingleStageHeadlessFaceDetector》,SSH本身的方法上没有太多新意,更多的是在把通用目标检测的方法往人脸检测上应用。

2019-09-06 19:33:30

目标检测(object detection)扩展系列(二) OHEM:在线难例挖掘

OHEM(OnlineHardExampleMining)是一种在线的难例挖掘方法,它的论文是《TrainingRegion-basedObjectDetectorswithOnlineHardExampleMining》,从时间上看它在FasterR-CNN的后面,但是文中没有在FasterR-CNN的基础上实验,而是选择了FastR-CNN,将FastR-CNN中的mini-batchsampling策略替换为OHEM,得到了不错的效果。

2019-09-05 22:31:50

人脸检测:FaceBoxes

FaceBoxes是一个足够轻量的人脸检测器,由中国科学院自动化研究所和中国科学院大学的研究者提出,旨在实现CPU下的实时人脸检测,FaceBoxes论文是《FaceBoxes:ACPUReal-timeFaceDetectorwithHighAccuracy》。

2019-09-04 23:42:40

Caffe工厂模式解析

Caffe有五个基本组件,分别是Blob,Solver,Net,Layer和Proto,其中Solver和Layer使用了工厂模式,下面以Slover为例说明下。Solver的工厂模式在注册和调用的过程中体现,所以在说明工厂模式之前,我们首先要弄明白Solver在Caffe内部是如何被使用的。

2019-09-03 12:03:37

C++工厂模式

工厂模式分为3种,即简单工厂模式、工厂方法模式、抽象工厂模式,C++的工厂模式主要利用到虚函数。简单工厂模式工厂方法模式抽象工厂模式

2019-08-28 23:40:40

目标检测(object detection)系列(十二) CornerNet:anchor free的开端

过去的目标检测算法,two-stage方法从FasterR-CNN开始,one-stage方法从SSD开始,都无一例外的引入了anchor,anchor先验的引入使网络不需要从0直接预测Boundingbox,这有利于目标检测器得到更好的效果。但是随着Anchorbox的逐渐增多,它变成了目标检测算法的一个瓶颈,而CornerNet首次弃用了anchorbox,就像它的名字一样,它将目标物体转化为检测左上角和右下角的点。

2019-08-25 18:09:16

目标检测(object detection)系列(十一) RetinaNet:one-stage检测器巅峰之作

在RetinaNet之前,目标检测领域一个普遍的现象就是two-stage的方法有更高的准确率,但是耗时也更严重,比如经典的FasterR-CNN,R-FCN,FPN等,而one-stage的方法效率更高,但是准确性要差一些,比如经典的YOLOv2,YOLOv3和SSD。而RetinaNet的出现,在一定程度上改善了这个问题,让one-stage的方法具备了比two-stage方法更高的准确性,而且耗时更低。

2019-08-24 17:33:22

目标检测(object detection)系列(十) FPN:用特征金字塔引入多尺度

SSD算法证明了多层分支对于目标检测的有效性,在此之前two-stage的目标检测方法已经优化改进过很多代,但是一直没有加入多尺度的方法。终于在FPN中,two-stage引入了多尺度,并且在SSD多层分支方法的基础上进一步改进,提出了特征金字塔网络。FPN的论文是《FeaturePyramidNetworksforObjectDetection》。

2019-08-22 14:12:15

人脸检测通用评价标准

简介人脸检测任务应该如何评价评价标准二分类的精准率和召回率人脸检测是目标检测的一个特例,因为目标类别只有一类,剩下的都是背景,所以人脸检测评价标准中会用到些二分类问题的评价,在这里先提一下。二分类问题最常用的就是精准率和召回率:精准率代表着预测为正的样本中有多少是正确的;召回率代表着总的正样本中有多少正样本被成功预测出来。假设实际测试集中有100个正样本和100负样本,100个...

2019-08-21 12:21:19

目标检测(object detection)系列(九) YOLOv3:取百家所长成一家之言

取百家所长成一家之言是一句书面意思上绝对褒义的话,形容一个论文却有些许的尴尬,但是YOLOv3确实是这样,没什么大的改动和创新点,而是融合借鉴了很多在其他的方案,最后效果还是很好的,文章中自己也提到了:“Wemadeabunchoflittledesignchangestomakeitbetter”,YOLOv3的论文是《YOLOv3:AnIncrementalImprovement》,真的是个很低调的题目,没有Better,Faster和Stronger。╮( ̄▽ ̄)╭

2019-08-18 18:54:41

如何计算CNN感受野、计算量和模型大小

下面以最经典的AlexNet模型为例子,计算感受野,模型计算量和大小(内存)。下面这张图是AlexNet的结构图,看起来比较直观。感受野感受野是检测和分割任务中比较重要的指标,它是一个逐层叠加的过程,计算到最后一层的卷积特征图输出上,它的计算公式是:RFi=RFi−1+(kernelsize−1)×stride,RF0=1RF_{i}=RF_{i-1}+(kernelsize-1)\tim...

2019-08-17 15:45:19

如何理解扩张卷积(dilated convolution)

扩张卷积(DilatedConvolution)也被称为空洞卷积或者膨胀卷积,是在标准的卷积核中注入空洞,以此来增加模型的感受野(receptionfield)。相比原来的正常卷积操作,扩张卷积多了一个参数:dilationrate,指的是卷积核的点的间隔数量,比如常规的卷积操作dilatationrate为1。它的论文是:《MULTI-SCALECONTEXTAGGREGATIONBYDILATEDCONVOLUTIONS》

2019-08-16 18:35:15

目标检测(object detection)扩展系列(一) Selective Search:选择性搜索算法

在FasterR-CNN算法之前,R-CNN,SPP-Net和FasterR-CNN这些方法中,都用到了SS(SelectiveSearch)算法,它其实是一种区域建议算法为后续的检测任务提供候选框,SS的论文是[《SelectiveSearchforObjectRecognition》]

2019-08-14 15:53:31

目标检测(object detection)系列(六) SSD:兼顾效率和准确性

SDD出现之前,主流的CNN目标检测模型分别是FasterR-CNN和YOLO,FasterR-CNN作为two-stage的代表,具有stateoftheart的准确性,但是速度偏慢,做不到实时。。YOLO使得目标检测任务one-stage就能完成,在效率上有了明显改善,但是准确性上确差了很多。这就好比“人有悲欢离合,月有阴晴圆缺,此事古难全。”但是就在这个时候,SDD出现了,一个兼顾了效率和准确性的网络结构。因为它做到了比FasterR-CNN更准,同时又比YOLO更快的性能表现。

2019-08-11 22:06:08

目标检测(object detection)系列(五)YOLO:目标检测的另一种打开方式

从时间轴上看,YOLO(YOLOv1)的提出在R-CNN,SPP-Net,FastR-CNN和FasterR-CNN之后,论文题目是《YouOnlyLookOnce:Unified,Real-TimeObjectDetection》,从某种意义上说,YOLO的提出,从另一各方面定义了基于CNN的目标检测任务的基本方法。---------------------版权声明:本文为CSDN博主「chaibubble」的原创文章,遵循CC4.0by-sa版权协议,转载请附上原文出处链接

2019-08-09 13:12:01

Octave Convolution原理与Caffe实现

前言OctaveNet网络paper是《DropanOctave:ReducingSpatialRedundancyinConvolutionalNeuralNetworkswithOctaveConvolution》,是CVPR2019中的一篇论文。OctaveNet是一个用于ImageNetClassfication任务的backbone结构。这篇论文提出了一种新...

2019-07-27 15:29:58

Caffe实现上采样(upsample)方法总结

引言CNN的下采样(subsample)在几乎所有的模型结构中都会出现,比如stride>1的卷积操作,pooling操作,都会减少特征图的长宽,起到下采样的效果。与之相对的就是上采样(upsample)操作了,顾名思义,上采样在CNN模型中的作用上增大特征图的长宽,比如都变为原来的2倍。上采样在模型构建中并不像下采样那么频繁被使用,一般情况下,会在下面几个应用中用到上采样操作:1.se...

2019-07-13 17:17:33

年龄估计:Ordinal Regression

前言年龄估计任务年龄估计,顾名思义就是要从人脸图片中估计出对象的年龄,一般情况下是一个整数,而不是年龄段(中年,青年)和小数(25.5),这一点符合人的常理,我们在提及自己的年龄时,也不会说“我今年25.5岁”。在人脸应用中,年龄估计一般会作为人脸属性识别中的一个属性,就像下面这张图呈现出的效果(来源于百度demo)常用方法...

2019-06-09 17:02:03

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。