自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(87)
  • 收藏
  • 关注

原创 UE4创建C++类后并未出现在内容浏览器中,并且VS热编译失败

在UE4中创建C++类时选中public,会在项目文件夹中生成public和private两个文件夹,如下图所示。当进行编译时,会报“cannot open file TowerDefenceGameCamera.h”这种错误。目前的解决方法:右键工程名——>属性——>VC++目录——>包含目录在包含目录中填入TowerDefenceGameCamera.h的路径解决之后:热编译成功在内容浏览器中成功添加文件...

2021-07-22 18:10:34 3684

原创 CentripetalNet: Pursuing High-quality Keypoint Pairs for Object Detection 论文笔记

前言

2021-03-23 20:03:15 320

原创 DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution 论文笔记

前言本文分别从宏观和微观角度对目标检测模型的backbone进行设计,进而提出DetectorRS,在宏观上,提出递归特征金字塔(Recursive Feature Pyramid,RFP),它是在FPN的基础上建立的,通过将FPN中额外的反馈连接整合到自底向上的backbone中,以构成RFP,如下图所示,图中的黑色实线箭头就是所提到的反馈连接。具体来说,这个反馈连接将detector head中直接接收梯度的特征(因该就是语义信息丰富的特征)带回到backbone的较低层级的特征层中,从而能够加

2020-10-09 11:24:39 2616 1

原创 Scale-Equalizing Pyramid Convolution for Object Detection 论文笔记

前言特征金字塔是解决多尺度目标检测的有效方式,但是在特征金字塔中,不同层级的特征中所包含的语义信息相差很大,这可能会无法得到最优的检测结果。为了解决这个问题,人们提出了很多不同的特征融合策略,目的是使不同层级的特征图的表示能力保持一致。但是这些方法基本上都是直接将分辨率相同的特征进行相加,没有很好地考虑特征金字塔的内在属性。本文认为,在尺度维度上进行卷积比直接将特征图相加要自然的多。比如在特征金字塔中,尺度相邻的特征图之间应该具有很强的关联性,但目前的特征融合方法并没有考虑这种关联性。基于此,本文提出PC

2020-05-28 18:08:40 1464 1

原创 Single-Shot Object Detection with Enriched Semantics 论文笔记

前言在SSD中,小目标由较浅的层来检测,大目标由较深的层来检测。SSD虽然能够检测不同尺度的目标,但由于浅层特征只能捕获一些基础的视觉模式,语义信息不充足,因此在检测小目标时的性能不是太好;而浅层特征的不理想也会因此影响高级特征的检测性能。为了解决上述问题,本文设计了一种新的检测网络,称为DES(Detection with Enriched Semantics),它主要包含两个分支:检测分支:就是目标检测网络中经典的检测器,以VGG16作为backbone,在不同层的特征图上进行检测;分割分支:

2020-05-26 11:30:02 317

原创 ScratchDet: Training Single-Shot Object Detectors from Scratch 论文笔记

前言一般在进行目标检测时,通常会使用在大型数据集上经过预训练的分类网络,然后在此基础上进行微调。这样做虽然能够得到较好的检测性能,但会存在一些限制:分类任务和检测任务对目标位置的敏感程度是不同的。分类任务偏向于平移不变性,因此会采取一些下采样操作以得到更好的性能。而对于检测任务来说,一些局部的上下文信息是非常重要的,因此在采取平移不变操作时需要十分谨慎,否则就会丢失一些局部信息。在微调时修改网络结构是很不方便的,但如果采用另一种新的网络结构,那么又要在大型数据集上重新进行预训练,耗时耗资源。如果

2020-05-25 11:51:05 413

原创 RON: Reverse Connection with Objectness Prior Networks for Object Detection 论文笔记

前言region-based目标检测方法:比如Fast R-CNN和Faster R-CNN,检测精度较高,并且RPN能够去除一些背景样本,但资源和时间消耗太大;region-free目标检测方法,比如SSD和YOLO,它们的检测效率很高,但检测精度却略有不足,由于没有RPN对负样本进行过滤,正负样本的比例严重失衡。而且YOLO只利用最后一层进行检测,而SSD虽然利用了较浅的层的结果,但仍无法准确地检测小目标。为了结合region-based和region-free方法的优点,本文提出RON(Re

2020-05-24 21:19:03 438

原创 Path Aggregation Network for Instance Segmentation 论文笔记

前言

2020-05-22 10:30:59 267

原创 SNIPER: Efficient Multi-Scale Training 论文笔记

前言为了进行多尺度目标检测,一些目标检测算法比如Faster R-CNN和Mask R-CNN都是在一个多尺度图像金字塔上训练的,在训练时每个尺度的图像的所有像素都参与到后续计算中,因此训练时间会很长。比如一个具有3种尺度的图像金字塔(分别是原始图像的1倍,2倍,3倍),它要处理相当于原始图像14倍的像素。然而,最近的研究SNIP表明,在进行多尺度训练时,最好忽略掉极端大小的目标的梯度。比如,在3种尺度的图像金字塔的情况下,应将较大分辨率图像上的极大目标和较小分辨率图像上的极小目标的梯度忽略掉。那么就出现

2020-05-19 09:15:48 362

原创 Scale-Aware Trident Networks for Object Detection 论文笔记

前言为了解决目标检测中的尺度变换问题,目前人们已经提出了如下方法:(a):图像金字塔,虽然对目标的表征能力很强,但由于每种尺度的图像都要经过一个CNN,因此效率很低;(b):特征金字塔,虽然能够生成多尺度特征,计算消耗相对于图像金字塔来说更少,但由于不同尺度的目标被分配到不同层级的特征图上,导致参数不一致;(c):就是本文提出的三叉戟网络(Trident Network)。图像金字塔和特征金字塔的共同特点是,模型对于不同尺度的目标应该有不同的感受野。基于此,本文提出Trident Netwo

2020-05-15 10:40:38 461

原创 DSSD : Deconvolutional Single Shot Detector 论文笔记

前言SSD使用较浅的层来预测小目标,用较深的层来预测大目标,这样虽然能够实现多尺度目标检测,但由于浅层的特征图语义信息不够强,缺乏高层的语义特征,因此SSD对小目标的检测效果很差。这样来看的话,如果我们要提升检测精度,要么使用更好的特征网络 以提取判别性更强的特征,要么增加上下文信息,也就是将高层语义特征融入浅层特征图中,这对于检测小目标是很重要的。本文最重要的贡献是,将上下文信息引入目标检测中。将SSD的基础网络从VGG换成ResNet-101,以更好地提取特征;同时利用反卷积层(deconvolut

2020-05-14 11:11:35 410

原创 Single-Shot Refinement Neural Network for Object Detection 论文笔记

前言本文设计了一种新的目标检测框架,称为RefineDet,它通过两个互相连接的模块来对one-stage方法进行改进,从而在保持one-stage检测效率的同时,又能提升检测精度。这两个模块分别为:anchor refinement module(ARM):识别并移除negative anchor,以减小分类器的搜索空间,同时粗略地调制anchor的位置和大小,从而为后续的回归操作提供一个好的初始化。object detectionmodule(ODM):将ARM中经过调制的anchor作为输入,

2020-05-13 12:22:15 204

原创 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks 论文笔记

前言对卷积网络进行放大可以获得更好的精度,但这一过程还未被完全理解,目前通用的几种方式是放大卷积网络的深度、宽度和分辨率,并且通常只放大这三个维度中的一种。虽然任意放大两个或三个维度也是可行的,但这需要繁琐的人工调参,并且可能不能达到最优的精度和效率。本文研究了放大卷积网络这一过程,关注了一个核心问题:是否存在一个原则性的方法来放大卷积网络,从而能够达到更好的精度和效率? 本文的实验表明平衡网络的深度、宽度和分辨率这三个维度是非常重要的,并且仅用一组常量比率分别对每个维度进行缩放,就能实现这样的平衡。基

2020-05-12 15:36:10 309

原创 Deep Feature Pyramid Reconfiguration for Object Detection 论文笔记

前言用金字塔形式的多尺度表示来解决目标检测中的多尺度问题是一种常用的方法,SSD和FPN都是这种金字塔形式的特征表示。但SSD中的bottom-up通路仅能在深层中学到更强的语义特征,而浅层中的语义特征很难捕获,因此SSD在检测小目标时比较无力。FPN虽然通过横向连接使得每个层级的特征图都包含很强的语义特征,但它实际上等价于特征层级的线性结合,从而很难捕获高度非线性的信息,以至于不能很好的应对更加复杂的情况。本文以一种高度非线性的方式,将特征金字塔的构造过程重塑为特征的重构过程。具体来说就是,本文在构造

2020-05-11 21:08:28 242

原创 Efficient Featurized Image Pyramid Network for Single Shot Detector 论文笔记

前言目前人们已经提出很多方法以解决目标检测中的尺度变化问题,如下图所示:(a):特征化的图像金字塔,通过在不同尺度的图像上应用CNN得到不同尺度的特征图,由于每个尺度的图像都要经过一个深度CNN来提取特定尺度的特征图,因此速度很慢。(b):FPN,虽然能够得到融合的多尺度特征,但并不适合非常小和非常大的目标。对于一个非常小的目标来说,有可能经过很大倍数的上采样之后,依然不能达到网络所要求的分辨率(通常是224×224224 \times 224224×224),并且FPN生成的高级语义特征对于检测

2020-05-10 21:56:33 897 2

原创 Bag of Freebies for Training Object Detection Neural Networks 论文笔记

前言本文总结了能够增强目标检测网络性能的一些有效的方法,也就是训练过程使用到的一些tricks,这些方法在inference时并不会引入额外的计算消耗。本文的主要贡献如下:系统地评估了不同目标检测流程中应用的多种训练tricks,为未来的研究提供了很有价值的参考;借鉴分类问题中的mixup技术,提出了一种适合于目标检测网络的视觉连贯的image mixup方法,实验证明该方法能够提升模型的...

2020-05-08 15:04:15 245

原创 An Analysis of Scale Invariance in Object Detection – SNIP 论文笔记

前言首先思考这样一个问题:为什么目标检测与图像分类相比要更加困难呢?作者认为,这是由于目标的尺度变化,尤其当检测非常小的目标时很难达到理想的效果。在ImageNet和COCO中,目标的中等尺度分别为0.554和0.106,也就是说,COCO数据集中的大多数目标的尺度都小于图像区域的1%。更糟的是,在COCO中最小和最大的10%目标的尺度分别为0.024和0.472,这几乎是20倍的尺度变化!如下...

2020-05-07 13:37:14 230

原创 Libra R-CNN: Towards Balanced Learning for Object Detection 论文笔记

前言作者认为,在目前的目标检测器的训练过程中存在三个方面的不平衡问题,如下图所示:(a)样本层次的不平衡: 在训练目标检测器时,hard样本是最有价值的,它能够有效提升检测器的性能。但是,随机采样机制会导致样本中大多数都是easy样本。OHEM虽然能够选出更多hard样本,但这个方法对噪声不鲁棒,并且计算量较大。Focal loss虽然在single-stage检测器中很有效,但对于two...

2020-05-06 13:49:48 379

原创 Meta R-CNN : Towards General Solver for Instance-level Low-shot Learning 论文笔记

前言本文提出了一种实现小样本目标检测的通用方法,基于Faster R-CNN生成的RoI feature进行元学习。目前的元学习方法在小样本识别方面非常有用,这主要是因为只需识别单个目标。但如果一张图像中包含多个目标,并且还混合的有背景信息,那么这些元学习方法就不再有用了,因为它不能将这些复杂的信息分开。本文发现,可以通过Faster R-CNN产生的RoI feature对这些混合的目标进行预...

2020-05-05 20:51:39 5066 1

原创 LSTD: A Low-Shot Transfer Detector for Object Detection 论文笔记

前言基于深度学习的目标检测器能够取得成功,很大一部分依赖于完整标注的大规模数据,但实际上,完整标注的数据集是有限的。为了解决这个问题,一种方法是进行迁移学习,源域(source-domain) 中的知识可以作为一种有效的监督,进而泛化到目标域(target-domain) 的学习过程中。但是,小样本目标检测中的迁移学习依然存在以下问题:当目标检测的数据集很小时,使用一般的迁移策略是不太合适的...

2020-05-01 11:55:47 691

原创 Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty 论文笔记

前言目前的大多数single-stage目标检测器虽然在检测精度上已经有所提升,但检测的实时性依然不是很好。此外,虽然通过检测得到了目标的bbox坐标,但得到的这个bbox的不确定性是未知的。因此,这些目标检测器并不能避免错误定位(FP),因为它们输出的bbox的结果并不包含不确定性信息,也就是说并不清楚这个bbox是不是正确的。一般来说,FP指对于该目标的GT来说是不准确的检测结果,TP则是准...

2020-04-30 11:34:21 333

原创 Side-Aware Boundary Localization for More Precise Object Detection 论文笔记

前言目前的目标检测器依赖bbox回归来对目标进行定位,它通过预测几个偏移值来确定目标的位置。如果anchor与目标之间存在很大的位移,那么精确定位就变得非常困难。从而限制了整体的检测性能。本文提出了一种新方法用于目标的精确定位,作者观察到当为目标标注bbox时,使box的每条边与目标边界对齐比移动整个box更加的简便。由此,本文提出侧边感知边界定位(Side-Aware Boundary Lo...

2020-04-29 13:55:42 997 1

原创 LaSO: Label-Set Operations networks for multi-label few-shot learning 论文笔记

前言样本合成是解决小样本学习问题的方法之一,所谓样本合成,就是在给定少量训练样本的情况下,在特征空间中利用这些训练样本合成新的样本,然后利用这些合成样本提升小样本学习任务的泛化能力。但是目前的合成方法仅处理的是每个图像中仅有一个类别标签(比如C(Img)=dogC(Img)=dogC(Img)=dog)这样的情况,而多标签的情况还从未被提及过(比如C(Img)={dog,leash,person...

2020-04-28 22:13:11 1451 1

原创 IoU-uniform R-CNN: Breaking Through the Limitations of RPN 论文笔记

前言RPN是two-stage目标检测器中的一个核心部分,它用于生成一系列proposal,并且能够过滤大部分负样本,从而避免正负样本间的极端不平衡。不过目前的RPN仍存在一些缺点:如下图所示,随着IoU的增大,RoI的数量急剧减少,造成IoU分布不平衡,训练样本的分布会偏向较低的IoU;而当IoU较大时,正样本的数量明显不足。这会妨碍检测器的优化,尤其是在IoU较高时。如下图所示...

2020-04-27 21:33:45 849

原创 Learning from Noisy Anchors for One-stage Object Detection 论文笔记

前言在基于anchor的目标检测器中,通常是根据阈值来选择正负样本——anchor与gt的IoU如果高于阈值,那么就是正样本,否则就是负样本。由于一些anchor与gt是部分重叠的,也即该anchor只包含目标的部分信息,因此基于这样的IoU来确定anchor是正样本还是负样本是不太合理的。看下图,蓝框是正样本,红框是负样本,绿框是gt。长颈鹿的头由于IoU过低,因此被作为负样本,但它对于分类与...

2020-04-26 15:59:54 1415 1

原创 Multiple Anchor Learning for Visual Object Detection 论文笔记

前言在基于anchor的目标检测方法中,检测器利用目标与anchor之间的IoU作为分配anchor的标准,每个被分配的anchor独立地监督网络学习,以进行分类与定位。也就是说,分类与定位之间是没有交互的,如果一个检测结果的定位精度较高但分类置信度较低,那么它有可能在NMS操作中被过滤掉。为了解决这个问题,本文提出Multiple Anchor Learning(MAL),这是一种可以自动学...

2020-04-24 17:12:53 3367 1

原创 CBNet: A Novel Composite Backbone Network Architecture for Object Detection 论文笔记

前言目前大多数目标检测器的backbone通常是被设计用来进行图像分类的,在ImageNet上经过预训练之后,再经过微调以进行检测。那么问题就来了,直接采用这种backbone提取图像特征以进行目标检测真的能达到最优性能吗?但是如果设计一种新的backbone并在ImageNet上对其进行预训练,要达到优秀的检测性能所付出的代价又会是非常大的。因此本文提出了一种巧妙的思想,组合现有的backbo...

2020-04-22 19:14:26 648 1

原创 IPG-Net: Image Pyramid Guidance Network for Object Detection论文笔记

前言FPN虽然通过top-down特征融合为浅层特征提供了充足的语义信息,但深层特征可能会缺少位置或空间信息,而空间信息的损失会导致特征不对齐,即anchor和卷积特征之间存在一些偏移,也就是说anchor在经历多次卷积之后,在深层特征上的位置可能和初始位置不一致。除此之外,在较深的卷积层中很容易丢失小目标。由此,本文提出了一种新的网络结构,称为图像金字塔引导网络(Image Pyramid ...

2020-04-22 11:03:57 936 3

原创 AugFPN: Improving Multi-scale Feature Learning for Object Detection 论文笔记

前言首先来说一下FPN的一些设计缺陷,如下图所示,FPN可以分为三个阶段:(1)特征融合前;(2)top-down特征融合;(3)特征融合后。每个阶段都存在一处设计缺陷:不同层级的特征之间存在语义差异。在进行特征融合前,会先将不同层级的特征经过一个1×11 \times 11×1的卷积层以降低通道数,但这一过程未考虑这些特征之间存在的巨大的语义差异。如果直接将这些特征进行融合,由于它们的语...

2020-04-21 14:44:48 1240

原创 Learning Rich Features at High-Speed for Single-Shot Object Detection 论文笔记

前言目前的single-stage目标检测器依然存在两个问题:在检测小目标时,性能不是很好。比如RetinaNet在检测COCO上的大目标时能达到47的AP,而小目标的AP只有14;大多数single-stage检测器采用在ImageNet上经过预训练的backbone来进行分类任务,然后利用目标检测数据集进行微调以实现快速收敛。但是分类任务和定位任务之间仍存在较大差异,尤其是在IoU阈值...

2020-04-20 15:14:40 342

原创 Learning Spatial Fusion for Single-Shot Object Detection 论文笔记

前言特征金字塔(比如FPN)常被用来处理目标检测时的多尺度问题,但它有一个缺点,就是不同尺度之间的不一致性,尤其体现在single-shot检测器中。具体来说就是,当使用特征金字塔检测目标时,通常使用较上层的特征图来处理大目标,而用较底层的特征图来处理小目标,如果一个目标被分配给某一层级并且被看作是正样本,那么其它层级中和该目标位置相同的区域将被看作是背景。因此,如果一个图像中同时包含大目标和小...

2020-04-19 09:49:55 296

原创 EfficientDet: Scalable and Efficient Object Detection 论文笔记

前言

2020-04-17 15:01:25 318

原创 Large-Scale Few-Shot Learning: Knowledge Transfer With Class Hierarchy 论文笔记

前言在大规模小样本学习(large-scale FSL)中,有这样一个baseline:使用所有的源类(source class)训练一个feature embedding模型,然后用这个模型提取出目标类(target class)中样本的特征,以进行最近邻分类。从下图可以看出,仅使用简单的最近邻(NN)方法得到的结果,甚至能与目前最先进的FSL模型相匹配:这就说明了一个问题:在SGM、PP...

2020-04-16 10:52:31 546 1

原创 TAFE-Net: Task-Aware Feature Embeddings for Low Shot Learning 论文笔记

前言在目前一些零样本或小样本学习任务中,通常将图像映射到embedding空间,然后利用feature embedding进行后续的操作。这样就存在一个问题,任务间共享的是通用的feature embedding,那么就会存在feature embedding可能并不适用于某些任务这样的情况,就会导致不好的结果。本文基于这一点,提出了一种task-aware feature embedding...

2020-04-15 11:23:27 994 4

原创 Improved Few-Shot Visual Classification 论文笔记

前言小样本学习方法主要可以分为两种形式:最近邻方法和embedding方法。在embedding方法中,通常是先将图像通过非线性映射到embedding空间中,然后在embedding空间中根据预设的距离度量来进行最终的最近邻分类,原型网络采用的就是这种方法。人们发现,在经过灵活的非线性映射之后,得到的embedding基本可以适应任何距离度量,因此度量的选择似乎变得无关紧要。然而本文发现,度...

2020-04-14 14:34:39 4171 1

原创 SimpleShot: Revisiting Nearest-Neighbor Classification for Few-Shot Learning 论文笔记

前言目前大多数小样本学习器首先使用一个卷积网络提取图像特征,然后将元学习方法与最近邻分类器结合起来,以进行图像识别。本文探讨了这样一种可能性,即在不使用元学习方法,而仅使用最近邻分类器的情况下,能否很好地处理小样本学习问题。本文发现,对图像特征进行简单的特征转换,然后再进行最近邻分类,也可以产生很好的小样本学习结果。比如,使用DenseNet特征的最近邻分类器,在结合均值相减(mean sub...

2020-04-13 21:25:46 1462

原创 Meta-Transfer Learning for Few-Shot Learning 论文笔记

前言元学习(meta-learning)是目前广泛使用的处理小样本学习问题的方法,它的目的是在学习不同任务的过程中积累经验,从而使得模型能够快速适应新任务。比如在MAML(Model-Agnostic Meta- Learning)中,通过搜寻最优初始化状态,使得base-learner能够快速适应新任务。但是这一类元学习方法具有两个缺点:需要大量相似的任务以进行元训练(meta-train...

2020-04-13 15:28:29 2394

原创 (AM3)Adaptive Cross-Modal Few-shot Learning 论文笔记

前言本文提出了一种利用跨模式(cross-modal)信息(视觉特征和语义特征)来增强基于度量的小样本学习的方法。一般来说,当来自视觉模式的数据有限时,利用辅助模式的数据(属性,未被标记的文本语料库等)也可以帮助进行图像分类,这种方法在零样本学习中使用的特别多。在训练时,会通过模式对齐(modality-alignment)将视觉模式与辅助模式的数据映射到一块儿,从而迫使它们具有相同的语义结构...

2020-04-12 19:58:31 757 1

原创 Fast and Flexible Multi-Task Classification Using Conditional Neural Adaptive Processes 论文笔记

前言通用图像分类系统设计元学习和小样本学习,现有的一些研究通常会考虑在训练和测试时进行均匀的任务分配,因此网络在处理新任务时只需进行很小的调整。本文设计了一个完全自适应的系统,以应对不同的任务分配情况,该系统需要在模型和训练过程中进行特定的设计选择。现有的用元学习和小样本学习来处理图像分类的方法具有两个基本的trade-off:适应每个任务的参数数量。一种方法仅调整分类器的head中的参数...

2020-04-12 12:06:18 1648

原创 (IoU-Net)Acquisition of Localization Confidence for Accurate Object Detection 论文笔记

前言

2020-04-11 15:12:38 290

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除