4 chaibubble

尚未进行身份认证

相信美好的事情,终将发生

等级
TA的排名 1k+

MOT:SORT

简介SORT是一个快速的在线的多目标跟踪(MOT)算法,基于TBD(Traking-by-Detection)的策略,这些特性决定了SORT实用性非常好,SORT的论文是《SIMPLE ONLINE AND REALTIME TRACKING》,发表于2016年,SORT在当时对MOT领域起到了benchmark般的作用。SORT原理主要贡献SORT的主要贡献有两个:证明了一个性能优异...

2019-10-06 19:36:03

目标检测(object detection)扩展系列(三) Faster R-CNN,YOLO,SSD,YOLOv2,YOLOv3在损失函数上的区别

Faster R-CNN,YOLO和SSD通用目标检测领域有着奠基一般的作用, 而YOLOv2和YOLOv3由于其灵活易用的特性,在工业界一直很受欢迎,下面这篇文章主要想从损失函数的角度集中讨论下这几个主流框架的区别。

2019-10-04 21:00:52

交叉熵损失(Cross Entropy)求导

Cross Entropy是分类问题中非常常见的一种损失函数,我们在之前的文章提到过二值交叉熵的证明和交叉熵的作用,下面解释一下交叉熵损失的求导。

2019-10-02 22:53:58

关于梯度下降优化算法的概述

梯度下降算法是最流行的优化算法之一,并且是迄今为止最常见的优化神经网络的方法。同时,每个最先进的深度学习库包含各种梯度下降优化算法的实现,(例如: lasagne,caffe和keras)。然而,这些算法通常用作黑盒优化器,因为它们的优点和缺点的实际解释很难实现。本文旨在为您提供不同的梯度下降优化算法最直观的作用,这将有助于您更好的使用它们。我们首先要看梯度下降的不同变体。 然后,我们将简要总结训练过程中的挑战和困难。

2019-08-09 14:15:11

Python3 基本数据结构总结

简介Python3基本数据结构有列表(list),元组(tuple),字典(dictionary)和集合(set)四种。

2019-09-22 18:33:24

图像生成:SaGAN

简介SaGAN,即生成对抗模型,是图像生成领域内的一种重要方法,它在2014年由Goodfellow提出,它的论文是《Generative Adversarial Networks》,GAN是在训练两个相互对抗的网络,一个生成器(Generator)和一个判别器(Descriminator)。当训练达到平衡时,对于一个输入噪声zzz。G(z)G(z)G(z)就是最后生成出来的图像。GAN原理...

2019-09-18 19:41:29

图像生成:GAN

GAN,即生成对抗模型,是图像生成领域内的一种重要方法,它在2014年由Goodfellow提出,它的论文是《Generative Adversarial Networks》,GAN是在训练两个相互对抗的网络,一个生成器(Generator)和一个判别器(Descriminator)。当训练达到平衡时,对于一个输入噪声z。G(z)就是最后生成出来的图像。

2019-09-15 17:44:54

C++ using用法

using作用: 引入命名空间,指定别名,在子类中引用基类的成员。

2019-09-03 23:20:53

人脸检测:SSH

SSH是一个用于人脸检测的one-stage检测器,提出于2017年8月,在当时取得了state-of-art的效果,论文是《SSH: Single Stage Headless Face Detector》,SSH本身的方法上没有太多新意,更多的是在把通用目标检测的方法往人脸检测上应用。

2019-09-06 14:04:01

目标检测(object detection)扩展系列(二) OHEM:在线难例挖掘

OHEM(Online Hard Example Mining)是一种在线的难例挖掘方法,它的论文是《Training Region-based Object Detectors with Online Hard Example Mining》,从时间上看它在Faster R-CNN的后面,但是文中没有在Faster R-CNN的基础上实验,而是选择了Fast R-CNN,将Fast R-CNN中的mini-batch sampling策略替换为OHEM,得到了不错的效果。

2019-09-05 18:36:26

人脸检测:FaceBoxes

FaceBoxes是一个足够轻量的人脸检测器,由中国科学院自动化研究所和中国科学院大学的研究者提出,旨在实现CPU下的实时人脸检测,FaceBoxes论文是《FaceBoxes: A CPU Real-time Face Detector with High Accuracy》。

2019-09-04 14:49:29

Caffe工厂模式解析

Caffe有五个基本组件,分别是Blob,Solver,Net,Layer和Proto,其中Solver和Layer使用了工厂模式,下面以Slover为例说明下。Solver的工厂模式在注册和调用的过程中体现,所以在说明工厂模式之前,我们首先要弄明白Solver在Caffe内部是如何被使用的。

2019-09-03 12:03:37

C++工厂模式

工厂模式分为3种,即简单工厂模式、工厂方法模式、抽象工厂模式,C++的工厂模式主要利用到虚函数。简单工厂模式工厂方法模式抽象工厂模式

2019-08-28 23:40:40

目标检测(object detection)系列(十二) CornerNet:anchor free的开端

过去的目标检测算法,two-stage方法从Faster R-CNN开始,one-stage方法从SSD开始,都无一例外的引入了anchor,anchor先验的引入使网络不需要从0直接预测Bounding box,这有利于目标检测器得到更好的效果。但是随着Anchor box的逐渐增多,它变成了目标检测算法的一个瓶颈,而CornerNet首次弃用了anchor box,就像它的名字一样,它将目标物体转化为检测左上角和右下角的点。

2019-08-25 18:09:16

目标检测(object detection)系列(十一) RetinaNet:one-stage检测器巅峰之作

在RetinaNet之前,目标检测领域一个普遍的现象就是two-stage的方法有更高的准确率,但是耗时也更严重,比如经典的Faster R-CNN,R-FCN,FPN等,而one-stage的方法效率更高,但是准确性要差一些,比如经典的YOLOv2,YOLOv3和SSD。而RetinaNet的出现,在一定程度上改善了这个问题,让one-stage的方法具备了比two-stage方法更高的准确性,而且耗时更低。

2019-08-24 17:33:22

目标检测(object detection)系列(十) FPN:用特征金字塔引入多尺度

SSD算法证明了多层分支对于目标检测的有效性,在此之前two-stage的目标检测方法已经优化改进过很多代,但是一直没有加入多尺度的方法。终于在FPN中,two-stage引入了多尺度,并且在SSD多层分支方法的基础上进一步改进,提出了特征金字塔网络。FPN的论文是《Feature Pyramid Networks for Object Detection》。

2019-08-22 14:12:15

人脸检测通用评价标准

简介人脸检测任务应该如何评价评价标准二分类的精准率和召回率人脸检测是目标检测的一个特例,因为目标类别只有一类,剩下的都是背景,所以人脸检测评价标准中会用到些二分类问题的评价,在这里先提一下。二分类问题最常用的就是精准率和召回率:精准率代表着预测为正的样本中有多少是正确的;召回率代表着总的正样本中有多少正样本被成功预测出来。假设实际测试集中有100个正样本和100负样本,100个...

2019-08-21 12:21:19

目标检测(object detection)系列(九) YOLOv3:取百家所长成一家之言

取百家所长成一家之言是一句书面意思上绝对褒义的话,形容一个论文却有些许的尴尬,但是YOLOv3确实是这样,没什么大的改动和创新点,而是融合借鉴了很多在其他的方案,最后效果还是很好的,文章中自己也提到了:“Wemadeabunchoflittledesignchangestomakeitbetter”,YOLOv3的论文是《YOLOv3:AnIncrementalImprovement》,真的是个很低调的题目,没有Better,Faster和Stronger。╮( ̄▽ ̄)╭

2019-08-18 18:54:41

如何计算CNN感受野、计算量和模型大小

下面以最经典的AlexNet模型为例子,计算感受野,模型计算量和大小(内存)。下面这张图是AlexNet的结构图,看起来比较直观。感受野感受野是检测和分割任务中比较重要的指标,它是一个逐层叠加的过程,计算到最后一层的卷积特征图输出上,它的计算公式是:RFi=RFi−1+(kernelsize−1)×stride,RF0=1RF_{i}=RF_{i-1}+(kernelsize-1)\tim...

2019-08-17 15:45:19

如何理解扩张卷积(dilated convolution)

扩张卷积(DilatedConvolution)也被称为空洞卷积或者膨胀卷积,是在标准的卷积核中注入空洞,以此来增加模型的感受野(receptionfield)。相比原来的正常卷积操作,扩张卷积多了一个参数:dilationrate,指的是卷积核的点的间隔数量,比如常规的卷积操作dilatationrate为1。它的论文是:《MULTI-SCALECONTEXTAGGREGATIONBYDILATEDCONVOLUTIONS》

2019-08-16 18:35:15

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。