2 Dlyldxwl

尚未进行身份认证

暂无相关描述

等级
博文 25
排名 5w+

VALSE2019小记

趁着有空去看了一波valse,和很多论文的作者当面讨论了一些问题,在此主要记录对一些paper的见解。1.FishNet:AVersatileBackboneforImage,Region,andPixelLevelPrediction根据欧阳万里老师介绍,这篇文章起初的motivation是希望将hourglass结构引入到分类网络中,看有没有效果,实验表明没...

2019-04-15 11:36:54

记录C++刷Leetcode

Leetcode刷题强烈建议用C++。一年没碰C++了,特在此记录一些常用语法。1.vector容器的push_back方法。该函数将一个新的元素加到vector的最后面,位置为当前最后一个元素的下一个元素,新的元素的值是val的拷贝(或者是移动拷贝);vector.insert给定的第一个参数,一般是begin()orend();遍历vector时,考虑使用begin()方法,参考链...

2019-03-31 10:53:35

SSD代码解读(三)——MultiboxLoss

SSD系列代码解读:(一)PriorBoxSSD系列代码解读:(二)DataAugmentationSSD系列代码解读:(三)MultiboxLoss本部分代码仍然是基于pytorch版本的,非官方的caffe实现。个人认为本部分是SSD中最为难懂的一部分。在解释MultiboxLoss之前,必须要弄清楚SSD的检测head部分数据走向,也就是输出了什么。for(...

2019-03-21 20:31:16

SSD代码解读(二)——Data Augmentation

SSD系列代码解读:(一)PriorBoxSSD系列代码解读:(二)DataAugmentationSSD系列代码解读:(三)MultiboxLoss本部分代码是pytorch版本的,非官方的caffe实现,贴上代码解读的同时会与caffe实现进行比较。先贴代码importtorchfromtorchvisionimporttransformsimport...

2019-03-08 17:30:03

极简论文笔记

Becauseofsometrivia,Ihavereadveryfewpapersinthepastfewmonths.Inthenextperiodoftime,Iwillcompensateit,andrecordmyunderstandingsofthepaperbyEnglish,meanwhilestrengthe...

2019-01-11 20:41:10

BatchNorm 理解

BN可以说是NN发展中的一个里程碑式的结构了,不增加inference时间,调参变得简单,收敛更快效果更好。虽然提出的时间已经很久了,而且网上关于BN的解释一堆一堆的,但是博主觉得有不少解释是欠妥的,在此贴出博主贴出对caffe中BN源码的解释和自己对BN的理解,欢迎讨论。caffe中BN的实现比较反人类。BatchNorm层单纯实现标准化,再用一个scale层添加  参数,共同完成BN。...

2018-09-24 21:14:00

mobilenet, shufflenet 系列随笔

mobilenNet系列出自Goole,shuffleNet系列出自Face++,这两个公司的文章都是值得反复去揣摩的,去思考这些网络背后设计的出发点和设计的原则,而不是单纯停留在仅仅读懂网络结构而已。当然本文均为笔者自身理解,读者觉得有不妥当的地方,欢迎讨论。为了方便,以下简记mobileNet为m,shuffleNet为s。MobileNetmv1是直筒状结构,xception使...

2018-08-03 20:23:56

deeplab系列总结(deeplab v1& v2 & v3 & v3+)

最近花了几天时间把deeplab系列撸了一遍,直观感受是不如当初看RCNN系列来的激动啊......像RPN这种划时代的改变没有看到--直奔主题。Deeplabv1&v2paper:deeplabv1&&deeplabv2远古版本的deeplab系列,就像RCNN一样,其实了解了后面的v3和v3+就可以不太管这些了(个人拙见)。但是为了完整性和连贯性...

2018-07-21 21:34:15

dilation conv 和 deconv

最近工作要用到dilation conv,在此总结一下空洞卷积,并和deconv进行对比。dilationconv首先空洞卷积的目的是为了在扩大感受野的同时,不降低图片分辨率和不引入额外参数及计算量(一般在CNN中扩大感受野都需要使用s>1的conv或者pooling,导致分辨率降低,不利于segmentation。如果使用大卷积核,确实可以达到增大感受野,但是会引入额外的参数及计算量)。...

2018-07-02 11:23:25

随笔记(二)

2018.06.03Python代码生成prototxt如下代码生成peleenet.prototxt。Python文件和deploy文件的github链接.求个小心心--#coding:utf-8#byChenyhtran_channel=32#growth_rateclassGenpelee():def__init__(s...

2018-06-03 20:22:52

DUC/STDN的caffe源码实现

CVPR2018有一篇detection的文章STDN,我之前记录过此文的笔记,文章的上采样方法和DUC基本无异(-!!),本人仍然坚守在caffe,目前要用到这个层,所以把这个层的代码实现一下。先不谈源码,等backward写完后在放到我的git上面。因为之前也没怎么写过layer,所以此处记录会犯错的地方。1.有一些在setup,reshape,forward等都会用到的变量,要定...

2018-05-07 20:33:46

SSD代码解读(一)——Prior Box Layer

SSD系列代码解读:(一)PriorBoxSSD系列代码解读:(二)DataAugmentationSSD系列代码解读:(三)MultiboxLoss本部分代码是基于weiliu的ssd,先贴prior_box.hpp代码。#ifndefCAFFE_PRIORBOX_LAYER_HPP_#defineCAFFE_PRIORBOX_LAYER_HPP_#incl...

2018-04-24 21:32:27

caffemodel的剪枝与压缩(二)

利用NetworkSlimmng对FSSD进行prune,在voc07上获得79.64的map,TITANX上150FPS的效果,链接:https://github.com/dlyldxwl/fssd.pytorch觉得都有用的看官朋友们,给个star随便写了点注释,代码贴上来了,写的比较粗糙,很容易看懂,无需多言.#coding:utf-8#bychenyh...

2018-03-09 21:27:47

STDN: Scale-Transferrable Object Detection 论文笔记

原文链接:Scale-TransferrableObjectDetection(暂时只有网盘的--)这篇论文是上交的,收录于CVPR2018。直接看算法过程。Figure1是几种常见的detect算法对比,(a)是最原始的用一层feature来predict;(b)是FPN,Top-down结构;(c)是SSD,多scale检测;(d)是STDN,也就是本文算法,大致可以看出是和SSD比...

2018-02-27 17:31:51

FSSD: Feature Fusion Single Shot Multibox Detector 论文笔记

论文:FSSD:FeatureFusionSingleShotMultiboxDetectorcaffe实现:链接该篇论文出自北航,看起来比较容易懂,因此笔记会写的简单一点。Introduction言归正传,本文是以SSD为基底进行“改造”的一篇文章。SSD是从网络的不同层中抽取不同scale的feature直接做predict,所以没有充分融合不同scale的feature。后

2018-02-14 12:07:18

caffemodel的剪枝与压缩(一)

利用NetworkSlimmng对FSSD进行prune,在voc07上获得79.64的map,TITANX上150FPS的效果,链接:https://github.com/dlyldxwl/fssd.pytorch觉得都有用的看官朋友们,给个starcaffemodel里每一层的卷积核维度为ouput-channel×input-channel×height×weight.本...

2018-02-09 15:34:18

Mobilenet V2 论文笔记

先上链接论文:InvertedResidualsandLinearBottlenecks:MobileNetworksforClassification,DetectionandSegmentation.原文:链接实现:caffe下的实现Introduction本文是谷歌公司的又一新作,目标主要是在提升现有算法的精度的同时也提升速度,以便加速深度网...

2018-01-18 21:59:01

Python 代码实现在线答题的自动搜索

这算是一个小插曲吧,即使mobilenetV2论文公布了,还是抵挡不了答题致富的幻想,,哈哈哈。。言归正传。因为一些答题外挂延迟太高,故自己操刀写了一个Python代码来实现自动搜索。算法的主要流程是:先对手机进行截屏,下载到电脑上;再对截屏进行裁剪,以获得题干部分的图片;接着OCR对题干图片进行字符识别并处理;最后获得url,使用baidu进行搜索。主要使用的工具有adb和tesserac

2018-01-18 10:34:26

two-stage算法一点思考

所有的two-stagedetection算法大致都由两部分组成:RPN生成proposal和对proposal的cls和reg。本科做毕设用了FasterRCNN,对此类算法稍稍有点了解,但是还是很多迷惑。最近本人认真研读了lightheadrcnn,对twostage算法进行了比较,也解答了之前的一些疑惑。一一列举:1.RPN网络中anchor和proposal的关系。以fa...

2017-12-17 16:36:02

Light Head R-CNN论文笔记

先上链接:论文:Light-HeadR-CNN:InDefenseofTwo-StageObjectDetector链接:https://arxiv.org/abs/1711.07264代码:TF链接introduction本篇文章介绍的算法是是旷视和清华大学在COCO2017比赛拿到冠军的算法。目前常用的objectdetection框架有两种:一种...

2017-12-04 21:37:54
奖章
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周上午根据用户上周的博文发布情况由系统自动颁发。