自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(55)
  • 收藏
  • 关注

原创 ResNet的一些

文章目录ResNetResNeXtwide-ResNet代码来自MXNETResNetResNet-18和ResNet-34使用的是Basic Block,而ResNet-50以及更深层的网络使用的是Bottleneck blockclass BasicBlockV1b(HybridBlock): """ResNetV1b BasicBlockV1b """ ex...

2020-04-18 22:20:15 323

原创 【ResNeSt】ResNeSt:Split-Attention Networks

代码(有pytorch和mxnet两个版本)论文(亚马逊团队张航 李沐)文章目录概述简介初步表现结构结果Training strategyResultsImage ClassificationTransform Learning Results概述简介文章很直接,主要是对ResNet这样的基础主干网络去进行结构上的细节设计。本论文之所以要去对ResNet结构进行改动,论文里也说到了:...

2020-04-18 21:29:03 1375

原创 【Deep Snake】DeepSnakeforReal-TimeInstanceSegmentation

浙江大学 CVPR 2020 oralpapercode文章目录overviewRelated workDetailResult从论文题目就可以看出论文要做的事情:实时的实例分割。方法,就是利用snake algorithm,但是这里结合深度学习,进而表述为Deep snakeoverview本文使用基于轮廓(contour-based)的deep snake方法,其中,论文提出...

2020-03-21 17:47:31 3205 1

原创 【xNets】MatrixNets: A New Scale and Aspect Ratio Aware Architecture for Object Detection

代码: CODE论文:PAPER文章目录概述IntroduceMatrixNets结构Advantages of MatrixNetsApplicationsExperiments概述针对问题目标的尺度问题采用的方法主干结构上的修改,可以说是FPN上的一种改进方案吧Contributions(个人总结)主要用来去增强一阶段网络,特别是对于非anchor-bas...

2020-03-14 23:45:49 564

原创 Cmake summary(Linux) from Cmake practice

介绍官网下载1. 初始格式CmakeList.txt文件# 设立工程名字PROJECT (HELLO)# 设置变量, SRC_LIST=main.cSET(SRC_LIST main.c)# 显示信息,其中的${HELLO_BINARY_DIR}和${HELLO_SOURCE_DIR}是在构建工程HELLO会自动生成的隐式变量MESSAGE(STATUS "This is B...

2019-09-09 10:39:08 156

原创 Cascade network——multi-stage refinement

文章目录ListPreviewAttractioNet(2016)CRAFT:CRAFT Objects from Images(2016)ListCascade R-CNNCombine Cascade R-CNN and Mask R-CNN——Cascade Mask R-CNNHybrid Task Cascade for Instance SegmentationPrevi...

2019-07-29 14:54:00 1539

原创 Objects as Points

code文章目录概述细节ResultConclusion概述要解决的问题One-stage anchor-free object detection采用的方法构建模型时将目标作为一个点——即目标BBox的中心点。我们的检测器采用关键点估计来找到中心点,并回归到其他目标属性,例如尺寸,3D位置,方向,甚至姿态结果如何MS COCO dataset, with 28...

2019-05-06 18:02:56 1258

原创 【FCOS】:Fully Convolution One-Stage Object Detection

2019年anchor-free的论文code文章目录概述细节ResultConclusion概述要解决的问题One-stage anchor-free object detection采用的方法center到top, left,right, bottom边距的回归由于采用了上述方法,出现了一些低质量的预测框,使用了“center-ness”方法来处理结果如何...

2019-05-06 15:21:18 203

原创 【DEXTR】Deep Extreme Cut:From Extreme Points to Object Segmentation

CVPR 2018文章目录概述细节ResultsConclusionkeypoint & problem概述要解决的问题弱监督分割通过一个object的left-most, right-most, top, bottom pixels作为输入(最初由Papadopoulos等人的Extreme clicking for efficient object annotatio...

2019-03-03 22:28:18 3571

原创 【ExtremeNet】: Bottom-up Object Detection by Grouping Extreme and Center Points

2019年的论文文章目录概述细节ResultsConclusion概述要解决的问题针对Anchor问题来进行思考的设计采用的方法One stage仿CornerNet,但是CornerNet是使用的 左上角和右下角两个点检测,而本论文是对top, left, bottom, right四个极端点,再加上一个center点来进行检测。借鉴了DEXTR的极端点方法。...

2019-03-03 12:15:56 901

原创 【H-DenseUNet】Hybrid Densely Connected UNet for Liver and tumor Segmentation from CT Volumes

这是一篇针对医学CT图上的而非公共数据集上的语义分割,由题目也可以看出,采用了UNet型结构。文章目录概述细节ResultsConclusion概述要解决的问题Liver cancer的CT图诊断要解决的问题就是2D convolutions不能对CT图的三维信息很好的利用如果是3D的卷积【各个框架都有实现】,会耗费很大的计算和内存资源采用的方法提出的bybrid d...

2019-01-17 19:49:49 3686 3

原创 【G-FRNet】Gated Feedback Refinement Network for Dense Image Labeling

CVPR 2017,他们还有一篇CVPR 2018的文章,Gated Feedback Refinement Network for Coarse文章目录概述细节ResultsConclusions概述要解决的问题模糊信息的前向传递会限制后面的精准识别。采用的方法结果如何Contributions细节ResultsConclusions...

2019-01-17 09:41:30 1604 3

原创 【FC-DenseNet】The One Hundred Layers Tiramisu:Fully Convolutional DenseNets for Semantic Segmentation

CVPRW(CVPR workshops) 2017【论文名字:提拉米苏】文章目录概述细节ResultsConclusions概述要解决的问题语义分割,没针对什么特别的问题,算是站在巨人的肩膀继续建造上层吧。采用的方法利用了DenseNets的结构的Dense连接结果如何achieve state-of-the-art results在Camvids和Gatec...

2019-01-14 09:25:55 793

原创 【PSPnet】Pyramid Scene Parsing Network

CVPR 2017,目前在google上显示已经被引用了744,相当厉害。文章目录概述细节ResultsConclusion概述要解决的问题Scene parsing解决:当前基于FCN的模型缺乏将全局场景类别线索利用起来的策略。比如在论文的fig2中,将水中的船识别为汽车,这是一个由于目标的外型相似造成的error,但是根据周围场景(诸如在水里之类的),可以得出这不是车而更可能...

2019-01-13 17:14:23 518 1

原创 【RefineNet】RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation

CVPR 2017文章目录概述细节ResultsConclusion概述要解决的问题实现high-resolution prediction采用的方法自己新设计的一些网络结构long range residual connecntionschained residual pooling结果如何IOU score of 83.4 on PASCAL VOC 20...

2019-01-12 18:17:44 822

原创 Mask RCNN代码

matterport/Mask rcnnmodel.py是网络主要构建的文件 utils.py中的anchor产生函数部分,主要是涉及函数:RPN部分scales:(32, 64, 128, 256, 512)ratios:(0.5, 1, 2)feature_shapes:[[256, 256], [128, 128], [64, 64], [32, 32], [16, 16...

2019-01-11 20:27:44 1617

原创 【E-Net & LinkNet】For Efficient

ENet: A Deep Neural Network Architecture for Real-Time Semantic segmentation.LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation.其中E-Net是2016年论文,LinkNet是2017年的论文(VCIP,Vi...

2019-01-11 20:24:16 3327 3

原创 【Decoupled NN】Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation

论文是发表在NIPS 2015年上的论文。文章目录概述细节ResultConclusion概述解决的问题半监督语义分割。采用的方法【在Abstract部分也说了】在当时,许多的方法都是将语义分割作为基于区域分类的单任务问题。所以这篇论文就提出了一个将语义分割解耦为分割和分类问题的半监督网络。且分割和分类两个任务的网络是单独训练。【半监督处于弱监督和全监督之间】文章说了这...

2019-01-10 22:12:43 568

原创 【DeepLabv3+】Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

这篇论文呢是参与了DeepLab整个系列的作者Liang-Chieh Chen的又咦新作。在V3的基础上进行的优化更新,故,又叫V3+。这个一作还参与了MaskLab系列和MobileNet系列的工作,其中就会设计到MobileNet的一些方法。ECCV2018...

2018-12-16 21:42:32 831

原创 【DeepLabV3】Rethinking Atrous Convolution for Semantic Image Segmentation

文章目录概述细节ChallengeOur Workresult概述以下主要来自其官方PPT文中提出两个语义分割的challenges:1、连续池化和下采样会让后面特征的分辨率下降,这对于做精细的分割是不利的。2、多尺度目标的存在。相对于V1、V2的改变:V3所提出的框架可以应用到任意的网络中,应该指的是主干网络。最后的ResNet block被重用多次,被安排进行级联操...

2018-12-06 11:24:32 468

原创 【DeeplabV1 & DeeplabV2】Semantic Image Segmentation with Deep Convolutional Nets And FC CRFs

ICLR 2015 (International Conference on Learning Representations)github-caffe文章目录概述细节section1section2section3resultConclusion概述解决的问题?语义分割;相对于以往的工作,要让分割的边界更加的精确(导致不精确的根本原因是高层特征的平移不变性,微微小的位置细节变...

2018-12-04 20:21:18 453

原创 【DSN】Deeply-Supervised Nets

这是一篇2014年的论文,还是有点年代感的,因为在Unet文章目录概述细节部分1、Motivation2、结构3、FormulationExperiments概述设计目的?让隐藏层的学习过程可以更加直接(direct)和透明(transparent)。减少分类的错误。让学习的特征更加的鲁棒性和discriminativeness(易区分的,独特的)更好的解决梯度爆炸和梯度消失的...

2018-11-30 16:02:18 4489

原创 【SegNet】 A Deep Convolutional Encoder-Decoder Achitecture for Image Segmentation

PAMI2017(IEEE Transactions on Pattern Analysis and Machine Intelligence)这篇论文的内容有点多,所以就跟着论文的节奏来写这篇博客了。文章目录概述IntroductionLiterature reviewArchitectureOneTwoThreeTraining根据论文的abstract来看,可以先总结如下:概述...

2018-11-28 21:31:23 582

原创 【Unet系列】Unet & Unet++

文章目录U-net概述细节部分1、结构的解析2、一些小点resultUnet++概述细节部分resultsummaryU-netU-Net是一篇基本结构非常好的论文,主要是针对生物医学图片的分割,而且,在今后的许多对医学图像的分割网络中,很大一部分会采取U-Net作为网络的主干。概述博客都将用一个概述对论文进行一个很简介的概述:解决什么问题?医学图像的分割使用的方法?继...

2018-11-27 13:01:12 87101 31

原创 【FCN】Fully Convolutional Networks for Semantic Segmentation

CVPR2015文章目录概述细节部分1、Introduction2、Related workFCN是一篇整体思想比较简单的论文,但是其训练的方法有许多的尝试,FCN可以说是深度学习引入语义分割的开山之作,文章主要强调了两个点:1、全卷积网络(FCN);2、端到端的学习(trained end-to-end)。概述解决什么问题?使用深度学习来解决图像分割的问题使用的方法?使用了图...

2018-11-24 08:58:36 423

原创 【YOLO】You only look once系列

YOLOV11、综述Yolov1是CVPR2016的论文,Yolov1的网络速度很快,可以实时处理图片,达到45fps,还有一种改进的fast Yolo(减少了一些卷积层),可以达到155fps,精度也比较高,虽然会在定位上错误比较高,但是会在将背景预测为正样本的情况较少。主要的思想就是将一幅图片分成一个SxS grid,每个cell负责检测落在其中的gt框内容,那么只有当gt框的中心落在...

2018-11-16 21:58:02 2116

原创 【RetinaNet】Focal Loss for Dense Object Detection

Focal loss是Kaiming He和RBG发表在ICCV2017上的文章。abstract:one-stage网络和two-stage网络相比,one-stage会得到大量目标位置。one stage不好的原因在于:极度不平衡的正负样本比例:abchor近似于sliding window的方式会使正负样本接近1000:1,而且绝大部分的负样本都是easy example,这样就...

2018-09-25 19:48:48 423

原创 【CornerNet】Detecting Objects as Paired Keypoints论文笔记

1、CornerNet是密歇根大学Hei Law等人发表的ECCV2018的论文。主要实现目标检测。这篇论文的主要是对Two-stage目标检测的Region Proposal阶段需要提取的anchor boxes上提出了一些观点。认为目前的boxes上的算法有如下drawbacks:需要选取大量的anchor box来保证有足够的与gt满足overlap阈值的anchor box。因为a...

2018-09-18 09:56:26 529

原创 【R-FCN】Object Detection via Region-based Fully convolutional Networks && light-head RCNN

一、R-FCN 1、概述本文作者Jifeng Dai,Yi Li,Kaiming He,Jian Sun。本文主要是在特征的通道维度上分块后,每一块取空间上某一部分组合成新的feature map来解决分类需空间不变性和检测任务需空间敏感性的矛盾。R-FCN是在faster RCNN基础上来改进的,主要是针对了fast/faster rcnn的在rpn中提取出的候选区都需要进行su...

2018-09-02 17:27:23 301

原创 【Mask RCNN】Mask RCNN论文笔记

Mask RCNN是大神Kaiming He的一大神作。1、概述Mask RCNN主要是再Faster RCNN上进行了一些调整(将RoIpooling层替换为了RoIAlign层),并且在RoIAlign后增加了一个进行instance segmentation的分支。图片来源上图展示了一个Mask RCNN的网络结构,用RoIAlign来代替RoIpooling部分,并且在分...

2018-08-22 17:15:08 870

原创 caffe的prototxt文件

【参考】data_layer1、Data层layer { name: "cifar" type: "Data" top: "data" top: "label" include { phase: TRAIN } transform_param { mean_file: "examples/cifar10/mean.binaryproto...

2018-08-18 18:29:24 22976 3

原创 caffe概览

参考1、caffe简单介绍优点:速度快。Google Protocol Buffer数据标准为caffe提升了效率。 学术论文采用此模型比较多。缺点:曾更新过重要函数接口。可能会造成版本兼容问题。 对某些研究方向的人并不合适caffe的代码层次:数据的保存、交换以及操作基本都是以blob的形式进行的,layer是模型和计算的基础,net整合并连接layer。Blob:是...

2018-08-16 19:58:32 262

原创 【Fast RCNN】Fast R-CNN论文笔记

本文分两个部分,第一个部分是论文的笔记,第二个部分是结合代码来看fast-RCNN。论文部分:主要是为了对RCNN,SPPnet的效果上的改进,下面简述了一些RCNN的缺点:Training is a multi-stage pipeline Training is expensive in space and time object detection is slow对于R...

2018-08-15 20:54:24 269

原创 【RCNN】Rich feature hierarchies for accurate object detection and semantic segmentation (RCNN)笔记

RCNN系列对比图,来源1、本文主要是记录RCNN。论文相对于以前的传统方法的改进有:速度,经典的目标检测算法使用滑动窗口依次判断所有可能的区域。本文则(采用selective Search方法)预先提取一系列较可能是物体的候选区域,之后仅仅在这些候选区域上进行feature extraction,进行判断。 训练集,经典的目标检测算法在区域中提取人工设定的特征。本文则采用深度网络进...

2018-08-14 15:22:00 262

原创 深度学习的一些数据集介绍

数据集分为三类:图像处理相关数据集,自然语言处理相关数据集和语音处理相关数据集。参考:here以下主要是图像处理相关数据集。1、mnist:详情MNIST数据来自美国国家标准与技术研究所,National Institute of Standards and Technology(NIST)训练集(training set)来自250不同的人手写的数字构成,其中50%是高中学生,50%...

2018-08-13 16:11:00 5632 3

原创 【NIN】Network in Network笔记

Network in Network是2014年的ICLR的非常厉害的一篇paper。是对传统的CNN的一种改进。1、摘要提出了NIN的深度网络结构来增强模型在感知野在局部图像块的辨别力。 传统的conv layer使用线性过滤器之后紧跟一个非线性激活函数的方法来扫描输入,而论文使用micro networks with more complex structures to abstra...

2018-08-12 15:29:32 470

原创 【FPN】Feature Pyramid Networks for Object Detection论文笔记

1、摘要Feature pyramids are a basic component in recognition systems for detecting objects at diferent scales.But recent deep learning object detectors have avoided pyramid representations, in part bec...

2018-08-09 15:11:25 432

原创 【SQUEEZENET】AlexNet-level Accuracy with 50X fewer parameters and 0.5MB model size

这是由UC Berkerley和Stanford研究人员一起完成的Squeezenet网络结构和设计思想。SqueezeNet设计目标是在保持精度(Alexnet)的情况下简化网络的复杂度。1、设计原则:尽量选择1*1卷积核来代替3*3卷积核,因为1*1的卷积核比3*3的卷积核参数少了9倍。 减少3*3卷积核的输入通道(input channels),因为卷积核参数为:(number o...

2018-08-08 13:37:58 1154

原创 VGG&&ZF笔记

VGG:Very deep Convolutional Networks for large-scale image recognitionZF:Visualizing and Understanding Convolutional Networks  VGG是牛津大学计算机视觉组(Visual Geometry Group)和(Google DeepMind)公司研究院一起研发的...

2018-08-05 21:03:55 2655

原创 【DenseNet】Densely Connected Convolution network笔记

1、摘要部分卷积网络现在做得越来越深,精确,并且训练起来越来越高效。本文根据这一个结论,提出了一种稠密卷积神经网络(DenseNet)。传统的L层卷积神经网络又L个连接——位于每一层和它后面一层,而我们的神经网络有,对于每一层,其输入的特征是之前的所有层,而它自己的输出特征则作为之后所有层的输入。2、Advantagealleviate the vanishing-gradient p...

2018-08-04 10:33:30 917

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除