自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Jinming Su

try doing and try to do.

  • 博客(391)
  • 资源 (11)
  • 收藏
  • 关注

原创 博客停更

写博客是为了知识总结,分享以及交流.但是,最近一段一直发现博客类似公众号一样,知识是没有连贯性的,没有严格的体系的.这样的知识对于读者通常只能作为碎片时间消磨时光的读物,没有发挥其最大的作用;对于作者也会导致对之前写过的东西需要很多次的重新整理以及更新,而且不便于查找.这个过程需要消耗大量的时间.我一直期望有那样一个系统,只是应该是以实际问题的需求存在,以清晰类别进行区分,但是目前来看,还并没有...

2019-04-07 19:48:50 687 1

原创 图像语义分割专栏论文列表

Alias Title Year PASCALVOC The Pascal Visual Object Classes Challenge: A Retrospective IJCV 2015 翻译 SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmenta...

2018-03-02 15:30:05 2501

转载 [转]linux系统创建SFTP用户及设置其chroot权限

转载自: https://blog.csdn.net/akeyile2010/article/details/50751834前言: 开发项目客户要求与三方通过sftp交互文件,我方系统部署sftp服务器。考虑安全,计划对提供给三方的用户实现chroot控制提供sftp本次选用的是系统自带的internal-sftp。 限制用户只能在home目录下活动,需要使用chroot...

2018-08-13 19:16:07 1070

原创 [工程-学习笔记] Pyqt5常用组件

参考: https://maicss.gitbooks.io/pyqt5/content/ 最近由于自己工作的需要,需要使用pyqt5写一点简单的东西,整理出一个大纲,了解一下pyqt5主要有哪些东西,需要查的地方就去常用模块QtWidgets: 包含了一系列创建桌面应用的UI元素QtGui: 包含了窗口系统、事件处理、2D图像、基本绘画、字体和文字类QtCore: 包...

2018-08-07 16:42:55 2513 1

原创 tensorflow API(1): tf底层API--tf.xxx

tf.xxx包含tensorflow自带的一些底层的API,主要包括函数和成员变量 https://www.tensorflow.org/versions/master/api_docs/python/tf Functiontf.abs(x, name=None)tf.add/subtract/multiply/div[ide](x, y, name=None) ...

2018-06-23 14:18:24 531

原创 tensorflow 调试

在代码中任何位置想要调试打印samples变量,可以进行如下操作: inputs_queue = prefetch_queue.prefetch_queue( variable_name, capacity=128 * config.num_clones)with tf.Session() as sess: init = tf.global_variables_initialize...

2018-06-21 22:37:49 532

原创 Tensorflow (2): tf.slim库解读

官方文档: https://github.com/tensorflow/tensorflow/tree/master/tensorflow/contrib/slim tf.contrib.slim是一个轻量级的库,目的是方便地定义, 训练和评估tensorflow中复杂的模型 版本: 2018.6.14主要作用对于一些固定的代码进行封装,主要是一些高级的层和变量,...

2018-06-15 15:44:08 2093

原创 Deeplab v3 (2): 源码分析

代码: https://github.com/tensorflow/models/tree/master/research/deeplab主要函数及注释如下main() # 配置GPU conifg = slim.deployment.model_deploy.DeploymentConfig(xxx) # Create a DeploymentConfig for...

2018-06-12 10:40:27 6289 4

原创 Tensorflow (1): 读取数据的三种方式及tfrecord的使用

参考: https://blog.csdn.net/lujiandong1/article/details/53376802 https://blog.csdn.net/happyhorizion/article/details/77894055读取数据的三种方式Preloaded data: 预加载数据import tensorflow as tf # ...

2018-06-09 15:29:18 1869

原创 pix2pixHD安装

安装pytorch这个照着官网来就行,本人使用pytorch 0.4.0 cuda 9.0,可以进行使用sudo pip install http://download.pytorch.org/whl/cu90/torch-0.4.0-cp27-cp27mu-linux_x86_64.whlsudo pip install torchvision安装dominatesud...

2018-06-05 11:04:57 3365 2

原创 Deeplab v3 (1): 源码训练和测试

本文主要介绍根据github tensorflow/models中官方代码来训练deeplab v3+源代码: https://github.com/tensorflow/models/tree/master/research/deeplab配置deeplab v3Clone 源代码, https://github.com/tensorflow/models.git根据官方...

2018-06-03 09:22:52 10696 15

原创 Deep Unsupervised Saliency Detection: A Multiple Noisy Labeling Perspective

AbstractCVPR 2018,西北工业大学和澳大利亚合作的文章. 监督学习的方法显著物体检测方法通常需要大量的标注(labor-intensive),并且可能阻碍了学习到的模型的泛化能力。本文提出一种新颖的若监督方法,从别的弱监督方法产生的结果进行学习,这些结果通常带有noise,因此本文提出y = y’ + n的思想,学习一个潜在的显著性预测模块和一个噪声模块。Movitat...

2018-05-02 21:03:05 2326

原创 【轻量级】轻量级网络结构总结

Depthwise-Wise convolutions是最近两年比较火的一种模块结构。这个结构第一次出现是在一篇博士论文中,L. Sifre. Rigid-motion scattering for image classification. hD thesis, Ph. D. thesis, 2014. 功力可想而知… SqueezeNet SqueezeNet: AlexNet...

2018-05-02 10:12:50 15429

原创 用于FCN的Pascal VOC 2012增强版语义分割数据集制作

数据集准备train/val/test的划分,这个采用Hariharan[1]的做法,这个也是deeplab采用的方法,下载地址https://ucla.app.box.com/s/rd9z2xvwsfpksi7mi08i2xqrj7ab4keb 目录如下: test.txt test_id.txt train.txttrain_aug.txt trainval...

2018-03-26 17:03:37 9668 19

原创 [FoveaNet]FoveaNet: Perspective-aware Urban Scene Parsing

Abstract清华大学和一些企业合作的文章,发表于ICCV 2017.文章主要目前,大多数的图片解析模型都将所有尺寸和位置的信息同等对待,而没有考虑汽车捕获的城市场景图片的几何属性. 因此,由于摄像头的透视投影,会导致存在不同的物体尺寸,并且不可避免地造成场景解析和识别错误.本方法在Cityscapes和Camvid上达到了SOTA. 本文的主要贡献:(1)提出透视评估网络来学...

2018-03-15 16:35:53 878

原创 [GCPNet]Scene Parsing with Global Context Embedding

Abstract加州大学美熹德分校发表在ICCV 2017上的工作. 本文利用全局信息进行场景解析。训练基于场景相似度的网络来产生一张图片的全局信息特征关系,然后利用该信息产生全局和空间的先验知识。最后将这些先验知识作为全局上下文线索结合到分割网络中。实验辨明这种做法可以较少与全局信息相悖的假正例,最后在MIT ADE20k和PASCAL Context上达到了不错的性能. 本文的主要贡献...

2018-03-14 23:10:41 788

原创 [SGN]SGN: Sequential Grouping Networks for Instance Segmentation

Abstract香港中文大学ICCV 2017的文章 实例分割是一个结合了物体检测和语义分割的任务,物体遮挡和数量差异大的物体是实例分割中的主要困难。本文考虑到实例分割的困难性,提出将这个复杂的任务用一系列神经网络来解决,其中每个神经网络的左右都是将该程度下的语义信息进行聚集,从而使用简单的结构逐渐构造物体实例。其中,第一个网络在图片的水平和竖直方向生成断点,接着使用一种算法将点连接成先...

2018-03-14 20:52:43 2358

原创 [zoom-out]Feedforward semantic segmentation with zoom-out features

AbstractCVPR 2015的文章,作者来自芝加哥丰田技术学院。早期的方法大多基于随机场结构来获取结构信息,本文考虑不使用这些方法来解决分割问题. 本文的语义分割方法是基于超像素级别的,主要做法就是使用缩放结构来利用不同等级的空间特征对超像素的类别进行判定,从而达到分割的目的. Frameworklocal zoom 即所求超像素块proximal zoom 超...

2018-03-06 20:02:32 717

原创 ParseNet源码训练和分析

ParseNet官方源代码位置: Caffe: https://github.com/weiliu89/caffe/tree/fcn model: https://gist.github.com/weiliu89/45e9e8de2c13af6476ca#file-readme-md编译Caffe直接从github上clone下来代码 git clone htt...

2018-03-05 10:23:58 1181 3

原创 [ParseNet]ParseNet: Looking Wider to See Better

Abstract北卡罗纳大学教堂山分校的文章, ICLR 2016. 本文的 Movitation 是看到FCN并没有结合全局信息,所以没有利用潜在的scene-level的语义上下文特征,所以提出一种结合average feature的网络结构来提高分割性能,最终在SiftFlow和PASCAL-Context上达到了SOTA, 在PASCAL VOC 2012上接近SOTA(Deepla...

2018-03-02 22:25:36 3410

原创 Residual attention network for image classification

AbstractCVPR2017的文章,商汤、清华、港中文和北邮合作的文章。基本想法就是受现在的attention mechanism 和residual的激励,考虑把两者放在一起实现更好的效果。 本文的主要贡献是: 可堆叠的网络结构注意力残差学习Bottom-up top-down相结合,自底向上是特征提取,自顶向下是attentionFrameworkA...

2018-03-02 19:30:22 1610

原创 [U-Net] U-Net: Convolutional Networks for Biomedical Image Segmentation

Abstract生物学会议ICMICCAI 2015相关的文章,主要是针对生物学影像进行分割。本论文考虑到医学影像往往比较少,而深度学习通常需要大量的图像。因此本文提出采用很强的数据增强提高数据的利用效率;提出U型网络模型——近似对称的Conv + Deconv.最终在三个生物学数据集上达到了当时最好的性能。Movitation当今生物影像分割的数据太少,现有的滑动窗口的做法消耗时...

2018-03-02 15:54:54 2457

原创 使用sftp创建新用户和分配目录

应用场景有时候一个网站中又有一些子网站,这个时候每个子网站可以交个个人去维护,可以分配一个空间,因此需要为每个人申请一个用户名。 创建用户组 groupadd member配置member目录mkdir memberchown root:root memberchown 755 member创建新用户useradd -d member/user1 -s /...

2018-02-26 22:44:58 2375

原创 Deep networks with stochastic depth

AbstractECCV2016的文章,和DenseNet同样的作者,这篇文章早于DenseNet. 深的网络在现在表现出了十分强大的能力,但是也存在许多问题。主要是梯度消散、前向传播中信息的不断衰减、训练耗时长等问题。本文主要是提出随机深度,在训练时使用较浅的深度(随机在resnet的基础上bypass掉一些层),在测试时使用较深的深度,较少训练时间,提高训练性能,最终在四个数据集上都超过...

2018-02-07 19:36:41 2665

原创 Residual Networks Behave Like Ensembles of Relatively Shallow Networks

Abstract本文是NIPS2016的文章,作者来自Cornell大学. 本文主要是对residual networks进行解释。首先,使用解构的思想吧ResNet等价于一组不同长度的路径的集合;然后采用了lesion study的方式揭示了不同路径之间并没有强依赖,尽管它们是联合学习的;最后,通过实验验证了大多数路径是短的,主要是短路径在学习,长路径不贡献梯度.最终得出一个结论,ResN...

2018-02-06 21:01:44 416

原创 [IDW-CNN]Learning Object Interactions and Descriptions for Semantic Image Segmentation

IDW-CNNAbstractCVPR 2017的文章,中山,港中文,商汤和中科院深研院合作的文章,和DIS是相同的作者. 本文仍然是立足于说现有的图像详细标注太少,导致语义分割的性能的首选,所以采用一种若监督的方法来提升性能(这个motivation似乎可以是所有弱监督方法的mt).本文提出使用Image Descriptions in the Wild(IDW)数据集结合VOC2...

2018-02-05 23:42:09 438

原创 [SDN]Stacked Deconvolutional Network for Semantic Segmentation

Abstract暂时还放在arxiv上,没有出版.中科院自动化所模式匹配国重的文章. 在本文看来,语义分割存在的主要问题是分辨率的降低导致物体细节和小物体损失,现在的很多方法都是致力于如何更好提高分辨率.本文于是提出了Stackecd Deconvolutional Network(SDN) Module来使用逐一堆叠的结构来集成上下文信息,更好地回复局部信息。 Introduct...

2018-02-05 20:44:45 1155 1

原创 [DIS]Deep Dual Learning for Semantic Image Segmentation

AbstractICCV2017的文章,港中文,中山和商汤合作. 本文认为现在的语义分割的性能并没有完全被开发出来,原因是需要大量的pixel级别的标注。本文的目的就是提出dual image segmentation(DIS),半监督来提高分割效率。DIS的三个主要优点是: (1)利用tags来提高labelmap的结果 (2) 能够clean tags that have noises ...

2018-02-02 20:02:05 945

原创 [SDS]Simultaneous Detection and Segmentation

Motivation作者认为,尽管检测和分割被分成两个任务,但是这些差异都是人为设定的。因此,这里应该存在一种任务——Simultaneous Detection and Segmentation,这个其实就是后来的instance segmentation. 本文的目标就是提高SDS task的性能. Framework * proposal generation 由于是分...

2018-02-01 21:10:47 2456

原创 Learning Hierarchical Features for Scene Labeling

基本情况这是PAMI2013的一篇文章,作者是LeCun等人,所属领域是Image Segmentation.Abstract本文提出了一种多尺度CNN,并且结合超像素的最佳覆盖,实现语义分割。在Sift Flow(33类)和Barcelona DataSet (170类)打破记录,在Stanford Background Dataset(8类)接近记录。产生320 ×240图像标...

2018-01-31 23:46:49 862

原创 The Setup of Deeplab v2

1. Clone the codeRefer to http://blog.csdn.net/Xmo_jiao/article/details/778971092. Make the datasetRefer to https://blog.csdn.net/u014451076/article/details/79700653 Note: When we convert th...

2018-01-31 19:46:00 559 7

原创 The Setup of FCN

Pipeline1. Clone the codeRefer to https://github.com/shelhamer/fcn.berkeleyvision.org2. File Structure- data // store the dataset - pascal- voc-fcn32s // store the code os voc-fcn...

2018-01-30 10:43:52 362

原创 计算机视觉中upsampling(上采样)的三种方式

bilinear双线性插值是目前在语义分割中用的比较多的一种方式,比如FCN中就是用的这种方法。 这种方法特点是不需要进行学习,运行速度快,操作简单。只需要设置好固定的参数值即可,设置的参数就是中心值需要乘以的系数。 一个简单的例子可以参考如下(来自互联网): 具体的实现方式,可以直接参考fcn.berkerlyvision.org中的surgery.py如下: def u

2018-01-24 23:53:36 56048 5

原创 [caffe使用]caffe使用中可能遇到的问题总结

h5py版本不匹配 只需要设置环境变量HDF5_DISABLE_VERSION_CHECK=2即可

2017-11-05 21:17:07 750

原创 [linux使用]Ubuntu16.04屏幕分辨率无法调节

问题描述新安装好的ubuntu16.04屏幕分辨率是1024x768,这个分辨率是不正确的,但是在display中,只有一个选项就是1024x768猜测原因猜测可能是因为显卡配置不正确导致的,电脑上目前只有集成显卡,没有独立显卡解决方法试了网上的一些方法,其中有一个是在/etc/default/grub中进行设置,感觉是最可信的,但是并没有生效,最后采取的方法是使用脚本进行强制设置. 脚本如下(r

2017-11-04 21:00:00 5794

原创 [NetWrap]Semantic Video CNNs through Representation Warping

ICCV2017的文章,arXiv:1708.03088 [cs.CV],德国的几个研究院所与NVIDA合作的文章. Abstract提出了一种方法将用于静态图片语义分割的CNN架构转化为能够用于视频图像进行语义分割的CNN架构. 主要采用的思想使用增强现有的架构,具体使用方法是添加NetWrap模块,借助的主要信息是optical flow的计算和整合. 最终达到在CamVid...

2017-10-28 15:07:34 2235 1

原创 [论文笔记]Predicting Deeper into the Future of Semantic Segmentation

引介ICCV2017的文章,arXiv:1703.07684 [cs.CV],本文有LeCun的署名.Abstract预测接下来视频帧的单纯的RGB像素值已经被研究了很久,本文提出了一种新奇的任务——预测接下来的视频帧的语义分割. 同时,本文提出了一种自动回归CNN(AR-CNN)来进行迭代生成多帧.Model数据采用Cityscapes数据集,分辨率转化为1...

2017-10-27 13:18:10 1191

翻译 [论文翻译]A review on image segmentation techniques

引介1993年Pattern Recognition的文章.Abstract许多图像分割技术在文献中是可用的。这些技术中的一些仅使用灰度级直方图,有些使用空间细节,而其他技术则使用模糊集理论方法。大多数这些技术不适合嘈杂的环境。使用对噪声具有鲁棒性的马尔科夫随机场(MRF)模型进行了一些工作,但是引入了额外计算。由于并行处理能力,有助于实时获取输出的神经网络架构也被用于分割,即使在...

2017-08-29 10:12:50 1960

原创 [python]python必学的五个包

NumPyNumpy为Python提供了快速的多为数组处理的能力(也包括矩阵操作的能力,但是并不常用) 学习资料: 《利用python进行数据分析》SciPySciPy是在NumPy基础上添加了众多的科学计算工具包,包含了线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等等.可以说,NumPy和SciPy的有机结合,Python就有几乎和Matlab一样的处理数据和计算的能力了. 学习

2017-08-18 12:55:11 1246

原创 [DeCAF]DeCAF: A Deep Convolutional Activation Featurefor Generic Visual Recognition

基本情况ICML 2014的文章, arXiv:1310.1531 [cs.CV].主要通过实验证明transfer learning的可行性. Abstract本文评估从大型固定的一组对象识别任务中以完全监督的方式训练的深卷积网络的激活提取的特征是否可以重新利用到新的通用任务.在很多情况下,由于没有足够的标注或者未标注的数据来常规地训练一个深度结构用于新的任务(这会导致过拟合),因此本文尝试把提

2017-08-15 15:53:28 1385

语义分割数据集SBD中使用Tools脚本

本来想设置成免费的,可惜资源分竟然设置不了免费,抱歉了各位。这个是pascal voc语义分割任务中增强的sbd使用的一些脚本

2018-05-07

《机器学习系统设计》

《机器学习系统设计》,用python进行机器学习的入门书籍

2017-08-23

python机器学习

《python机器学习》入门类书籍

2017-08-23

《21天实战Caffe》

《21天实战Caffe》, Caffe入门书籍

2017-08-21

spring-boot1.3官方教程中文版

spring-boot1.3官方教程的中文翻译版,适合熟悉Java而想要学习spring-boot的同学

2017-08-19

冈萨雷斯数字图像处理MATLAB版中文版

冈萨雷斯数字图像处理MATLAB版中文版

2017-08-18

caffe中文教程

caffe官方文档中文翻译版

2017-08-18

神经网络与深度学习

著名的《神经网络与深度学习》,(美)Michael Nielsen 著,这个是中文翻译版

2017-08-18

flex-2.5.35

具体可参见我的blog《ubuntu安装win1.8》

2016-04-24

oj--merry christmas

一个下雪的js特效,挺漂亮的,适用于圣诞节,春节等

2015-12-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除