自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(42)
  • 资源 (3)
  • 收藏
  • 关注

转载 Github上fork的项目怎么更新同步原项目

Github上fork的项目怎么更新同步原项目在GitHub上我们会去fork别人的一个项目,然后在自己的GitHub中会生成一个副本,自己将副本clone到电脑本地上可以修改代码,修改之后push提交到远端remote中的origin,发现自己的GIthub副本中的代码改变了,而作者变更的代码没有同步下来,这时你需要合并原作者的最新代码过来, 让你的项目变成最新的。一般有两种做法,第一种做法可谓...

2018-03-25 21:22:59 1745

转载 DSOD: Learning Deeply Supervised Object Detectors from Scratch 论文解读

原网址:http://blog.csdn.net/u014380165/article/details/77110702论文:DSOD: Learning Deeply Supervised Object Detectors from Scratch 论文链接:https://arxiv.org/abs/1708.01241 caffe代码:https://github.com/szq0214/D...

2018-02-23 18:00:43 634

转载 Synthetic Data for Text Localisation in Natural Images论文阅读

亮点是:里面有基于卷积神经网络的深度信息提取Synthetic Data for Text Localisation in Natural Images是VGG实验室2016年CVPR的一篇论文。这篇论文所做的主要贡献有两点:1.将word人工的嵌入到自然图片中,人工生成带有文本的图片(synthText)。2.提出一种FRCN的网络来检测文本。本文

2018-02-06 17:35:14 351

转载 图像融合之泊松编辑(Poisson Editing)(1):简略语言概述算法

原作者:Chris Tralie :http://blog.csdn.net/u011534057/article/details/68922197简介泊松图像编辑是一种全自动的“无缝融合”两张图像的技术,由Microsoft Research UK的Patrick Perez,Michel Gangnet, and Andrew Blake在论文“Poisson Image Ed

2018-02-06 15:48:31 841

转载 Tensorflow_seq2seq接口

简介Tensorflow 1.0.0 版本以后,开发了新的seq2seq接口,弃用了原来的接口。旧的seq2seq接口也就是tf.contrib.legacy_seq2seq下的那部分,新的接口在tf.contrib.seq2seq下。新seq2seq接口与旧的相比最主要的区别是它是动态展开的,而旧的是静态展开的。静态展开(static unrolling) :指的

2018-02-06 15:41:25 567

转载 deeplab_v3论文笔记

Deeplab-V3Rethinking Atrous Convolution for Semantic Image Segmentation摘要DeeplabV1&V2 - 带孔卷积(atrous convolution), 能够明确地调整filters的接受野(field-of-view),并决定DNN计算得到特征的分辨率;DeeplabV3 - 多尺度(multipl

2018-01-26 14:55:54 2855 3

转载 Pyramid Scene Parsing Network论文解读

Pyramid Scene Parsing Network收录:CVPR 2017 (IEEE Conference on Computer Vision and Pattern Recognition)原文地址: PSPNet代码:pspnet-githubKerastensorflow效果图:Abstract本文提出的金字塔池化模块( pyramid pooling module)能够聚合不同

2018-01-17 19:48:44 954

转载 Semantic Segmentation--ICNet for Real-Time Semantic Segmentation on High-Resolution Images论文解读

ICNetICNet for Real-Time Semantic Segmentation on High-Resolution Images转载URL:http://blog.csdn.net/u011974639/article/details/79007588原文地址:ICNet代码:github-CaffeTensorFlowAbstractICNet是一个基于PSPNet的实时语义分割

2018-01-17 19:44:53 438

转载 CRF as RNN语义分割

CRF as RNN语义分割原文地址:http://blog.csdn.net/hjimce/article/details/50888915作者:hjimce一、相关理论本篇博文主要讲解文献《Conditional Random Fields as Recurrent Neural Networks》,实现了图像语义分割的再次突破。首先我觉得这篇文献的题目

2018-01-12 11:17:43 1960

转载 CNN网络优化加速汇总

网络裁剪加速 Learning Efficient Convolutional Networks through Network Slimming ICCV2017 https://github.com/liuzhuang13/slimmingCNN网络通道裁剪加速 Channel Pruning for Accelerating Very Deep Neural Networ

2017-12-28 11:07:55 1732

转载 python数字图像处理:图像的绘制

实际上前面我们就已经用到了图像的绘制,如:io.imshow(img)  这一行代码的实质是利用matplotlib包对图片进行绘制,绘制成功后,返回一个matplotlib类型的数据。因此,我们也可以这样写:import matplotlib.pyplot as pltplt.imshow(img)imshow()函数格式为:matplotlib.p

2017-11-15 10:23:38 464

转载 Deep Compression阅读理解及Caffe源码修改

原文链接:http://blog.csdn.net/may0324/article/details/52935869更新: 没想到这篇文章写出后有这么多人关注和索要源码,有点受宠若惊。说来惭愧,这个工作当时做的很粗糙,源码修改的比较乱,所以一直不太好拿出手。最近终于有时间整理了一下代码并开源出来了。关于代码还有以下几个问题: ~1.在.cu中目前仍然是调用cpu_data接口,所以

2017-10-18 21:44:34 377

转载 机器学习中的L0,L1,L2讲解

1. 正则化概述(Regularization)           监督学习可以简单的理解为在最小化loss function 的同时,保证模型的复杂度尽可能的低,防止出现过拟合(overfitting)。常用的loss函数有square loss(Regression),Hinge Loss(SVM),exp-loss(adaBoost) 等。关于正则化(Regularization),它

2017-10-18 19:23:09 794

转载 图像特征概念

常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一 :颜色特征 (一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,

2017-10-18 14:57:55 1447

原创 字符串next函数求值

先看看next数据值的求解方法  位序       1   2   3   4   5   6   7   8   9   模式串     a   b   a   a   b   c   a   b   c    next值     0   1   1   2   2   3   1   2   3   next数组的求解方法是:1.第一位的next值为02.第二位

2017-10-11 21:31:26 12128 6

转载 深度学习算法调优trick总结

1:优化器。机器学习训练的目的在于更新参数,优化目标函数,常见优化器有SGD,Adagrad,Adadelta,Adam,Adamax,Nadam。其中SGD和Adam优化器是最为常用的两种优化器,SGD根据每个batch的数据计算一次局部的估计,最小化代价函数。学习速率决定了每次步进的大小,因此我们需要选择一个合适的学习速率进行调优。学习速率太大会导致不收敛,速率太小收敛速度慢。因此SG

2017-10-11 10:36:36 2385

转载 图像处理--形态学

最基本两个形态学运算----膨胀与腐蚀膨胀与腐蚀能够实现以下作用:   1.消除噪声   2.分割出独立的图像元素,在图像中连接相邻的元素   3.寻找图像中的明显的极大值区域或者极小值区域   4.求出图像的梯度需要注意之处: 腐蚀和膨胀都是对图像的白色部分(高亮部分)而言。膨胀是图像中的高亮部分进行膨胀,类似于领域扩张

2017-10-11 09:27:50 567

转载 特征金字塔特征用于目标检测:Feature Pyramid Networks for Object Detection

前言:这篇论文主要使用特征金字塔网络来融合多层特征,改进了CNN特征提取。作者也在流行的Fast&Faster R-CNN上进行了实验,在COCO数据集上测试的结果现在排名第一,其中隐含的说明了其在小目标检测上取得了很大的进步。其实整体思想比较简单,但是实验部分非常详细和充分。摘要:特征金字塔是多尺度目标检测系统中的一个基本组成部分。近年来深度学习目标检测特意回避金字塔特征

2017-07-05 19:20:50 20921 3

转载 deformable convolutional networks论文阅读理解

如同视觉是人们获取信息的主要渠道一样,计算机视觉也是人工智能研究领域的核心问题之一,已有几十年的研究历史。顾名思义,计算机视觉是研究如何让电脑“看懂”图像,例如,对图像中的物体进行识别、分割、跟踪和三维几何测量等。由于同样的物体在图像中可能呈现出不同的大小、姿态、视角变化甚至非刚体形变,因此如何适应这些复杂的几何形变是物体识别的主要难点,同时也是计算机视觉领域多年来关注的核心问

2017-07-05 16:13:06 774 1

转载 Surpassing Human-Level Performance on ImageNet Classification ImageNet Classification

在该文章的两大创新点:一个是PReLU,一个是权值初始化的方法。下面我们分别一一来看。  PReLU(paramter ReLU)所谓的PRelu,即在 ReLU激活函数的基础上加入了一个参数,看一个图就明白了:右边的图上多了一个参数吧,在负半轴上不再为0,而是一个可以学习的斜率。  很容易明白。实验结果显示该方法可以提高识别率。 权值初始化的方法:

2017-07-03 09:47:23 542

转载 class-aware detector 和 class-agnostic detector

For a class-aware detector, if you feed it an image, it will return a set of bounding boxes, each box associated with the class of the object inside (i.e. dog, cat, car). It means that by the time the

2017-06-10 11:35:52 707

原创 什么是C++虚函数、虚函数的作用和使用方法

在面向对象的程序设计中,经常会用到类的继承,目的是保留基类的特性,以减少新类开发的时间。但是,从基类继承来的某些成员函数不完全适应派生类的需要,例如在例12.2中,基类的display函数只输出基类的数据,而派生类的display函数需要输出派生类的数据。过去我们曾经使派生类的输出函数与基类的输出函数不同名(如display和display1),但如果派生的层次多,就要起许多不同的函数名,很不方便

2017-05-20 17:52:26 272

原创 利用caffe的solverstate在意外断电退出时继续训练

caffe可以在遇到突然断开时候重新训练。在训练的时候不仅会保存当前模型的参数(也就是caffemodel)文件,也会把训练到当前状态信息全部保存下来,这个文件就是solverstate文件。只要在训练的时候加上snapshot参数就可以了./build/tools/caffe train --solver=models/bvlc_reference_caffenet/solver.p

2017-05-18 15:19:24 1997

转载 YOLO9000: Better,Faster,Stronger论文笔记

原文下载:https://arxiv.org/pdf/1612.08242v1.pdf 工程代码:http://pjreddie.com/darknet/yolo/目录目录摘要简介BETTERFasterStronger总结要说的摘要提出YOLO v2 :代表着目前业界最先进物体检测的水平,它的速度要快过其他检测系统(Fast

2017-05-14 22:24:25 527

原创 条件随机场CRF

全连接条件随机场(DenseCRF)对于每个像素i具有类别标签xi还有对应的观测值yi,这样每个像素点作为节点,像素与像素间的关系作为边,即构成了一个条件随机场。而且我们通过观测变量yi来推测像素i对应的类别标签xi。条件随机场如下: 条件随机场符合吉布斯分布:(此处的x即上面说的观测值) P(X=x|I)=1Z(I)exp(−E(x|I))其中的E(x|I

2017-05-13 09:30:25 7104 1

转载 RFCN论文笔记

R-FCN论文阅读(R-FCN: Object Detection via Region-based Fully Convolutional Networks ) 目录作者及相关链接方法概括方法细节实验结果总结参考文献  作者及相关链接作者:作者链接:代季峰,何恺明,孙剑论文链接:论文传送门代码链接:matlab版,p

2017-05-12 15:46:05 41905 10

转载 检测和分割的一些技术路线和方法

1. R-CNN:Rich feature hierarchies for accurate object detection and semantic segmentation技术路线:selective search + CNN + SVMsStep1:候选框提取(selective search)训练:给定一张图片,利用seletive search方法从中提

2017-05-12 09:18:06 6273

转载 Detection物体检测及分类方法总结(RFCN/SSD/RCNN/FastRCNN/FasterRCNN/SPPNet/DPM/OverFeat/YOLO)

这里搜集了一些关于物体检测的方法分析和介绍,看好哪个可以去详细研究一下,基本都有论文或代码的链接。这里是简述各种方法,下面有详细叙述方法选择:========DPM=========使用传统的slider window的方法 计算量非常大========OverFeat====改进了Alex-net,并用图像缩放和滑窗方法在test数据集

2017-05-12 09:15:02 1951

原创 一些面试时候可能遇到的问题

1、请你自我介绍一下你自己,  回答提示:一般人回答这个问题过于平常,只说姓名、年龄、爱好、工作经验,这些在简历上都有,其实,企业最希望知道的是求职者能否胜任工作,包括:最强的技能、最深入研究的知识领域、个性中最积极的部分、做过的最成功的事,主要的成就等,这些都可以和学习无关,也可以和学习有关,但要突出积极的个性和做事的能力,说得合情合理企业才会相信。企业很重视一个人的礼貌,求职者要尊重考官,

2017-05-08 21:05:39 9299

转载 目标检测最新方法介绍

Jump to...LeaderboardPapersR-CNNMultiBoxSPP-NetDeepID-NetNoCFast R-CNNDeepBoxMR-CNNFaster R-CNNYOLOAttentionNetDenseBoxSSDInside-Outside Net (ION)G-CNNHyperNetMultiPathNetCRAFTOHEMR-FCNMS-

2017-04-18 23:13:33 2703

转载 yolo v2

说明这篇文章是训练YOLO v2过程中的经验总结,我使用YOLO v2训练一组自己的数据,训练后的model,在阈值为.25的情况下,Recall值是95.54%,Precision 是97.27%。 需要注意的是,这一训练过程可能只对我自己的训练集有效,因为我是根据我这一训练集的特征来对YOLO代码进行修改,可能对你的数据集并不适用,所以仅供参考。我的数据集1,用于训

2017-04-16 16:08:25 1541

原创 caffe 源码学习

Splitting类型(type):SplitSplit layer用于将一个输入的blob分离成多个输出的blob。这用于当需要将一个blob输入至多个输出layer时。Flattening类型(type):FlattenFlatten layer用于把一个维度为n * c * h * w的输入转化为一个维度为 n * (c*h*w)的向量输出。

2017-04-11 15:59:38 336

原创 感受野(receptive field)

学习RCNN系列论文时, 出现了感受野(receptive field)的名词, 感受野的尺寸大小是如何计算的,在网上没有搜到特别详细的介绍, 为了加深印象,记录下自己对这一感念的理解,希望对理解基于CNN的物体检测过程有所帮助。1 感受野的概念  在卷积神经网络中,感受野的定义是 卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。

2017-04-11 11:11:07 9152 2

原创 caffe接口及命令操作

caffe的运行提供三种接口:c++接口(命令行)、Python接口和matlab接口。本文先对命令行进行解析,后续会依次介绍其它两个接口。caffe的c++主程序(caffe.cpp)放在根目录下的tools文件夹内, 当然还有一些其它的功能文件,如:convert_imageset.cpp, train_net.cpp, test_net.cpp等也放在这个文件夹内。经过编译后,这些文

2017-03-31 10:29:22 348

原创 2017年工作参考资料

1.caffe源码:深度学习框架Caffe源码解析点击打开链接2.TensorFlow源码:Tensorflow代码解析点击打开链接3.ros indigo:ros学习与SLAM理解点击打开链接4.deeplearning--detection5.GAN最新research持续更新......

2017-03-27 09:52:34 257

原创 Batch Renormalization

BatchRenormalization本文系batch norm原作者对其的优化,该方法保证了train和inference阶段的等效性,解决了非独立同分布和小minibatch的问题。其实现如下:其中r和d首先通过minibatch计算出,但stop_gradient使得反传中r和d不被更新,因此r和d不被当做训练参数对待。试想如果r和d作为参数来更新,如下

2017-03-23 20:11:17 6150 1

原创 caffemodel中的参数及特征的抽取

如果用公式  y=f(wx+b)来表示整个运算过程的话,那么w和b就是我们需要训练的东西,w称为权值,在cnn中也可以叫做卷积核(filter),b是偏置项。f是激活函数,有sigmoid、relu等。x就是输入的数据。数据训练完成后,保存的caffemodel里面,实际上就是各层的w和b值。我们运行代码:deploy=root + 'mnist/deploy.pr

2017-03-23 10:04:22 732

原创 Pdollartoolbox 介绍及安装

Pdollartoolbox由UCSD的Piotr Dollar编写,侧重物体识别(Object Recognition)检测相关的特征提取和分类算法。这个工具箱属于专而精的类型,主要就是Dollar的几篇物体检测的论文的相关算法,如果做物体识别相关的研究,应该是很好用的。同时它的图像操作或矩阵操作函数也可以作为Matlab图像处理工具箱的补充,功能主要包括几个模块: * channe

2017-03-18 11:23:40 2946 1

原创 window环境下python2和python3共存时使用pip

首先查看下pip的路径,在命令行中输入where pip:这里说明了你的环境变量中有2个pip版本。比如:如果想安装python2的库,那么C:\Windows\system32>D:\Users\fg\Anaconda2\Scripts\pip.exe install XXXX如果想安装python3的库,那么C:\Windows\system32>C:\Users\

2017-03-05 15:15:51 548

原创 ubuntu14.04掉nividia驱动问题及其解决方法

网上的解决方法:通过附加驱动安装显卡驱动后有些不满意需要换驱动首先要卸载驱动 以我安装的nvidia-331-updates为例如果你安装的其它版本,请自行更改命令sudo apt-get remove --purge nvidia-331-updates如果安装的是官网下载的驱动则重新运行run文件来卸载sh ./nvidia.run --uninstall

2017-03-04 15:35:02 444

MySQL-python-1.2.5-win-amd64-py2.7.exe

window下,使用python开发mysql需要此文件。

2017-03-06

mysql-python-1.2.5.win-amd64-py2.7.exe

2017-03-05

机器学习代码实现

机器学习,里面有贝叶斯分类器代码,决策树,哈希代码,k平均代码,knn分类,逻辑回归分类,smo代码,数据集和样本点都在里面,可以让初学者更好连接算法的作用,是python就可以跑。

2016-05-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除