自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 资源 (3)
  • 收藏
  • 关注

原创 USB版本区别(USB2.0、USB3.0、USB3.1、USB3.2Gen1、USB3.2Gen2)

USB版本区别(USB2.0、USB3.0、USB3.1、USB3.2Gen1、USB3.2Gen2)、最大传输速率、最大输出电流、功率

2022-10-29 11:23:58 21450 1

原创 强化学习:Reinforcement Learning

当前的机器学习算法可以分为三种:有监督学习、无监督学习和强化学习有监督学习是从有标签的训练集中学习,每个样本的特征可视为对状态的描述,标签可视为执行正确的action,但是有监督学习不能学习交互的情景,只能从experience中学习,而experience的action并不一定是最优的。无监督学习是从无标签的训练集中发现隐藏的结构强化学习是在获得样本之后更新模型,利用当前的模型指导下...

2018-10-16 16:23:04 246

原创 myNote

faster rcnn在特征提取之前,首先对输入图像进行缩放,输出224×224×3的图像,然后才特征提取,原图的尺寸为1280×720,缩放之后对检测效果影响很大,训练的图像尺寸为600×450,与PASCAL VOC数据集保持了一致locate 文件名:可以定位文件的位置 ...

2018-10-15 18:52:41 519

原创 Generative Adversarial Nets论文笔记

GAN网络结构两个模型:两个模型都是多层感知机,第一个先定义输入噪声向量,映射到数据空间,获取生成器对样本数据的分布,并生成虚假样本;第二个输出一个标量,表示样本来自真实数据而不是生成数据的概率蓝色虚线是判别器D,绿色实线是生成器G生成的虚假数据的分布P(G),黑色虚线是真实数据的分布Px,下方的两个横线表示x=G(z)这个将噪声z映射到x的趋势。从a到d,随着迭代的进行,G的分布...

2018-10-14 11:08:41 666

原创 行人检测:Is Faster R-CNN Doing Well for Pedestrian Detection?论文笔记

背景Faster R-CNN对于object detection效果很好,但是对于detecting pedestrian效果一般专门为pedestrian detection设计的RPN作为一个独立的pedestrian detector表现很好,但是在把这些生成的proposals送入Fast R-CNN分类器时表现很差传统的pedestrian detectors大多是hand-...

2018-10-04 10:35:48 1619

原创 图像特征提取方法

 HOG(Histogram of Oriented Gradient,方向梯度直方图)简介HOG通过统计计算图像局部区域的梯度方向直方图来构成特征,然后结合SVM分类器进行图像识别,行人检测。主要思想梯度的方向是标量场增长最快的方向,梯度的大小是这个最大的变化率。对图像来说,图像的梯度即像素值变化最快的方向,并且图像的边缘与梯度保持垂直。图像局部区域的特征能够被梯度或边缘的方向密...

2018-10-03 11:23:22 11354

原创 Deep Residual Learning for Image Recognition论文笔记

背景神经网络越深越难以训练 堆叠网络层会造成梯度消失与梯度爆炸,阻止收敛。一般的解决办法是通过normalized initialization和intermediate normalization layers,保证几十层的网络通过反向传播的SGD收敛。 当网络层数增加,准确率会达到饱和,然后迅速下降。这不是因为过拟合,而是因为增加更多层会造成更高的训练错误率。创新提出deep r...

2018-09-30 16:51:13 243

原创 CS231N课程笔记

object recognition目标识别PASCAL Visual Object Challenge 20类机器学习算法:图模型、SVM、AdaBoost都很容易过拟合,因为数据维度太高,参数需要优化,训练数据集不足ImageNet:WordNet字典进行排序,22k类别,14m图片挑战赛:1k类,1.4m图片top5:输出概率最大的五个类别中有正确的对象认为识别成功应...

2018-09-18 11:21:31 195

原创 Ubuntu apt-get、pip、conda添加清华镜像源

apt-getapt(advanced package tool):管理Ubuntu软件包apt在etc/apt/sources.list 里记录了官方库的地址(美国),但是速度不能保证,可以添加清华镜像源1. 备份sources.listcp sources.listsources.list .bak2. 修改sources.list清空sources.list...

2018-07-24 19:31:04 15789

原创 Ubuntu 18.04 + CUDA 9.0 + cuDNN + Tensorflow测试

显卡驱动检测显卡型号及系统推荐显卡驱动fh@fh-pc:~$ ubuntu-drivers devices== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==modalias : pci:v000010DEd00001C82sv000019DAsd00002463bc03sc00i00vendor : NVIDIA Corpora...

2018-07-07 09:47:16 2106 2

原创 边缘检测算法汇总

Canny边缘检测算子Canny边缘检测算子是一个多级边缘检测算法。通常情况下边缘检测的目的是在保留原有图像属性的情况下,显著减少图像的数据规模。最优边缘准则Canny 的目标是找到一个最优的边缘检测算法,最优边缘检测的含义是:1.  最优检测:算法能够尽可能多地标识出图像中的实际边缘,漏检真实边缘的概率和误检非边缘的概率都尽可能小;2.  最优定位准则:检测到的边缘点的位置距离实际边缘点的位置最...

2018-07-02 20:43:31 5191

原创 Visual Studio编译常见问题汇总

warning C4819: 该文件包含不能在当前代码页(936)中表示的字符。请将该文件保存为 Unicode 格式以防止数据丢失虽然不影响程序的正常运行,但为了消除warning,方法有:1.  转换warning文件的编码格式2.  找到warning文件,在该文件的开始处加入一行代码:# pragma warning (disable:4819)3.  在“项目-> 属性->配...

2018-06-25 10:28:18 2836

原创 CMake编译OpenCV

    由于configure的时候没有选中BUILD_opencv_world和BUILD_opencv_contrib_world,所以库文件是分散的,如果需要像安装程序那样,请选中这两个进行编译

2018-06-23 17:46:31 780

原创 Visual Studio中VC++目录与C/C++及链接器的包含目录、库目录的区别

微软的官方解释VC++ Directories: Include Directories    1. this value is inherited from the INCLUDE Windows environment variable which is defined outside of Visual Studio    2. environment variables can be:...

2018-06-22 11:10:16 5408

原创 Mask R-CNN论文笔记

Abstract图像的目标检测与生成高质量的分割掩码同时进行基于Faster R-CNN,添加一个预测目标掩码的分支(与已存在的分支bounding box recognition并行)易于推广到其他任务,比如人类姿态估计(相同框架)instance segmentation、bounding-box object detection、person keypoint detection实例分割的挑...

2018-06-16 16:18:56 199

原创 One-Shot Video Object Segmentation论文笔记

方法第一帧的分割用于学习追踪特定目标的模型,然后对后续的视频序列进行分割

2018-05-31 11:29:26 711

原创 Visual Studio中xx.sln、xx.vcxproj、xx.suo文件的区别

1.  xx.sln是解决方案的配置文件,可以管理这个解决方案里的多个xx.vcxproj2.  xx.vcxproj是工程的配置文件,管理工程的细节,比如包含文件,引用库文件等注意:    一般没有sln,也可以直接打开vcxproj,也可以重新生成sln;当sln有多个工程时,移除某个工程sln会有变化,但sln并不是太重要。    真实文件的目录与解决方案和工程的目录并不一定一致,如果文件只...

2018-05-27 13:17:32 1717

原创 Windows10 + Visual Studio 2013 + OpenCV2.4.10配置

OpenCV2.4.10    1.  从官网https://opencv.org/releases.html下载OpenCV2.4.10,推荐Win pack方式(下载页面里的Sources和Win pack有什么区别?Sources只是源码,Win pack除了源码外还包括已经编绎好的支持各平台和语言对应的库文件,免去了编译)    2.  下载完成后得到一个exe文件,提取到制定目录即完成安...

2018-05-24 23:08:15 3708 2

原创 Faster R-CNN论文笔记

Abstract    RPN与detection network共享一整张图像的conv features    RPN是一个fully convolutional network,同时预测目标的scores和bounding-box    作者通过共享RPN与Fast R-CNN的conv features将其融合成一个网络...

2018-05-23 11:31:54 140

原创 Fast R-CNN论文笔记

目标检测要求对目标进行精确定位,这增加了复杂度,会产生两个主要的挑战:    1.  大量候选的目标定位(proposals)需要被处理    2.  候选的proposals只提供了大致的目标定位,需要通过优化获得更加精确的定位论文中,作者提出一种“单级训练算法”(single-stage training algorithm ),proposals分类与重新定位同时进行。R-CNN的缺点:  ...

2018-05-22 16:32:55 1075 1

翻译 RoI Pooling Layer

方法提出的背景目标检测一般分为两个阶段:    1.  输入一张image,输出一系列objects的可能位置(即:bounding box或region proposals或region of interest(ROI))        2.  确定1中的每个region proposal是否属于目标一类或者背景问题:    产生大量的region proposals,很难达到实时目标检测,并且...

2018-05-22 00:01:20 4246

转载 Bounding Box Regression

为什么要进行Bounding Box Regression?    绿色的框表示Ground Truth, 红色的框为提取的Region Proposal。如果对红色的框进行微调,使得经过微调后的窗口跟Ground Truth 更接近, 这样定位会更准确。Bounding box regression 就是用来微调这个窗口的。什么是Bounding Box Regression?    一般使用四...

2018-05-16 10:24:46 226

转载 SPP-Net

R-CNN检测一张图片需要47s?    R-CNN对图像提取Region Proposal(2000个左右)之后,将每个Proposal当成一张图像进行后续处理(CNN特征提取+SVM分类),实际上是对一张图像进行了2000次特征提取和分类。    这2000个Region Proposal都是图像的一部分,那么我们完全可以对图像进行一次特征提取的操作,然后将Region Proposal在原图...

2018-05-15 15:55:24 1527

原创 Windows+VS2013下Caffe编译安装教程(CPU版)

1.环境准备操作系统:Windows10编译环境:Visual Studio Ultimate 2013(推荐)2.caffe准备1.从Microsoft官方Github上下载Caffe源码并解压https://github.com/Microsoft/caffe2.在caffe-master\windows文件夹中,将CommonSettings.props.example文件更名为Common...

2018-05-03 12:09:13 665

Pattern Classification 2nd edition

Pattern Classification 2nd edition Duda(包括代码及手册)

2018-06-25

32位opencv3.2.0,编译器版本支持vc12及vc14,对应Visual Studio13及15

32位opencv3.2.0,编译器版本支持vc12及vc14,对应Visual Studio13及Visual Studio15,下载解压之后拷贝到x86文件夹下即可享用

2018-06-25

CNN、RCNN、Fast-RCNN、Faster-RCNN对比分析

R-CNN, Fast R-CNN, Faster R-CNN一路走来,基于深度学习目标检测的流程变得越来越精简,精度越来越高,速度也越来越快

2017-11-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除