自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

灰巧克力爱松露

这个人很懒,什么也没写~

  • 博客(56)
  • 收藏
  • 关注

原创 新的开始

新的开始工作以后,就很少写博客啦。托CSDN的福,能够给大家分享一些可能有小点点用处的内容,当然从其他博主的分享对我也有着很大的帮助。随着深度学习对生活各方面的影响,每天手机微信里都塞满了各种公众号的关于最新AI论文的资讯。同时,我也时不时会感叹论文里惊人的实验结果和Github上普通的复现结果。正因为如此,我想做一种和以宣传为主的微信公众号截然不同的分享,并争取分享能够有两个特点:1)不追求关于最新方法的描述,因为看别的公众号即可;2)捞起和简化不知名大佬的方法实现,为深度学习方法增加更多的可能。

2020-05-16 11:38:24 392 1

原创 Wasserstein GAN

来自Martin Arjovsky等人的“Wasserstein GAN”。

2017-03-12 10:00:48 8084 1

原创 对抗的训练来从模拟和无监督图像中学习

来自Ashish Shrivastava等人的文章“Learning from Simulated and Unsupervised Images through Adversarial Training”。

2017-02-15 08:52:39 4401 2

原创 检测9000类物体的YOLO9000

本想总结一下,看完发现整篇文章多余的话有点少。YOLO的实时性众所周知,所以还等什么,皮皮虾我们走~

2017-02-11 12:58:36 8551 9

原创 用核化的相关滤波器来高速跟踪

原文来自 Joao F. Henriques 等人的“High-Speed Tracking with Kernelized Correlation Filters”。

2016-11-18 15:07:55 11719 8

原创 使用快速权重来关注最近的过去

Jimmy Ba 及 Geoffrey Hinton 等人的文章“Using Fast Weights to Attend to the Recent Past”。

2016-10-31 14:38:10 4527 1

原创 反卷积与棋盘效应

来自 Google Brain 的 Augustus Odena 等人的文章“Deconvolution and Checkerboard Artifacts“的部分内容。

2016-10-23 23:12:27 8555 1

原创 对抗的深度卷积生成网络来学习无监督表示

Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks.

2016-10-03 23:34:16 10908 5

原创 与判别网络对抗的生成网络 (Generative Adversarial Nets)

Generative Adversarial Nets / GANs

2016-10-01 01:11:50 9439 11

原创 循环和递归神经网络 (RNN) 与 长短时记忆 (LSTM)

即使不是 NLPer,现实中依然会面对很多序列问题。全文内容来自 Ian Goodfellow, Yoshua Bengio 和 Aaron Courville 3位大老爷的作品“Deep Learning”的其中一章“Sequence Modeling: Recurrent and Recursive Nets”。

2016-07-13 10:35:49 19090

原创 R-FCN:基于区域的全卷积网络来检测物体

CVPR 2016 阅读~ 原文标题为“R-FCN: Object Detection via Region-based Fully Convolutional Networks ”。

2016-06-29 14:07:07 44013 20

原创 CRAFT:级联的区域建议网络与快速RCNN结合

Benchmark上采用卷积神经网络提取特征的物体检测,通过改变卷积网络每层的参数似乎已羞于灌水~ 不过依然有人在指标上有一点改进,以国内李子青组的Bin Yang在 CVPR 2016 上发表的文章“CRAFT: Objects from Images”为例,看看基于卷积神经网络的物体检测问题还能怎么展开工作。

2016-06-27 09:53:15 5178 1

原创 FPGA视觉从入门到放弃——稀疏编码的原理与简单应用

先试一下它的效果。根据MNIST公开的分类器,误分类率小于0.6%的与卷积网络相关的方法主要有两种:2008年的“无监督稀疏特征 + 支持向量机”和起始于1998年的“卷积网络”。两者的特征提取分别基于稀疏编码和卷积神经网络。

2016-06-23 22:35:30 2105

原创 FPGA视觉从入门到放弃——小波矩与支持向量机刷MNIST

小波矩是FPGA板已有的模块,而深度学习框架下的MNIST的测试准确率可轻松地到99%以上。这里得到的效果不足以超越后者,由于内部影响依然做了该实验。所以,这些时间只够买个教训~

2016-06-21 16:12:00 1861

原创 FPGA视觉从入门到放弃——懒人的支持向量机

支持向量机曾是机器学习领域中的主流方法。针对小样本,现在用起来依然很方便。同时,该方面的工具和教程多得数不清。所以这里引用老师木的话就很合适:“经常,有些事还没做就已经知道它无意义,于是就没做;有些事做不做都知道无意义,还是蠢蠢欲动”。本篇围绕“用现有的库把自己的代码工作量减到最小”为话题,以比大多教程尽量简单的支持向量机理论和实践为例,讲述软件与硬件(DSP或FPGA等)结合时偷懒的方法。

2016-05-31 00:10:04 2194

原创 FPGA视觉从入门到放弃——削苹果剩下的小波矩

与特征点等主流方法相比,小波矩是计算机视觉中古老的偏方,追溯到1962年。虽很少提及,但该方法的思路比较有意思。后面以小波矩”从哪里来用到哪里去“为主线描述。数学渣顺便强行解释一波理论,请原谅我这里教材式的引用。~( ̄▽ ̄)~( ̄▽ ̄)~

2016-05-27 03:21:09 2050 1

原创 FPGA视觉从入门到放弃——可变光照下结构化模板对边缘提取的影响

FPGA视觉从入门到放弃——可变光照下结构化模板对边缘提取的影响1. 结构化模板FPGA视觉和计算机视觉的硬件区别在于,计算机(无GPU)串行运行代码,FPGA编译后生成并行计算的逻辑电路。计算机运行时可以边加载边释放内存空间,FPGA烧写后的电路是固定不变的从而无法释放空间。所以,实验中用到的大小为180*180的模板,在PC上运行没有问题,但在FPGA上因为硬件资源有限该模板并

2016-05-06 22:19:11 1731

原创 FPGA视觉从入门到放弃——灰度直方图提取

FPGA视觉从入门到放弃——灰度直方图提取一.贴士1.系统寄存器sysreg0相同的1位线:collect_enable,FPGA_A_DSP_B,DSP_reset_FPGA;2.系统寄存器相同的16位线:pix_num_threshold,crmaxmin,cbmaxmin。3.连接系统寄存器的线通常用于设置参数,这里用于设置矩形框的位置。 二.FPGA代码分析

2016-04-23 00:10:25 4035 1

原创 FPGA视觉从入门到放弃——Canny算子

FPGA视觉从入门到放弃——Canny算子一. FPGA视觉从入门到放弃简介本笔记仅适合实验室内部的FPGA图像采集卡,并不适合计算机视觉中的高大上场合,但功耗和速度很阔怕,同时方法简单得阔怕。毕竟没有什么方法或工具可以永远时尚下去,所以从入门到放弃也算是进步之选嘛~二. Prefix1.常用变量术语CLK         时钟20nsLLC

2016-04-21 21:37:08 6877 2

原创 Caffe与Lasagne使用——人脸关键点检测

Caffe与Lasagne 使用——人脸关键点检测一. Caffe求解回归问题在使用Lasagne之前,我尝试用Caffe做回归问题。毕竟Lasagne是基于Theano的,所以训练速度上Caffe占优。1. 尝试方法清理掉标签数据中的NaN值后,尝试过下述方法:(1) 输出数据根据最大值和最小值归一化到[0,1]区间内......

2016-04-13 17:28:52 4103 4

原创 Doppia(version-2)编译

Doppia(version-2)编译1. Doppia简介该C++和CUDA代码提供从立体图像中估计stixels,从单幅图像中检测行人和为新类训练检测器[1]。2. Doppia编译参考JpHu分四部分讲述Doppia version-1的编译及其准备工作[6],介绍得很详细。不过第四部分他和我遇到的问题出入比较大。我遇到的是由于CUDA_N

2015-12-23 15:14:36 1632

原创 Caffe学习——使用自己的数据(非图像)训练网络

Caffe学习——使用自己的数据(非图像)训练网络1. 鸢尾花卉数据集鸢尾花卉数据集包含150个样本,4个特征(花萼长度,花萼宽度,花瓣长度和花瓣宽度),3个类别(山鸢尾,变色鸢尾和维吉尼亚鸢尾)[1]。2. 所需的准备文件说明(1)prototxt文件xx_deploy.prototxt:设置只有前向计算时网络每层的结构。data层仅定义4

2015-12-22 22:55:09 14750 57

原创 Caffe学习——Imagenet分类

Caffe学习——Imagenet分类1. Caffe安装参考Alten Li的Caffe安装[1]。2. Imagenet分类代码来自Caffe的Notebook Examples[2]。在导入Caffe前,先在sys.path中插入Caffe的路径:examples文件夹下有子文件夹pycaffe(猜是安装Caffe时执行“make pycaffe”生成的文件夹),并没

2015-12-19 21:09:46 4557 1

原创 立体视觉——固定窗口的视差图计算

立体视觉——固定窗口的视差图计算1. 视差图计算[1]深度信息可以通过计算1幅图像和其它图像的特征位置的像素差获得。视差图和深度图很像,因为视差大的像素离摄像机近,而视差小的像素离摄像机远。按以米为单位来计算摄像机距物体多远需要额外的计算。根据Matlab教程,计算视差图的标准方法是用简单的块匹配(Block Matching)。我们选择右边图像中的1块小区域,并在左边

2015-11-22 23:44:01 15407 7

原创 Torch学习——有监督学习

Torch学习——有监督学习1. 街拍房间号数据集(SVHN)SVHN是对数据预处理和形式要求最小的现实图像集。和MNIST相似,但插入更多有标签数据并且来自1个更加困难,未解决的现实问题(识别自然场景图像中的数字)。SHVN来自谷歌街景图片。(1)简介a. 10类:每类为1个数字,数字1有标签1,数字9有标签9,数字0有标签10。b. 73257幅图像用于训练,26032幅图

2015-11-14 11:43:11 2513

原创 Torch学习——使用CUDA

Torch学习——使用CUDA1. CUDA安装CUDA在Ubuntu下的安装[1]还是很方便的。

2015-11-12 19:46:21 10993

原创 Torch学习——开始

Torch学习——开始1. 深度学习框架到目前为止出现了各种各样的深度学习的解决方案框架,其中包括Caffe,CUDA convnet,Pylearn2,Theano,Torch以及TensorFlow等。Caffe和CUDA convnet没用过,不过一直很火的样子,Pylearn2包含了CUDA covnet,入门用Theano,TensorFlow刚出来,谷歌又开始挖坑了,具

2015-11-10 21:55:06 1317

原创 用于视觉识别的卷积神经网络

用于视觉识别的卷积神经网络一.卷积神经网络(CNNs/ConvNets)1.架构概述a.1个卷积网络架构是一系列将图像体积转换成输出体积的层组成;b.层有不同的类型(CONV/FC/RELU/POOL是目前最受欢迎的);c.每层都通过1个可微函数接收1个3D体积且转换成1个输出体积;d.有的层有参数(CONV/FC),有些层则没有(RELU/POOL

2015-10-18 23:20:01 4021

原创 Galaxy Zoo Challenge解决方案小结

Galaxy Zoo Challenge解决方案小结1.过拟合如果不过拟合,说明你的网络不够大。模型过拟合问题缓和:(1)数据增强(2)Dropout和权重归一化约束(3)修改网络架构来增加参数共享2.预处理和数据增强a.剪裁和下采样424*424的彩色图像裁剪成207*207,3倍下采样成69*69,使得网络的输入大小可管理。

2015-10-17 15:31:52 1295 2

原创 Theano入门——卷积神经网络

Theano入门——卷积神经网络1.卷积神经网络介绍参考链接[1]和[3]。2.Theano实现(1)conv2d函数2D卷积。(2)dimshuffle(*pattern)函数置换维度的序列。pattern的举例如下:('x')->0维标量变为1维向量(0,1)->和2维向量们相同(1,0)->第1,2维互换('x',0)->1维向量从

2015-10-12 20:43:15 3829

原创 Theano入门——神经网络

Theano入门——神经网络1.神经网络介绍参考链接(1)。2.参数设置(1)模型分层(2)神经网络每层权重维度(3)块大小(4)学习率和动量学习率(5)训练次数3.代码实现(1)权重初始化w_h1,b_h1为神经网络第1层(输入层)的权重和偏置,输入层的输入节点有32*32个,输入层的输出节点有100个。w_h2,b_h2为

2015-10-12 20:42:39 1625

原创 Theano入门——Logistic回归

Theano入门——Logistic回归1.Logistic回归介绍参考链接(1)。2.参数设置(1)输入权重w输入权重矩阵的维度需要设置,行图像的大小,列为标签one-hot编码后的大小,cifar-10共有10类,所以为10;mnist标签为0~9,也是10。(2)学习率learning_rate这里为固定学习率。学习率越大收敛越快,但接近结果时可能会跳过最优

2015-10-09 17:26:52 1092

原创 Theano入门——CIFAR-10和CIFAR-100数据集

1.CIFAR-10数据集介绍CIFAR-10数据集包含60000个32*32的彩色图像,共有10类。有50000个训练图像和10000个测试图像。数据集分为5个训练块和1个测试块,每个块有10000个图像。测试块包含从每类随机选择的1000个图像。训练块以随机的顺序包含这些图像,但一些训练块可能比其它类包含更多的图像。训练块每类包含5000个图像。类间完全互斥。汽车和卡车类没有重叠。

2015-10-09 11:33:47 31126 3

原创 Theano入门——MNIST数据库

Theano入门——MNIST数据库

2015-10-08 23:33:47 3571 2

原创 Leap Motion Using Unity3D——环岛跑车篇

Leap Motion Using Unity3D——环岛跑车篇 一. Leap Motion简介        Leap Motion作为一款体感传感器,通过立体视觉捕捉红外图像信息并产生手掌在三维空间中的相关信息。下面会结合示例来说明Leap Motion采集的模型数据在跑车游戏中的应用。翻译来自Pierre Semaan的博客“Leap Enabling the Unity3D Ca

2015-06-30 21:37:37 3069

原创 Arduino Mega 2560与Arduino Uno R3——nRF24L01通信

nRF24L01通信1. nRF24L01通信简介(1)nRF24L01通信经历       先说说小菜鸟蛋疼调试模块的经历吧~有可能某些人觉得没有必要写这篇文章,因为Arduino作为开源硬件,本身容易上手例程也很多,直接跑就可以判断是软件问题还是硬件问题了。如果真的这样简单就没有下文了,因为在我刚刚了解的范围内,我觉得Arduino Uno R3的示例是很充分的,做到前面这一点真的

2015-04-18 21:15:12 10065 6

原创 Unity 3D——虚拟场景中的飞行摄像头

虚拟场景中的飞行摄像头1. 虚拟场景中的飞行摄像头简介        虚拟场景中的飞行摄像头是指在场景中运动的第一视角(嗯,应该好像大概是这个意思- -||)。这里我想说的重点内容不是如何去构建虚拟场景,而是如何让视角在场景中飞翔的思路。2. 主要思路(1)搭建虚拟场景(包括地形,光照和场景中的物体摆放等);(2)设置第一视角(创建第一视角,绑定路径规划的库文件iTweenPa

2015-03-28 11:07:40 3285

原创 OpenCV Using Python——基于SURF特征提取和金字塔LK光流法的单目视觉三维重建

基于SURF特征提取和金字塔Lucas-Kanade光流法的单目视觉三维重建1. 单目视觉三维重建问题        在前面的文章中,笔者用SIFT提取特征后用radio测试剔除了匹配中异常的特征点,然后根据匹配合格的特征点计算基础矩阵和本征矩阵,对本征矩阵SVD分解来估计和构造透视矩阵,根据透视矩阵和齐次坐标变换后的特征点三角化获得特征点在三维空间中的坐标。(1)找不到外极线

2015-03-16 20:50:10 9298 15

原创 OpenCV Using Python——单目视觉三维重建

单目视觉三维重建1. 单目视觉三维重建简介        单目视觉三维重建是根据单个摄像头的运动模拟双目视觉获得物体在空间中的三维视觉信息。已知单个摄像头在两个不同时间点上同时在空间中两个不同位置的图像等价于已知两个摄像头同一时间在空间两个不同位置的图像。所以问题分解为:(1)如何用单目视觉替换双目视觉,即如何确定单个摄像头在两个不同时间点的空间转换关系;(2)根据双目视觉确定图像

2015-03-11 08:40:32 29997 50

原创 OpenCV Using Python——调整基于HAAR特征的AdaBoost级联分类器的物体识别的参数

调整基于HAAR特征的AdaBoost级联分类器的物体识别的参数1. 基于HAAR特征的AdaBoost级联分类器的物体识别问题        Paul A. Viola和Michael J. Jones在2001年发表文章“使用简单特征的提高级联检测器的快速物体检测”。同时CSDN上很多博主在07年到13年也纷纷对该方法的原理,库函数内容,XML文件的训练以及OpenCV的实现做出很多工

2015-03-07 10:34:16 7915 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除