自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

hongbin_xu的博客

新的起点,不忘初心

  • 博客(179)
  • 资源 (26)
  • 收藏
  • 关注

原创 论文笔记:GVCNN: Group-View Convolutional Neural Networks for 3D Shape Recognition

GVCNN: Group-View Convolutional Neural Networks for 3D Shape Recognition1、四个问题要解决什么问题?3D shape recognition。用了什么方法解决?采用多视图(multi-view)的方法。在MVCNN的基础之上,提出了group-view convolutional neural netwo...

2019-07-21 10:21:05 4910 4

原创 论文笔记:KD-Net

Escape from Cells: Deep Kd-Networks for the Recognition of 3D Point Cloud Models1、四个问题要解决什么问题?3D点云识别任务。用了什么方法解决?参考KD树的结构,提出了一种新的树形结构的神经网络,用来处理不规则的点云数据。效果如何?在形状分类任务、形状检索任务以及形状部件分割任务中都取得了...

2019-06-27 21:41:06 3774 2

原创 论文笔记:PRIN: Pointwise Rotation-Invariant Networks

PRIN: Pointwise Rotation-Invariant Networks1、四个问题要解决什么问题?使用特殊结构的神经网络来提取具有旋转不变性的点云特征。用了什么方法解决?提出了一套新的网络结构:Pointwise Rotation-Invariant Network(PRIN),所提取的特征具有旋转不变性。预处理阶段,使用密度感知自适应采样(Density-A...

2019-06-11 17:43:15 2618

原创 论文笔记:Group Equivariant Convolutional Networks

Group Equivariant Convolutional Networks1、四个问题要解决什么问题?对卷积神经网络进行扩展,并提出一个在特定的变换(旋转、平移等,也可表示为一个特殊的群)下具有等变性的网络。用了什么方法解决?提出了一种新的卷积神经网络结构——群等变卷积神经网络(Group equivariant Convolutional Neural Network)...

2019-06-08 13:42:55 8035 3

原创 论文笔记:Spherical CNN

Spherical CNN1、四个问题要解决什么问题?3D场景下旋转不变性特征的提取。用了什么方法解决?提出了球形卷积操作,也叫作球形互相关(spherical cross-correlation)。球形卷积具有旋转不变性。为了增强计算效率,使用FFT(Fast Fourier Transform)来计算球形卷积。效果如何?在3D模型识别上效果还不错,与其他深度神经...

2019-06-03 20:40:27 3190 1

原创 论文笔记:Semi-Supervised Classification with Graph Convolutional Networks

Semi-Supervised Classification with Graph Convolutional Networks1、四个问题要解决什么问题?半监督任务。给定一个图,其中一部节点已知标签,剩下的未知,要对整个图上的节点进行分类。用了什么方法解决?提出了一种卷积神经网络的变种,即提出了一种新的图卷积方法。使用谱图卷积(spectral graph convolut...

2019-04-29 10:45:57 13220

原创 论文笔记:CycleGAN

CycleGAN1、四个问题要解决什么问题?图像翻译任务(image-to-image translation problems),域转换任务。用了什么方法解决?提出了CycleGAN的网络结构。目的是:通过使用一组对抗损失,学习到一个映射G:X→YG: X \rightarrow YG:X→Y,使得生成的样本G(X)G(X)G(X)的分布难以跟真实样本YYY的分布区分开来。...

2019-03-22 16:19:23 1862

原创 论文笔记:Geo-CNN

Modeling Local Geometric Structure of 3D Point Clouds using Geo-CNNGeoCNN1、四个问题要解决什么问题?3D点云具有不规则的结构,不能输入普通的CNN中。因此,要提出可以直接将点云作为输入的CNN网络。许多研究对局部几何信息特征提取的关注太少,还要能对局部区域的点的几何结构进行建模。用了什么方法解决?提出...

2019-02-16 21:20:05 3907 3

原创 论文笔记:MTCNN

Joint Face Detection and Alignment using Multi-task Cascaded Convolutional NetworksMTCNN1、四个问题要解决什么问题?人脸检测(face detection)和人脸对齐(face alignment)。用了什么方法解决?提出了一个深度级联网络结构,分成了三个阶段,从粗到精对人脸进行检测、定位...

2018-12-27 19:13:08 1307 1

原创 论文笔记:DGCNN(EdgeConv)

Dynamic Graph CNN for Learning on Point CloudsDGCNN1、四个问题要解决什么问题?使用深度学习处理3D点云。设计一个可以直接使用点云作为输入的CNN架构,同时可以获取足够的局部信息,可适用于分类、分割等任务。用了什么方法解决?提出了一个新的神经网络模块——EdgeConv。EdgeConv是可微的,并能嵌入已有的...

2018-12-26 10:41:30 42369 18

原创 论文笔记:Image Caption(Show, attend and tell)

Show, Attend and Tell: Neural Image Caption Generation with Visual AttentionShow, Attend and Tell1、四个问题要解决什么问题?Image Caption(自动根据图像生成一段文字描述)。用了什么方法解决?在Show and Tell提出的Encoder-Decoder架构的基础之上...

2018-12-06 15:18:22 3437 4

原创 论文笔记:Image Caption(Show and Tell)

Show and Tell: A Neural Image Caption GeneratorShow and Tell1、四个问题要解决什么问题?Image Caption(自动根据图像生成一段文字描述)。用了什么方法解决?作者提出了一个基于深度循环架构的生成式模型。训练时的目标是最大化这个从输入图像到目标描述语句的似然。效果如何?所提出模型在几个数据集上的效果...

2018-12-04 17:45:16 2951

原创 论文笔记:PointNet

PointNet: Deep Learning on Point Sets for 3D Classification and SegmentationPointNet1、四个问题要解决什么问题?3D点云是一种很重要的几何数据结构。由于其存在空间关系不规则的特点,因此不能直接将已有的图像分类分割框架套用到点云上。许多研究者会将3D点云转换为3D体素(voxel grids )或者一系...

2018-11-29 19:01:32 4139 1

原创 论文笔记:ShuffleNet v2

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture DesignShuffleNet v21、四个问题要解决什么问题?轻量化模型。用了什么方法解决?文中提出了几条设计轻量化模型的实践准则(guidelines)。Guideline 1:输入通道数与输出通道数保持相等可以最小化内存访问成...

2018-11-20 20:36:36 2108 2

原创 论文笔记:ShuffleNet v1

ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile DevicesShuffleNet v11、四个问题要解决什么问题?为算力有限的嵌入式场景下专门设计一个高效的神经网络架构。用了什么方法解决?使用了两个新的操作:pointwise group convolution(组卷积)和...

2018-11-20 15:51:12 1462

原创 论文笔记:Git Loss

原文:Git Loss for Deep Face RecognitionGit Loss1、四个问题要解决什么问题?诸如人脸识别、指纹识别等的识别任务,测试集不确定或类别较多而样本较少的情况。one-shot-learning。最小化类内差异,最大化类间差异。用了什么方法解决?提出了一个新的loss函数——git loss。git loss是基于center loss...

2018-11-15 14:58:53 830 1

原创 论文笔记:Distilling the Knowledge

原文:Distilling the Knowledge in a Neural NetworkDistilling the Knowledge1、四个问题要解决什么问题?神经网络压缩。我们都知道,要提高模型的性能,我们可以使用ensemble的方法,即训练多个不同的模型,最后将他们的结果进行融合。像这样使用ensemble,是最简单的能提高模型性能的方法,像kaggle之类的...

2018-11-08 14:44:22 1509

原创 论文笔记:DeepID2

Deep Learning Face Representation by Joint Identification-VerificationDeepID21、四个问题要解决什么问题?人脸识别。主要挑战是,设计一套方法能够有效地减少类内差异,并增大类间差异。用了什么方法解决?使用face identification(人脸分类)和face verification(人脸验证)...

2018-11-06 20:54:30 996

原创 论文笔记:MobileFaceNet

原文:MobileFaceNets: Efficient CNNs for Accurate Real-time Face Verification on Mobile DevicesMobileFaceNet1、四个问题要解决什么问题?设计一个在手机或嵌入式设备上可实时运行且具有高精度的人脸验证CNN模型。用了什么方法解决?以MobileNet v2网络为骨架,做了一些改进...

2018-11-05 19:33:40 4270

原创 论文笔记:ZFNet

ZFNet1、四个问题要解决什么问题?卷积神经网络具有很好的效果,在ImageNet上取得了开创性的成果,但是我们对其却没有一个直观的认识,以及它为何效果这么好,全当成黑盒子来用。用了什么方法解决?提出了一个新的卷积神经网络可视化技术,来辅助观察中间层以及最后的分类层的输出特征图。提出了ZFNet,并应用了反卷积技术来做可视化。效果如何?ZFNet的效果在Image...

2018-11-04 16:23:17 1198

原创 论文笔记:ResNet v2

ResNet v21、四个问题要解决什么问题?进一步提高ResNet的性能。解释为何Identity mapping(恒等映射)的效果会比较好。用了什么方法解决?提出了一个新的残差单元结构。从理论和实验上分析了identity mapping的有效性。效果如何?使用1001层的ResNet,在CIFAR-10数据集上错误率为4.62%,在CIFAR-100数据集上...

2018-11-03 19:52:05 832

原创 论文笔记:FCN

原文:Fully Convolutional Networks for Semantic SegmentationFCN1、四个问题要解决什么问题?语义分割。用了什么方法解决?提出了“全卷积神经网络”,可以接收任意尺寸的输入,并给出对应大小的输出。使用一些图像分类模型(如:AlexNet、VGG、GoogLeNet)等做迁移学习。使用skip architecture的...

2018-10-25 17:05:13 947

原创 论文笔记:Inception v1

原文:Going Deeper with ConvolutionsInception v11、四个问题要解决什么问题?提高模型的性能,在ILSVRC14比赛中取得领先的效果。最直接的提高网络性能方法有两种:增加网络的深度(网络的层数)和增加网络的宽度(每层的神经元数)。这样的做法有如下两个缺点待改进:构建更大的网络也意味着会有更多的参数,这也会让网络更容易过拟合。同时也会需要更...

2018-10-22 23:32:05 1298 1

原创 论文笔记:YOLO

原文:You Only Look Once: Unified, Real-Time Object DetectionYOLO1、四个问题要解决什么问题?对于目标检测任务来说,速度较快的算法性能较弱,然而性能较强的算法(如:R-CNN系列)耗时则更多,很难达到实时性的要求。大多数像RCNN这类的算法流程是,第一步先获取候选区域(region proposal),接着进行后处理(消除重...

2018-10-22 00:26:10 615

原创 论文笔记:PointSIFT

原文:PointSIFT: A SIFT-like Network Module for 3D Point Cloud Semantic SegmentationPointSIFT1、四个问题要解决什么问题?3D点云感知通常包含了三大任务:3D物体分类,3D目标检测,以及3D语义分割。在三个大任务中,3D点云的语义分割相对更具挑战性,也是这篇论文所要解决的问题。用了什么办法解决...

2018-10-16 11:34:27 9600 5

原创 论文笔记:Triplet Network

原论文:DEEP METRIC LEARNING USING TRIPLET NETWORKTriplet Network1、四个问题要解决什么问题?实质上,Triplet Network是Siamese Network的一种延伸,要解决的问题与Siamese Network的基本一致。与Siamese Network一样,适用于解决样本类别很多(或不确定),然而训练数据集的样本数又...

2018-10-15 20:34:34 13113 2

原创 论文笔记:MobileNet v2

原论文:MobileNetV2: Inverted Residuals and Linear BottlenecksMobileNet v21、四个问题要解决什么问题?与MobileNet v1所要解决的问题一样,为嵌入式设备或算力有限的场景下设计一个有效的模型。用了什么方法解决?一方面,沿用了再MobileNet v1中采用的depthwise separable conv...

2018-10-10 10:06:11 1521

原创 论文笔记:PPFNet

原论文:PPFNet: Global Context Aware Local Features for Robust 3D Point MatchingPPFNet1、四个问题要解决什么问题?在3D视觉中,3D几何信息的局部描述子在许多任务中扮演了很重要的角色,诸如:对应性估计、匹配、配准、物体检测以及形状恢复等。尽管近10年间,出现了一系列手工设计(hand-craft)的3D特征描...

2018-10-08 20:13:11 4759 8

原创 论文笔记:MobileNet v1

原文:MobileNets: Efficient Convolutional Neural Networks for MobileVision ApplicationsMobileNet v11、四个问题要解决什么问题?在现实场景下,诸如移动设备、嵌入式设备、自动驾驶等等,计算能力会受到限制,所以本文的目标就是构建一个小且快速(small and low latency)的模型。...

2018-10-07 12:59:08 11754 1

原创 论文笔记:残差神经网络(ResNet v1)

ResNet v11、四个问题要解决什么问题?/ 用了什么办法解决?理论上来说,深层网络的效果至少不会比浅层网络差。对于浅层网络A,深层网络B,假设B的前面部分与A完全相同,后面部分都是恒等映射,这样B至少也会与A性能相同,不会更差。在深层网络中存在梯度消失/梯度爆炸(vanishing/exploding gradients)。归一初始化(normalized init...

2018-10-03 16:40:29 14021 1

原创 论文笔记:孪生神经网络(Siamese Network)

Siamese Network原文:《Learning a Similarity Metric Discriminatively, with Application to FaceVerification》1、四个问题要解决什么问题?用于解决类别很多(或者说不确定),然而训练样本的类别数较少的分类任务(比如人脸识别、人脸认证)通常的分类任务中,类别数目固定,且每类下的样本数也较多(...

2018-10-01 21:54:20 46777 14

转载 Eigen库基本操作

Eigen 矩阵定义 #include <Eigen/Dense> Matrix<double, 3, 3> A; // Fixed rows and cols. Same as Matrix3d. Matrix<double, 3, Dynamic> B; // Fixed ro...

2018-08-29 10:36:50 1666

原创 Kinect学习(七):综合提取彩色、深度、人体骨骼点

前言前面的博客中介绍了如何通过Kinect获得彩色图像、深度图像以及人体骨骼点:Kinect学习(三):获取RGB颜色数据Kinect学习(四):提取深度数据Kinect学习(五):提取带用户ID的深度数据Kinect学习(六):提取人体关节点数据这次要将这几者综合起来,同时从Kinect那里拿来这些数据。代码这里的代码只是将前面几篇博客中的内容整合了一下,就不做过多...

2018-07-04 09:54:46 4810 9

原创 Kinect学习(六):提取人体关节点数据

前言Kinect可以通过处理深度数据来得到人体各个关节点的位置坐标,比如:头、手、脚等等。下面是人体的20个关节点的示意图: 这篇学习笔记的目标就是通过Kinect获取人体的骨骼点数据。代码#include <Windows.h>#include <iostream>#include <NuiApi.h>

2018-07-03 13:54:22 17118 11

原创 Kinect学习(五):提取带用户ID的深度数据

前言在前面的一篇文章中讨论了如何从Kinect获取深度图:Kinect学习(四):提取深度数据。 这里要对其进行拓展,Kinect可以获取两种格式的深度图:不带用户ID的深度数据,也是存储在16位的变量中,但是只使用了前12位,用来表示深度。带用户ID的深度数据,16位,前3位表示用户ID,最多可以识别6个人,后13位表示深度;在前一篇文章(Kinect学习(四):提取深度数据...

2018-06-25 16:42:49 2359 2

原创 Kinect学习(四):提取深度数据

前言前面试着提取了Kinect的彩色数据:Kinect学习(三):获取RGB颜色数据。这次,要试着提取深度数据。 Depth Map(深度图)是包含与视点的场景对象的表面的距离有关的信息的图像或图像通道。其中,Depth Map 类似于灰度图像,只是它的每个像素值是传感器距离物体的实际距离。通常RGB图像和Depth图像是配准的,因而像素点之间具有一对一的对应关系。代码先上代...

2018-06-25 16:04:49 10469

原创 Kinect学习(三):获取RGB颜色数据

前言在前面的文章中介绍了如何搭建Kinect开发环境:Kinect学习(一):开发环境搭建。搭建好环境后,首先要做的当然就是试着读取Kinect中的数据了。 Kinect有三个镜头,中间的是RGB摄像头,左边的是红外线发射器,右边的是红外线CMOS摄像头构成的3D结构光摄像头,用来采集深度数据。彩色摄像头最大支持1280*960分辨率成像,红外摄像头最大支持640*480成像。接...

2018-06-22 22:17:18 6084 6

转载 Kinect学习(二):学习资源整理(转)

转自:https://blog.csdn.net/zouxy09/article/details/8145688 刚刚接触Kinect,在网上狂搜资料,获得了很多有利于学习Kinect开发的资源,现整理如下: 首先当然是官方的API介绍了,编程少不了的。Kinect for Windows Programming Guide:http://msdn.microso...

2018-06-22 19:09:02 2169

翻译 VGGNet论文(Very Deep Convolutional Networks for Large-Scale Image Recognition)(译)

Very Deep Convolutional Networks for Large-Scale Image Recognition仅供参考,个人水平有限,如有不足谢谢指正。 原文地址:Very Deep Convolutional Networks for Large-Scale Image Recognition摘要在这项工作中,我们研究了卷积网络的深度对大规模图像识别任务精度的...

2018-06-22 17:42:18 6740

原创 Kinect学习(一):开发环境搭建

前言当初刚进大学时买了一台Xbox 360,为了玩体感游戏另外还买了一个Kinect

2018-06-20 11:27:11 22722 4

基于PYQT编写的一个人脸识别软件

详细请见我的博客:http://blog.csdn.net/hongbin_xu/article/details/79179194。 软件基于pyqt、dlib、opencv等库编写,包含有python源码和我打包好的exe可执行文件。

2018-01-27

眨眼检测代码

基于python dlib和sklearn的眨眼检测完整工程,详细请参考我的博客:http://blog.csdn.net/hongbin_xu/article/details/79033116。

2018-01-11

相机标定完整工程

参考我的博客:http://blog.csdn.net/hongbin_xu/article/details/78988450 张正友相机标定完整工程实现,开发环境为(win10+VS2015+OpenCV3.1.0)

2018-01-06

typora-setup-x64 .exe(windows)

typora windows 下64位安装包。到官网下载需要梯子,速度比较慢。typora是一款十分简洁易用的Markdown编辑器,支持实时预览。

2017-11-26

python dlib 训练人脸特征点检测器

python dlib库,训练人脸的68个特征点检测器。包含数据集,源码。详细可以参考我的博客:http://blog.csdn.net/hongbin_xu/article/details/78511923

2017-11-12

python dlib 人脸对齐代码

基于python和dlib编写的人脸对齐程序。包含了两个测试模型(人脸特征点68点检测和5点检测的模型),还有测试图片。详细可以参考博客:http://blog.csdn.net/hongbin_xu/article/details/78511292

2017-11-12

猫数据集(包含训练集和测试集)

我收集的猫数据集,用于训练基于HOG特征的分类器。 详细请参考我的博客:http://blog.csdn.net/hongbin_xu/article/details/78443289

2017-11-04

imglab 制作数据集标签

dlib提供的工具,用来制作数据集。打标签,最后会生成一个xml文件,可以在程序中调用。用于训练模型。

2017-11-04

基于PYQT编写的人脸识别软件

下载链接。我自己写的人脸识别平台软件,其中有两个下载链接。一个是python源码,需要配置好相关环境才能运行;一个是打包好的可执行文件,较大,可直接运行。注意win10下打包,win10和win8可以正常运行,win7不能运行。

2017-10-07

PyQt4 api查询文档

PyQt4文档,查询api很方便。Qt 4.4.2版本。Python语言。

2017-10-07

线性逻辑回归代码

机器学习实战。线性逻辑回归python实现的完整工程。里面包含了所使用的数据集。

2017-08-12

my_handwritings_test.tar.gz

自己的手写体识别代码和测试文件

2017-08-07

VGA时序标准

VGA时序标准,给出了时序参数的说明以及时序说明。

2017-08-02

zedboard官方SD卡启动文件

zedboard官方SD卡启动文件,存放在sd卡的FAT分区,引导zedboard进入Linux。

2017-07-04

OpenCV人脸识别样本数据集,包含正样本和负样本

网上收集来的人脸识别数据集,包含正样本(人脸)和负样本(背景),均有10000张以上图片;可以用来训练haar分类器。

2017-07-03

MATLAB车牌识别系统

两套自己编写的MATLAB车牌识别源码。第二套较第一套改进了一些。里面带了车牌的图片,在MATLAB下运行main.m文件,选择要识别的图片即可自动识别。

2017-06-23

Anaconda3-4.4.0-Linux-x86.sh

Anaconda3-4.4.0-Linux-x86.sh,机器学习利器。Linux、Ubuntu32位,百度云。执行bash Anaconda3-4.4.0-Linux-x86.sh,自动进行安装。

2017-06-23

Python小游戏(我自己写的)

基于Python、pygame的微信打飞机小游戏,由于这个是我自己写的,象征性地要1个资源分。另外还上传了网友贡献的微信打飞机小游戏源码,如果不想花积分的话可以去下那个。

2017-06-19

pygame小游戏源码

网上找到的基于Python和pygame开发的打飞机小游戏源代码以及音视频文件集。

2017-06-19

OpenCV_1.0安装包

opencv1.0版本的安装包,适用于《学习opencv》一书中的程序

2017-05-24

梯度下降法

梯度下降法

2017-03-09

Linux命令速查手册

2017-03-07

互补滤波法姿态解算(加速度计、陀螺仪)

互补滤波法姿态解算(加速度计、陀螺仪)

2017-03-03

互补滤波法

这是我在网上找的说明互补滤波法的框图,很不错。流程图很清楚地阐释了整个互补滤波的流程。

2017-02-24

pydev3.4.1

2017-02-20

OV7725摄像头液晶颜色识别下载

使用stm32驱动OV7725摄像头进行图像实时采集,在tft屏幕上实时显示并识别图像中的特定颜色,在颜色的周围画上框。

2017-02-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除