丶Minskyli-CSDN博客

目录为什么提出解决什么问题现有文献相关工作基本思想及其过程PlaneNet平面参数分支平面分割分支非平面深度分支实验及测试数据集实现细节实验结果平面分割准确率论文名称：PlaneNet:Piece-wise Planar Reconstruction from a Single RGB Image为什么提出利用单张RGB图像得到分段重建平面深度图。分段平面几何理解对于比如机器人或者增强现实A...

2018-10-29 21:39:34 3508 2

翻译深度学习之视频换脸

使用卷积神经网络快速换脸文章目录论文名称：Fast Face-swap Using Convolutional Neural Networks###摘要我们考虑在图像中的换脸问题，在保留姿势、面部表情以及光照的情况下将输入身份换成目标身份。为了执行这种映射，我们使用训练过的卷积神经网络来从非结构化的目标身份的图像中捕捉到他的外观信息。这种方法通过将换脸问题转化为风格迁移来实现，目标是以另一...

2018-10-17 12:23:09 15685 3

翻译深度学习之Pix2PixHD

基于条件生成对抗网络的高分辨率图像合成及语义处理摘要1 引言2 相关工作3 实例级图像合成3.1 pix2pix Baseline3.2 提升照片逼真度和分辨率3.3 使用实例图Instance Maps3.4 学习一个实例级特征嵌入embedding4 结果4.1 质量比较4.2 人类感知研究4.3 交互式对象编辑5 讨论和结论论文...

2018-09-12 10:19:29 28104 6

翻译深度学习之Deep Image CTR Model

DICM in AMSDICM in AMS摘要1 引言2 相关工作3 DEEP IMAGE CTR MODEL3.1 展示广告系统3.2 问题描述3.3 利用图像建模4 AMS4.1 PS和其限制4.2 AMS的体系结构4.3 由AMS实现的DICM4.4 测试和在线部署5 基于用户建模的图像5.1 图像embedding模型5.2 用户行为图像聚...

2018-09-06 20:57:53 2011 3

翻译展示广告中冷启动问题的图像特征学习

展示广告中冷启动问题的图像特征学习摘要1 引言2 相关工作3 点击预估问题公式化4 特征学习结构4.1 任务分析与结构设计4.2 视觉元素位置建模4.3 在一个机器上处理大型数据集4.4 减少过拟合4.5 训练细节4.6 效率和性能的权衡5 实验5.1 实验设置5.2 只比较图像特征5.3 结合基础特征和图像特征5.4 判别图像特征：广告种类5.5 ...

2018-09-04 15:39:43 2197 3

翻译深度学习之DeepCTR

展示广告中的深度CTR预估摘要1 介绍2 相关工作2.1 展示广告CTR预估2.2 深度神经网络3 方法概述4 网络结构5 加速训练5.1 稀疏全连接层5.2 数据采样6 实验6.1 实验设置6.1.1 数据集6.1.2 原型6.1.3 评价指标6.1.4 网络配置6.2 结果分析与讨论6.3 可视化Convnet7 结论...

2018-08-28 22:35:48 7431

翻译深度学习模型压缩之MobileNetV2

摘要1 引言2 相关工作3 预备知识、讨论、直觉3.1 深度可分离卷积3.2 线性瓶颈(Linear Bottlenecks)3.3 反向残差(Inverted residuals)3.4 信息流解释4 模型结构5 执行记录5.1 内存有效管理6 实验6.1 ImageNet分类6.2 目标检测6.3 语义分割6.4 模型简化测试(Ablation s...

2018-06-02 18:56:43 6364 6

翻译深度学习之MobileNetV1

深度学习模型压缩之MobileNetv1 [TOC]摘要我们针对移动端以及嵌入式视觉的应用提出了一类有效的模型叫MobileNets。MobileNets基于一种流线型结构使用深度可分离卷积来构造轻型权重深度神经网络。我们介绍两个能够有效权衡延迟和准确率的简单的全局超参数。这些超参数允许模型构造器能够根据特定问题选择合适大小的模型。我们在资源和准确率的权衡方面做了大量的实验并...

2018-05-30 12:13:18 31586 1

原创 Ubuntu16.04+1080ti+cuda8.0+cudnn6.0+Anaconda3+opencv3+pytorch+tensorflow-gpu+pycharm配置

总体流程安装Ubuntu16.04及显卡驱动禁用nouveau驱动禁用Secure Boot安装Anaconda3、CUDA8.0、cudnn6.0、opencv3安装anaconda3安装CUDA8.0安装cudnn6.0安装pytorch，安装tensorflow，安装opencv，配置pycharm安装pytorch安装tensorflow-gpu安装op...

2018-04-16 17:04:46 2009

原创深度学习之CNN反向传播

互相关卷积反向传播卷积层池化层  大多数人了解推导的都是全连接层的反向传播公式，全连接层的每一层都可以看作是一个一维向量，其中的元素即代表权重，而CNN中的卷积操作以及池化操作的反向传播，你又了解多少呢？虽然二者思想一致，却又有着诸多不同之处，理解CNN的反向传播之前，先了解下互相关以及卷积的概念。互相关 &nbs...

2018-04-12 17:15:14 3428

原创剑指offer之从尾到头打印链表

时间限制：1秒空间限制：32768K题目描述      输入一个链表，从尾到头打印链表每个节点的值。原始解法-利用堆栈的性质：先进后出 vector<int> printListFromTailToHead(ListNode* head) { vector<int>...

2018-04-05 13:54:24 197

原创剑指offer之替换空格

时间限制：1秒空间限制：32768K题目描述      请实现一个函数，将一个字符串中的空格替换成“%20”。例如，当字符串为We Are Happy.则经过替换之后的字符串为We%20Are%20Happy。原始解法      先计算出空格的数目，然后...

2018-04-03 22:19:56 177

原创剑指offer之二维数组中的查找

时间限制：1秒空间限制：32768K题目描述      在一个二维数组中，每一行都按照从左到右递增的顺序排序，每一列都按照从上到下递增的顺序排序。请完成一个函数，输入这样的一个二维数组和一个整数，判断数组中是否含有该整数。原始解法–逐列进行查找运行时间：9ms 占用内存：1512k bool Find(...

2018-04-03 17:07:35 165

原创剑指offer之数组中重复的数字

时间限制：1秒空间限制：32768K题目描述      在一个长度为n的数组里的所有数字都在0到n-1的范围内。数组中某些数字是重复的，但不知道有几个数字是重复的。也不知道每个数字重复几次。请找出数组中任意一个重复的数字。例如，如果输入长度为7的数组{2,3,1,0,2,5,3}，那么对应的输出是第一个重复的数字2。...

2018-04-02 22:32:08 326

原创程序员必备基础知识之七大查找算法

查找0、查找算法说明0.1 查找的定义0.2 查找算法分类1、顺序查找1.1 说明1.2 基本思想1.3 复杂度分析1.4 代码实现2、二分查找2.1 说明2.2 基本思想2.3 复杂度分析2.4 代码实现3、插值查找3.1 说明3.2 基本思想3.3 复杂度分析3.4 代码实现4、斐波那契查找4.1 说明4.2 基本思想4.3...

2018-03-27 15:53:10 957 3

原创程序员必备基础知识之十大排序算法

0、排序算法说明0.1 排序的定义0.2 术语说明0.3 算法总结0.4 算法分类1、冒泡排序（Bubble Sort）1.1 算法描述1.2 动图演示1.3 代码实现1.4 算法分析2、选择排序（Selection Sort）2.1 算法描述2.2 动图演示2.3 代码实现2.4 算法分析3、插入排序（Insertion Sort）**3.1 算法描述3.2 动...

2018-03-23 17:16:57 613

原创深度学习目标检测之R-CNN

为什么提出提出的背景基本思想及其过程利用R-CNN进行目标检测模块设计时间测试检测训练可视化，消融和错误模型网络结构检测错误分析区域提取子训练数据验证集与评估消融研究与Overfeat的关系语义分割CNN特征用于分割结论为什么提出R-CNN文章名字为”Rich feature hierarchies for accurate o...

2018-03-01 16:19:55 2500

原创最新！Win10+Tensorflow-gpu+Anaconda+Pycharm

电脑配置： Windows10 显卡:GTX1060(笔记本)大致流程：安装cuda->Cudn->Aanacond->Tensorflow 切记！！版本很重要安装CUDA安装CUDA8.0！！！很多博客都推荐去官网下，但是这几天nvidia官网下载的网页出错在维护，不得已我就去百度云找资源找到了cuda_8.0.61_win10.exe。记住版本！！！官网下载选择LOCAL!!! 然后按推

2017-10-12 11:32:08 5449 3

原创深度学习之GoogLeNet-v3解读

为什么提出提出的背景基本思想及其过程通用设计原则利用扩大滤波器尺寸来分解卷积辅助分类器的实用性网格尺寸减少很有效InceptionV3标签平滑的模型正则化训练方法低分辨率输入上的表现为什么提出？—针对计算效率和低的参数量的标准，为了进一步的优化googlenet，将卷积核分解。。提出的背景由于之前都关注的是网络的准确率，但是要真正运用深度学习，更应该关注如何能运用他，也就是要效

2017-09-22 21:17:08 2728

原创 Tensorflow学习之卷积神经网络实现（六）

本次主要在Tensorflow中实现ResNetV2，通常认为神经网络的深度对其性能非常重要，但是网络越深其训练那度越大，于Resnet相似的Highway Network的目标就是解决极深的神经网络难以训练的问题。修改了每一层的激活函数，此前的激活函数只是对输入做一个非线性变换y=H(x,Wh),而Highway Network则允许保留一定比例的原始输入x，即y=H(x,Wh)T(x,Wt)+x

2017-09-18 16:44:27 717

原创 Tensorflow学习之入门学习总结(持续更新......)

三种利用会话Session的方法使用withDevice语句明确指定哪个cpu或gpu被调用变量variables和placeholder怎么区分tensorflow网络运行流程图数据输入数据增强的方法定义网络结构paddingSAME和VALID的区别定义损失函数和优化算法评估模型三种利用会话Session()的方法：（1） sess=tf.Session()result =

2017-09-13 15:00:41 626 1

原创 Tensorflow学习之实现卷积神经网络（五）

本次学习的卷积神经网络结构为GoogLenet,其中最显著的改进就是提出了inception结构，而inception结构也随着对网络模型的进一步深入研究，共提出了四个版本。其中Inception V1最大的特点就是控制了计算量和参数量的同时，获得了非常好的分类性能，其降低参数量的目的有两点：第一，参数越多说明模型越庞大，需要供模型学习的数据量就越大；第二，参数越多，耗费的计算资源也会更大。Ince

2017-09-11 21:11:42 973

原创深度学习之GoogLeNet-v2解读

为什么提出提出的背景基本思想及其过程Batch Normalization的优点减少内部协变量的偏移问题通过Mini-Batch统计量归一化利用批处理网络进行训练和推理批处理卷积网络BN允许高学习率BN能正则化模型inception v2为什么提出？—由于网络结构中每层的参数都会变化，训练每层的输入使得深度神经网络的训练变得非常复杂，在要求低学习率以及比较好的参数初始化情况下，要

2017-09-11 09:39:10 4248 3

原创 Leetcode-8. String to Integer (atoi)

Implement atoi to convert a string to an integer.Hint: Carefully consider all possible input cases. If you want a challenge, please do not see below and ask yourself what are the possible input cases.N

2017-09-06 10:46:19 224

原创 Leetcode-1. Two Sum

1. Two SumGiven an array of integers, return indices of the two numbers such that they add up to a specific target.You may assume that each input would have exactly one solution, and you may not u...

2017-09-03 10:03:34 204

原创 Tensorflow学习之卷积神经网络实现（四）

本次主要实现的是VGGNet，这个网络所有的卷积核大小都为3x3，最大池化层都用的2x2的大小，正是由于VGGNet的探索，发现小型的卷积核在效果比5x5,7x7等大卷积核效率（两个3x3的卷积层串联相当于一个5x5的卷积层，即一个像素会跟周围5x5的像素产生关联，但3x3的参数量更少，3x3x2<5x5，并且拥有更多的非线性变换，使得CNN对特征的学习能力更强）差不多的情况下，更有助于网络深度的提

2017-09-01 14:44:40 674 1

原创 Google深度学习目标检测API模型比较

谷歌最新推出了一个目标检测API，其中利用经典的目标检测模型Faster-rcnn，SSD以及RFCN，并且选用了不同的CNN如resnet101，resnet-v2，mobilenet以及inceptionv2，训练了5个目标检测的模型。github地址如下。 Google目标检测API 为了在自己的项目中应用目标检测，实时性以及准确性的要求比较高，虽然官方给出了一个比较的列表如下：但是

2017-08-29 14:28:43 3280

转载 Tensorflow资源之经典网络实现

本系列文章由 @yhl_leo 出品，转载请注明出处。文章链接： http://blog.csdn.net/yhl_leo/article/details/57412234 本文简单整理了网上公布的基于 TensorFlow 实现图像语义分析的一些经典网络，方便大家参考学习。1. TensorFlow-SlimTF-Slim 是 tensorflow 较新版本的扩充包，可以简化繁杂的网络定义

2017-08-25 10:47:32 375 1

原创 Tensorflow学习之实现卷积神经网络（二）

本次使用cifar10数据集，这是一个经典的数据集，包含60000张32x32的彩色图像，其中训练集50000张，测试集10000张，标注为10类，每一类图片6000张，10类分别为airplane、automobile、bird、cat、deer、dog、frog、horse、ship和truck。下面利用一个5层的神经网络，其中两层卷积层，三层全连接层来训练测试这个数据集。 from

2017-08-21 20:00:12 427

原创 Tensorflow学习之TensorBoard

TensorBoard是Tensorflow的一个可视化工具，可以看见整个网络结构，以及将模型训练过程中的各种汇总数据展示出来，包括标量、图片、音频、计算图、数据分布、直方图和嵌入向量。下面利用Mnist数据在MLP多层神经网络上训练得到的日志文件logs转入TensorBoard中进行数据可视化。import tensorflow as tffrom tensorflow.examples.

2017-08-21 11:27:39 2652

原创 Tensorflow学习之实现卷积神经网络（三）

本次使用ImageNet数据集，ImageNet拥有1500万张标注过的高清图片，总共拥有22000类，其中约100万张标注了图片中主要物体的定位边框。每年度的ILSVRC比赛数据集中大概拥有120万张图片以及1000类的标注，是ImageNet全部数据的一个子集。比赛一般采用top-5和top-1分类错误率作为模型性能的评测指标。这次深度卷积网络为模型选择ALexNet，具体网络情况可以参考之

2017-08-06 01:23:56 806

原创 Tensorflow学习之实现卷积神经网络（一）

Opencv学习之图像金字塔与图片尺寸缩放图像金字塔事图像中多尺度表达的一种，最主要用于图像的分割，是一种以多分辨率来解释图像的有效但概念简单的结果。一幅图像的金字塔事一系列以金字塔形状排列的，分辨率逐步降低且来源于同一张原始图的图像集合，其通过梯次向下采样获得，直到达到某个终止条件才停止采样。底部是待处理图像的高分辨率表示，而顶部是低分辨率的近似。 *高斯金字塔（Gaussi

2017-08-03 13:37:29 1068 1

原创 Tensorflow学习之实现多层感知机

深度学习之Tensorflow实现多层感知机为了拟合复杂函数需要的隐含节点的数目，基本上随着隐含层的数量增多呈指数下降趋势，也就是说层数越多，神经网络所需要的隐含节点可以越少。常常为了解决过拟合，可以利用Dropout的方法，即在训练时，将神经网络某一层的输出节点数据随机丢弃一部分。这种做法实质上等于创造出了很多新的随机样本，通过增大样本量、减少特征数量来防止过拟合。

2017-07-27 00:46:59 1221

原创 Tensorflow学习之实现自编码器

深度学习之Tensorflow实现自编码器当拥有很多的标注数据时，可以训练一个深层的神经网络。但是没有标注的数据时，依然可以利用无监督的自编码器来提取特征。自编码器（AutoEncoder），顾名思义，即可以使用自身的高阶特征编码自己。自编码器其实也是一种神经网络，它的输入和输出是一致的，它借助稀疏编码的思想，目标是使用稀疏的一些高阶特征重新组合来重构自己。因此，它的特点非常明显：第一，

2017-07-26 18:14:58 2697

转载深度学习之MAC(cpu-only)下利用anaconda安装caffe

转载自http://blog.csdn.net/ddreaming/article/details/52739893如何在Mac下安装caffe在安装caffe之前，应该了解些计算机的基本知识，以及Linux的基本知识，这是因为Linux和Mac的操作系统非常像。比如什么是Linux,它是怎么来的？Linux和GNU啥关系？gcc又是啥。。Linux的目录配置是咋回事，也就是下图中每个文件都存啥知道

2017-07-02 12:11:41 4158

原创 Opencv学习之ORB算法

Opencv学习之ORB算法 ORB是ORiented Brief的简称，是brief算法的改进版，算法效率比SIFT高两个数量级，在计算速度上，ORB是SIFT的100倍，是SURF的10倍。 Brief描述子：Brief是Binary Robust Independent Elementary Features的缩写，主要思路就是在特征点附近随机选取若干点对，将这些点对的灰度

2017-06-29 18:22:28 1879

原创 Opencv学习之SURF算法

Opencv学习之SURF算法 SURF（加速版的具有鲁棒性的特征，SpeededUp Robust Features），SURF是尺度不变特征变换算法（SIFT算法）的加速版。SURF最大的特征在于采用了harr特征以及积分图像的概念。 SURF原理：（1）构建Hessian矩阵构造高斯金字塔尺度空间 SIFT采用的是DoG图像，而SURF采用的是Hess

2017-06-27 14:52:36 27522 2

原创 Opencv学习之角点检测

Opencv学习之角点检测角点检测在图像处理和计算机视觉领域，兴趣点（interest points），也被称作关键点（key points）、特征点（feture points）。它被大量用于解决物体识别、图像识别、图像匹配、视觉跟踪、三维重建等一系列的问题，如果能检测到足够多特殊的点，同时它们的区分度很高，并且可以精确定位稳定的特征，那么这个方法就具有使用价值。图像特征类型被分为以下

2017-06-26 01:10:04 2011

原创 Opencv学习之模板匹配

Opencv学习之模板匹配模板匹配是一项在一幅图像中寻找与另一幅模板图像最匹配（相似）部分的技术，模板匹配不是基于直方图的，而是通过在输入图像上滑动图像块，对实际的图像块和输入图像进行匹配的一种匹配方法。实现模板匹配–matchTemplate函数用于匹配出和模板重叠的图像区域 void matchTemplate(inputArray image,inputArray templ,o

2017-06-25 18:17:22 732

空空如也

空空如也