kangdk-CSDN博客

翻译论文笔记 | 基于深度学习的细粒度物体分类综述

节选整理自：A Survey on Deep Learning-based Fine-grained Object Classification and Semantic Segmentation细粒度分类综述细粒度分类：同一类中不同子类物体间的分类。难点：受视角、背景、遮挡等因素影响较大，类内差异较大、类间差异较小。基于深度学习的物体分类可以大致分为4类：使用通用DCN...

2018-04-19 22:13:32 17218 4

原创论文笔记 | 基于双线性CNN模型的细粒度视觉识别

细粒度视觉识别之双线性CNN模型[1] Lin T Y, RoyChowdhury A, Maji S. Bilinear cnn models for fine-grained visual recognition[C]//Proceedings of the IEEE International Conference on Computer Vision. 2015: 1449-1457.

2018-01-11 16:22:47 14295 7

翻译【译】基于深度学习的语义分割导引

本文翻译自Qure.ai Blog，原文链接A 2017 Guide to Semantic Segmentation with Deep Learning作者主要从事语义分割及物体检测等研究，因此有兴趣于回顾行业现状。本文中，作者回顾了语义分割相关文献。大多数语义分割的研究使用自然或现实世界的图像数据集。尽管其结果不能直接用于医疗图像，作者回顾这些文献是因为基于自然图像的研究要远远多于医

2017-12-16 22:11:09 1175

翻译论文笔记 | SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

原文链接：摘要：SegNet：一种新的、实用的深度全卷积神经网络用于像素级语义分割。包括编码网络、解码网络及像素级分类层。解码层对低分辨率的特征图进行上采样，上采样时使用与下采样相同的下标映射。从而省去上采样的参数学习。上采样后的特征图是稀疏的（大部分参数为零），之后与训练好的分类器卷积，产生密集特征图。该网络旨在用于场景理解任务，设计时考虑其内存及计算效率。

2017-12-08 17:19:03 1923

原创 Ubuntu相关问题解决方法（持续更新）

一、Ubuntu下应用安装Ubuntu下安装微信，推荐教程chrome搜狗输入法sublime关闭更新提示二、WPS相关1. Ubuntu16.04 wps无法输入中文2. Ubuntu中WPS无“宋体”等中文字体：在WPS Office Fonts下载WPS字体安装wps-office-fonts_1.0_all.deb包转到下载文件所在目录，输入 s

2017-10-12 13:27:23 629

原创论文笔记 | 基于深度学习的乳腺转移瘤识别（Deep Learning for Identifying Metastatic Breast Cancer）

文章提出了一种基于深度学习的前哨淋巴结节点转移瘤识别方法。文章使用数百万组织切片训练深度卷积神经网络，进行正常切片与肿瘤切片的切片级预测。之后，结合切片预测结果生成肿瘤概率热力图，对热力图进行后处理，完成基于幻灯片的分类任务和肿瘤定位任务。文章所提出的系统以接近人类的准确率赢得了2016年Camelyon 挑战大赛。最终，将深度学习预测结果与病理学家诊断结果相结合，从而显著减小了病理学家的错误率。

2017-10-11 09:44:59 8981 14

原创 keras 系列 | NVIDIA+CUDA+Tensorflow+Keras安装笔记

Ubuntu16.04+Cuda+Caffe安装中已经介绍了在Ubuntu16.04+NVIDIA TITAN XP+CUDA8.0+cudnn_v6+OpenCV3.2的安装过程。

2017-09-03 16:03:06 646

翻译论文笔记 | YOLO9000论文阅读笔记(二)

更快速度与准确率对于检测任务都是非常重要的。大多数的检测任务，如机器人或自动驾驶汽车均依赖于低延迟的预测。大多数检测架构均将VGG-16作为基础特征提取器。VGG-16是一种强大的、精确的分类网络，但同样存在大量冗余。对于一副224x224的图像，VGG-16的卷积层迭代一次就需要306.9亿次浮点运算。YOLO架构使用基于GoogleNet的经典架构，该网络比VGG-16更快，前向传

2017-08-13 20:36:32 1185

翻译论文笔记 | YOLO9000论文阅读笔记(一)

CVPR 2017刚刚结束，心想选几篇论文拜读一下，大牛就是大牛，仅供瞻仰。YOLO9000: Better, Faster, Stronger 由华盛顿大学艾伦研究所的大牛Josehp Redmon、Ali Farhadi共同完成，获得CVPR 2017 最佳论文鼓励奖。YOLO9000对YOLO模型进行改进，速度、精确度均有提升，提出了一种将分类与检测训练过程相结合的方法，使模型可以同

2017-08-13 20:33:42 1886

原创 Ubuntu16.04+Cuda+Caffe安装

安装依赖项sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compilersudo apt-get install --no-install-recommends libboost-all-dev libatlas-bas

2017-08-01 17:02:16 2859 2

原创 Python：lambda、map、filter、reduce

lambda函数lambda函数是一种只包含一个表达式的、内联的、匿名函数。创建lambda函数的语法为： lambda [arguments]: expression 示例：>>> f=lambda x,y: 2*x+3*y+1>>> f(1,2)9>>> (lambda x,y: 2*x+3*y+1)(1,2)9map函数函数原型：map(function, iterable, ..

2017-07-31 17:50:46 459

原创 caffe系列 | caffe使用日志文件绘制Loss Accuracy图像

在使用caffe训练数据集时通常需要对训练过程中损失值、准确率等进行可视化，使用python接口可视化的步骤可以参考博文caffe的python接口学习（7）：绘制loss和accuracy曲线，本文将会介绍一种使用命令行训练数据，并利用训练过程的输出进行可视化的方法。一、caffe 模型训练在制作好数据集、贴好标签、并将数据集转为lmdb格式之后，就可以对网络进行训练，训练命令如下：

2017-07-26 18:58:01 1309

翻译 Caffe tutorial 之前向与反向传播

本文参考Forward and Backward。前向与反向传播前向与后向传播是网络中重要的计算部分。接下来以简单的逻辑回归分类器为例介绍。前向传播用于计算推理过程中给定输入的输出。在前向传播中，Caffe将每层的计算进行组合从而得到模型所代表的“函数”。此过程由底向上进行。数据x经过全连接层（内积层）生成g(x)g(x)，之后通过softmax层产生h(g(x))h(g(x))，从

2017-07-14 12:22:20 699

翻译 caffe tutorial 之 Loss

本文基于Caffe Tutorial 之 Loss编写。在Caffe中，如同大多数机器学习算法一样，学习是通过损失（loss，也被称为误差、代价、或者目标函数）进行驱动。损失函数将参数设置（即，当前网络权重）映射为一个预示参数好坏程度的标量来指定学习目标。因此，学习的目标就是寻找一组使损失函数取值最小的参数值。Caffe中，损失通过网络的前向传播进行计算。每层从输入（低层）中获取数据，同时

2017-07-12 16:52:45 433

翻译 Python Random模块使用

Python random模块使用

2017-07-04 15:35:53 843

原创 537. Complex Number Multiplication

一、题目描述给定两个表示复数的字符串。返回它们乘积的字符串，注意根据定义i2=−1i^2=-1。例1：Input: "1+1i", "1+1i"Output: "0+2i"Explanation: (1 + i) * (1 + i) = 1 + i2 + 2 * i = 2i, and you need convert it to the form of 0+2i.例2：Input: "1+-1

2017-06-18 12:22:38 243

原创 ShareLaTex中使用中文

本文内容参考ShareLaTex文档，英文水平好的同学可以直接阅读原文。在ShareLaTex中使用中文时，需要使用XeLaTeX编译文档。点击这里查看如何更换ShareLaTex编译器。XeLaTeX另外一种简洁地生成中文文档的方法是导入xeCJK包之后设置合适的字体。\documentclass{article}\usepackage{xeCJK} %导入xeCJK包\setC

2017-06-11 15:36:44 14427 1

原创二叉搜索树

1 二叉树的基本性质

2017-06-04 17:33:14 300

原创 538. Convert BST to Greater Tree

一、题目简介给定一颗二叉搜索树（Binary Search Tree，BST），将其转化为一颗更大的树使得原始二叉树的节点值改变为树中所有比其节点值大的节点元素之和。例如：Input: The root of a Binary Search Tree like this: 5 / \ 2 13

2017-06-03 20:53:04 281

翻译基于深度学习的图像语义分割技术概述之4常用方法

4 深度学习图像分割的常用方法深度学习在多种高级计算机视觉任务中的成功—特别是监督CNNs（Convolutional Neural Networks，卷积神经网络）在图像分类、对象检测方面的成功—鼓舞着研究人员探索此类网络对于像素级标记，如语义分割方面的能力。这些深度学习技术的关键优点，就是突破了传统方法方法的边界，对于手头问题，能够自动学习合适的特征表示。例如，传统方法手动特征提取方式，为

2017-06-01 14:50:08 13457 3

原创 126. Word Ladder I & II

一、题目简述给定两个单词（beginWord和endWord），和一个单词字典，找到所有从beginWord到endWord的最短转换，使得：每次只能改变一个字母；每个转换单词都必须在单词字典中，注意到，beginWord不是一个转换单词。例如，给定： beginWord=“hit” endWord=“cog” wordList=[“hot”,”dot”,”dog”,”lot”,”l

2017-05-28 19:27:13 639

原创 417. Pacific Atlantic Water Flow

一、题目简述给定一个m*n的非负矩阵代表大陆中每个单元格的高度，太平洋与矩阵的左、上边相邻，大西洋与矩阵的右、下边相邻。水流只能沿着四个方向进行流动（上、下、左、右），从一个较高的单元格流向较低或等高的单元格。寻找既能流到大西洋又能流到太平洋的单元格的坐标。注意：返回单元格坐标的顺序不影响答案的正确性。m与n均小于150。例如： Given the following 5x5 m

2017-05-14 14:10:34 285

原创论文笔记 | 基于深度学习的图像语义分割技术概述之5.1度量标准

本文为论文阅读笔记，不当之处，敬请指正。 A Review on Deep Learning Techniques Applied to Semantic Segmentation:原文链接5.1度量标准为何需要语义分割系统的评价标准？为了衡量分割系统的作用及贡献，其性能需要经过严格评估。并且，评估须使用标准、公认的方法以保证公平性。系统的多个方面需要被测试以评估其有效性，

2017-05-12 12:20:20 26024 11

翻译基于深度学习的图像语义分割技术概述之5.4未来研究方向

针对当前研究现状，该概述论文列出以下研究方向。3D数据集：尽管利用3D数据信息进行语义分割的方法和技术已经被提出，但是3D数据集的缺乏仍然是一个重要的问题。大规模3D语义分割数据集的需求是巨大的，但是相比低维度数据标记，其更加困难。尽管已经存在一些值得肯定的工作，但是依然有必要制作更大、质量更好、多样化的数据。现有的大多是仿真数据集，但是标记真实的三维世界的数据是重要的。其重要性可以从ILSVRC

2017-05-10 09:54:39 4821

原创 413. Arithmetic Slices

一、题目简述一个序列被称为是算术的，如果它至少包含三个元素，并且序列中任意两个相邻元素之差相同。例如，以下序列是算术的： 1, 3, 5, 7, 9 7, 7, 7, 7 3, -1, -5, -9以下序列不是算术的： 1, 1, 2, 5, 7一个下标从零开始的数组A包含N个元素。使用整数对(P,Q)，0≤P<Q<N0\leq P<Q<N，来表示数组的一个片段。数组的一

2017-05-08 10:49:08 251

原创 486. Predict the Winner

一、题目简述给定一个非负元素的数组，玩家1从该数组的两端选取一个数字，玩家2之后从剩余的数组两端选取，玩家1之后进行相同操作。玩家每次选择的数字在下一轮将不能继续使用。游戏结束直到所有的数字被取完。取得数字之和最大的玩家获胜。对于给定数组，判断玩家1能否获胜，假设每个玩家都以能够获得最大成绩的方式取数。例1：输入：[1, 5, 2]输出： False解释：第一轮玩家1可以选择1或2。无论玩家1

2017-05-07 20:29:18 235

翻译基于深度学习的图像语义分割技术概述之背景与深度网络架构

本文为论文阅读笔记，不当之处，敬请指正。 A Review on Deep Learning Techniques Applied to Semantic Segmentation: 原文链接摘要图像语义分割正在逐渐成为计算机视觉及机器学习研究人员的研究热点。大量应用需要精确、高效的分割机制，如：自动驾驶、室内导航、及虚拟/增强现实系统。这种需求与机器视觉方面的深度学习领域的目标一致

2017-04-29 19:32:43 3629 1

原创 375. Guess Number Higher or Lower II

一、题目大意我们在玩一个猜数字的游戏，游戏规则如下：我从1到n选择一个数字，你来猜我选择的数字。每次你猜错，我都会告诉真实值是偏大还是偏小。然而，当你猜了一个数字x，并且猜错的时候，你必须支付$x给我，当你猜到我选择的数字时，你就可以赢得比赛。例如： n=10，我选择了8 第一轮：你猜5，我告诉你真实值大于该值，你支付$5；第二轮：你猜7，我告诉你真实值大于该值

2017-04-23 17:34:40 462

原创 70. Climbing Stairs

一、题目简述假设你在爬楼梯，需要n步才能到达顶部。你每次可以爬1或2个台阶，求爬到楼顶所有方法的数量。注意：给定的n是一个正整数。二、编程思路本题目可以使用动态规划的思路进行求解。寻找状态：令dp[i]表示爬到第i个台阶时所有可能的方法总数。确定状态转移方程： dp[0]=1;dp[0]=1;dp[1]=1;dp[1]=1;dp[i]=dp[i−1]+dp[i−2];

2017-04-23 09:47:51 170

原创 121. Best Time to Buy and Sell Stock

一、题目概述给定一个数组，其中第i个元素代表第i天股票的价格。如果你最多被允许完成一次交易（即，购买并抛售一份股票），设计一种算法寻找最大利润。示例1： Input: [7, 1, 5, 3, 6, 4] Output: 5 最大差值为6-1=5，（而非7-1=6，因为卖出价格需要高于买入价格）示例2： Input: [7, 6, 4, 3, 1] Output: 0 此种

2017-04-17 16:47:39 243

原创 198. House Robber

一、题目简述假设你是一位职业抢劫者，需要规划一条街的抢劫方法。每个房间都藏有一定数量的钱，抢劫的唯一约束是，相邻房间之间有安全系统连接，如果同晚相邻的房间被抢，安全系统将会自动报警。给定一列非负整数表示每间房的钱数，计算在不触发安全系统的条件下，你能够抢到的最多钱数。函数原型： int rob(vector<int>& nums)二、编程思路本题目编程思路较为明确，使用动态规划计算所能抢到

2017-04-17 10:48:16 354

原创 303. Range Sum Query - Immutable

一、题目简述给定一个数组nums，计算下标在i，j（i≤ji\leq j）之间的元素之和。示例：Given nums = [-2, 0, 3, -5, 2, -1]sumRange(0, 2) -> 1sumRange(2, 5) -> -1sumRange(0, 5) -> -3注意：假设数组不会改变；需要调用sumRange函数多次。二、编程思路给定数组nums，求下标在i,

2017-04-16 17:17:43 368

原创 494. Target Sum

一、题目简述给定非负整数序列，a1,a2,...,ana_1,a_2,...,a_n和一个目标数SS，现在你有两种符号++、−-，对于每个整数，可以选择正号或符号作为新的符号。找出和为目标数S的符号组合方式的种数。示例1：输入: nums is [1, 1, 1, 1, 1], S is 3. 输出: 5 解释: -1+1+1+1+1 = 3 +1-1+1+1+1 = 3 +

2017-04-16 13:04:00 494

原创 523. Continuous Subarray Sum

一、题目简述给定一个非负数组和目标整数K，写一个函数以检测给定数组中是否有一个长度至少为2的连续子序列，使得其和能够被K整除，即，其和为n∗K,n∈Zn*K,n\in Z。示例1 Input:[23,2,4,6,7],k=6[23, 2, 4, 6, 7], k=6 Output: TrueTrue Explanation: Because [2,4][2, 4] is a continuo

2017-04-15 11:34:10 1101

原创 435. Non-overlapping Intervals

一、题目简述给定一些区间，找到需要移除的最小区间数，以使剩余的区间之间没有重叠。注意：区间的终点总是大于起点如同[1,2][2,3][1,2] [2,3]这样的区间，虽然边界相连，但不重叠。示例1：输入：[[1,2],[2,3],[3,4],[1,3]][ [1,2], [2,3], [3,4], [1,3] ] 输出：1 解释：移除区间[1,3][1,3] 示例2：输入：[

2017-04-04 16:03:29 298

原创 452. Minimum Number of Arrows to Burst Balloons

一、题目简述在二维平面有一些气球，输入数据是每个气球在水平方向上的起点和终点，假设竖直方向上的空间足够，起点总是小于终点，最多有10410^4个球．一支箭能够从X轴的不同位置垂直射出。若射出点为x，则满足xstart≤x≤xendx_{start}\leq x\leq x_{end}的气球将会被被射穿。射箭的次数没有限制。一支箭每次能够射穿的气球数没有限制。问射穿所有气球所需要的最少的箭是几支？

2017-04-04 11:38:12 278

原创 curvelet变换的理解

一、matlab下curvelet工具包配置首先在curvelet下载curvelet工具包，解压，其中包含了matlab与C语言两种实现的版本。打开matlab，点击set path，选择“添加并包含子文件夹”，将有关的matlab代码，即fdct_usfft_matlab、fdct_wrapping_matlab、mecv三个文件夹添加到matlab路径中。点击保存，设置完毕。二、cur

2017-03-29 21:52:18 18806 13

原创 542. 01 Matrix

一、题目简述给定一个只含0和1的矩阵，找到每个1到0的最短距离。两个相邻单元格的距离是1 例一：输入： 000010000\begin{matrix} 0 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \\ \end{matrix} 输出： 000010000\begin{matrix} 0 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \

2017-03-25 16:18:02 1731

原创 207&210. Course Schedule

一、题目简述共有nn门课需要选择，使用0……n−10……n-1进行标记。其中部分课程存在依赖关系，例如课程0必须在修学过课程1的基础上可以上，使用对[0,1][0,1]表示。给定课程数量和依赖关系对，返回完成所有课程的顺序。存在多种可能的正确顺序，只需返回其中一个即可，如果无法完成所有课程，则返回一个空序列。例如：输入 2,[[1,0]]2,[[1,0]]，输出[0,1][0,1] 输入

2017-03-19 16:26:43 289

原创 329. Longest Increasing Path in a Matrix

一、题目简述给定一个整数矩阵，找到最长递增路径对于每个元素，可以在四个方向上移动：上下左右，不可以沿对角线方向移动。例如： nums=⎡⎣⎢962961481⎤⎦⎥nums=\begin{bmatrix}9 & 9 & 4 \\6 & 6 & 8 \\2 & 1 & 1 \\\end{bmatrix} 返回：4，其中最长路径为[1,2,6,9][1,2,

2017-03-19 15:47:49 277

空空如也

空空如也