自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 资源 (7)
  • 收藏
  • 关注

原创 LaTeX 系列(5) —— 特殊符号

1. 导入所需的包\usepackage{pifont} % \ding{xx}\usepackage{bbding} % \Checkmark,\XSolid,... (需要和pifont宏包共同使用)\usepackage{fontawesome} % \faCheck,\faTimes2. 打勾打叉latex代码:\checkmark\Checkmark\CheckmarkBold\XSolid\XSolidBold\XSolidBrush

2022-04-28 23:36:04 4637 1

原创 LaTeX 系列(4) —— Table

接上一篇LaTeX 系列(3) —— Figure,这篇文章介绍Latex中的各种Table样式和排版的实现。1.导入所需的包全部导入就完事了:\usepackage{booktabs} % toprule, midrule, bottomrule\usepackage{multirow} % multirow, multicolumn\usepackage{graphicx} % resizebox\usepackage{threeparttable} % footnot...

2022-04-18 16:53:57 1360

原创 LaTeX 系列(3) —— Figure

使用Latex的时候经常需要绘制各种图示,但是一直记不清,每次要用的时候都去找模板还是挺麻烦的,所以在这里总结一下常用的几种Figure类型。1.导入所需的包不管画什么图,全部导入就完事了:\usepackage{graphicx}\usepackage{float}\usepackage{subfig}\usepackage{overpic}2.1 单张图片显示Latex代码:% 单张图片显示\begin{figure}\centering\includegrap.

2021-11-25 14:57:00 13256 2

原创 数据结构和算法笔记(2)基础算法模板

有很多的基础算法经常会用到,但是又容易写错。而网上查到的实现又五花八门、良莠不齐,故在此整理记录。本文的目录如下:1.二分查找1.二分查找一个细节就是计算middle时,用 (left + right) / 2 容易数值溢出,所以改成 middle = left + (right - left) / 2.c++实现:#define LEFT_BOUND 0#def...

2020-02-07 00:18:17 238

原创 基于深度学习的低光照图像增强方法总结(2020.09.15更新)

之前在做光照对于高层视觉任务的影响的相关工作,看了不少基于深度学习的低光照增强(low-light enhancement)的文章[3,4,5,7,8,9,10],于是决定简单梳理一下。光照估计(illumination estimation)和低光照增强(low-light enhancement)的区别:光照估计是一个专门的底层视觉任务(例如[1,2,6]),它的输出结果可以被用到其它任务...

2019-08-15 16:29:21 28359 12

原创 编程时踩过的坑(主要是c++)

1.数值溢出存储数据时要考虑数值溢出的问题,选择合适的类型,特别要注意数值运算时的数值范围是否合适。比方说,如果使用了int类型,尽管数据本身没有超范围,但是在进行乘法计算时却可能会产生数值溢出。c++类型的数值范围速查表:Type Typical Bit Width Typical Range char 1byte -127 to 127 or 0 to ...

2019-07-17 14:49:53 730 1

原创 数据结构和算法笔记(1)数论相关

最近在刷编程题,发现了许多杂七杂八的知识点,稍微归类并记录下来方便后续查阅。本文的目录如下:1.组合数 2.快速幂 3.大数取模(乘法逆元和费马小定理) 4.菲波拉契数列1.组合数的求法组合数,为了方便也写作C(n, k),表示从n个不同元素中取出k (k≤n)个元素的所有组合的个数。我们知道存在公式C(n, k) = [n*(n-1)*(n-2)*.....

2019-07-10 17:44:44 413

原创 PyTorch中的padding(边缘填充)操作

简介我们知道,在对图像执行卷积操作时,如果不对图像边缘进行填充,卷积核将无法到达图像边缘的像素,而且卷积前后图像的尺寸也会发生变化,这会造成许多麻烦。因此现在各大深度学习框架的卷积层实现上基本都配备了padding操作,以保证图像输入输出前后的尺寸大小不变。例如,若卷积核大小为3x3,那么就应该设定padding=1,即填充1层边缘像素;若卷积核大小为7x7,那么就应该设定padding=...

2019-07-02 16:16:58 49478 5

原创 人体解析任务 和 Look into Person数据集 (附源码分享)

人体解析任务人体解析(human parsing),属于语义分割任务的子任务,旨在对人类图像进行像素级的是细粒度分割(例如,划分出身体部位和服装)。根据不同的场景,又可以分为单人人体解析(single-person human parsing)和多人人体解析(multi-person human parsing,或者 instance-level human parsing)。除此之外,按照处...

2019-06-14 15:38:37 7620 6

原创 python列表的三种拷贝方式的性能分析

对于一个很大的列表,如果要对其进行复制,那么有三种方式可以选择。第一种是直接用for循环复制,第二、第三种则是使用python自带的copy和deepcopy方法。copy和deepcopy的区别在于,copy仅仅对被复制对象本身的值进行复制,而deepcopy则还会对被复制对象的所有子对象进行递归和拷贝。举例来说,如果一个字典里的value里包含了列表,那么在复制这个字典时,deepco...

2019-04-26 12:56:09 837

原创 LaTeX 系列(2) —— 中文支持

本文内容基于 Ubuntu16.04 和 TexLive 2018.对于完整安装的TexLive2018, 应该是已经包含了中文支持的,使用 xeCJK 宏包即可。我们可以测试一下以下代码:\documentclass{article}\usepackage{xeCJK}% use buildin Chinese font in linux\setCJKmainfont{We...

2019-04-20 18:23:55 1368

原创 Domain Adaptation through Synthesis for Unsupervised Person Re-identification 论文笔记

这篇文章来自ECCV2018. 主要针对无监督的行人再识别任务,首先用3D引擎和环境渲染技术构建了一个多光照条件的虚拟行人数据集,接着用该合成数据集和其它大型真实数据集合并,共同预训练了一个模型。由于涵盖了各种光照情况,该模型具有良好的泛化性能。为了进一步提升无监督性能,该文章提出了一种域自适应技术(有约束的cycleGAN),选择和目标域的光照情况最相似的那些合成图像,迁移到目标域上,再利用迁移...

2019-02-22 17:13:25 1655

原创 损失函数SSIM (structural similarity index) 的PyTorch实现

SSIM介绍结构相似性指数(structural similarity index,SSIM), 出自参考文献[1],用于度量两幅图像间的结构相似性。和被广泛采用的L2 loss不同,SSIM和人类的视觉系统(HVS)类似,对局部结构变化的感知敏感。SSIM分为三个部分:照明度、对比度、结构,分别如下公式所示:将上面三个式子汇总到一起就是SSIM:其中,上式各符号分...

2019-02-21 20:56:33 40727 34

原创 PyTorch的可重复性问题 (如何使实验结果可复现)

由于在模型训练的过程中存在大量的随机操作,使得对于同一份代码,重复运行后得到的结果不一致。因此,为了得到可重复的实验结果,我们需要对随机数生成器设置一个固定的种子。许多博客都有介绍如何解决这个问题,但是很多都不够全面,往往不能保证结果精确一致。我经过许多调研和实验,总结了以下方法,记录下来。全部设置可以分为三部分: 1. CUDNNcudnn中对卷积操作进行了优化,牺牲了精度来...

2018-11-20 20:53:12 20055 26

原创 网络调参时踩过的坑(长期更新)

1.学习率大小的设置一般情况下,当网络收敛到一定程度时,loss曲线的变化不明显,并出现上下的小幅度波动,这时候可以考虑调小学习率,帮助网络进一步收敛到最优值。如下图所示:但有些情况,网络看似收敛了,但实际上是到了某些平坦的曲面,离最优值还有一段距离。典型的loss curve如下图所示:可以观察到,曲线还在非常稳定地缓慢下降,并且没有上下波动。这时不要误以为网络已经收敛,而要...

2018-09-15 16:35:07 462

原创 卷积神经网络的权值初始化方法

卷积层:normal 从均值为0,方差为1的高斯分布中采样,作为初始权值。PyTorch中的相关函数如下:torch.nn.init.normal_(tensor, mean=0, std=1)kaiming_normal 由FAIR的大牛Kaiming He提出来的卷积层权值初始化方法,目的是使得每一卷积层的输出的方差都为1,具体数学推导可以参考论文[1]. 权值的初始化方...

2018-08-28 14:07:56 19755

原创 Linux Ubuntu 笔记(长期更新)

软链接、硬链接:前者相当于快捷方式,后者则相当于重新拷贝了一次。软链接命令:ln -s /home/sb/a /home/sb/b注意!删除软链接时,注意rm a 和 rm -r a/的区别,后者会将源文件夹也删除,血的教训。批删除文件:sudo find . -name 'xxx.tmp' | xargs sudo rm -rf支持通配符和正则表达式。...

2018-08-17 14:20:03 280

翻译 ICCV2015论文翻译 Scalable Person Re-identification: A Benchmark

网页的排版效果不好,可以从以下链接下载pdf版本:https://download.csdn.net/download/hyk_1996/10602389 Scalable Person Re-identification: A Benchmark可拓展的行人重识别:一个基准 摘要这篇论文贡献了一个新的用于行人重识别领域的高质量数据集,称为“Market-1501”.一...

2018-08-14 10:20:27 3374

原创 行人重识别 MSMT17数据集描述

        最近的CVPR2018会议上,提出了一个新的更接近真实场景的大型数据集MSMT17,即Multi-Scene Multi-Time,涵盖了多场景多时段。 早期数据集的缺点(1)和实际的监控网络相比,数据集中行人和摄像头的数目不多;(2)大多数数据集仅覆盖单一场景;(3)时间跨度短,没有显著的光照变化;(4)行人检测器有昂贵的人工标注或过时的DPM模型实现。...

2018-08-12 16:52:04 21858 35

原创 论文笔记的格式

关于阅读文献 采用三步走的方法,而不是逐字逐句的全文阅读。第一步阅读让你对文献的主要想法有一个了解,判断该文献是否值得阅读(自己掌握的知识是否足够理解该文献);第二步阅读文献内容,而不是细节,做文献调研的话,到这一步就足够了;第三步是深入理解细节,以期望能够复现论文结果。 第一步,快速浏览,从而获得对文献的一个全局的把握,需要仔细地阅读文章标题、摘要、导论,以及各章节的标题。这...

2018-07-23 13:20:47 1390

转载 2017 深度学习语义分割指南

A 2017 Guide to Semantic Segmentation with Deep LearningSasank Chilamkurthy | July 5, 2017At Qure, we regularly work on segmentation and object detection problems and we were therefore interested ...

2018-07-18 13:53:04 883

原创 PyTorch踩过的坑(长期更新,转载请注明出处)

最近在知乎看到有人转载了这里的内容,提醒一下,欢迎转载,但是请注明出处,谢谢。1. nn.Module.cuda() 和 Tensor.cuda() 的作用效果差异无论是对于模型还是数据,cuda()函数都能实现从CPU到GPU的内存迁移,但是他们的作用效果有所不同。对于nn.Module:model = model.cuda()model.cuda()上面两句能...

2018-06-27 10:43:48 30133 11

原创 LaTeX 系列(1) —— 介绍、安装和使用

撰写学术论文,经常会听人提到的一个排版工具就是LaTeX,于是今天就来入坑学习一下这个神奇的工具。本文主要基于Windows系统,先简单体验一下。介绍TeX是一个排版工具,然后LaTeX是基于TeX的宏集。基于TeX的各种衍生实在是太多了,这篇博客有一个很好的介绍。我们要记住的就是,宏集(LaTeX、plain TeX)相当于编程语言,引擎相当于编译器(XeTeX、pdfTeX). 发行版就是一个...

2018-06-16 13:58:23 4391

转载 转载-自动微分(Automatic Differentiation)入门教程

转载自https://blog.csdn.net/aws3217150/article/details/70214422 现代深度学习系统中(比如MXNet, TensorFlow等)都用到了一种技术——自动微分。在此之前,机器学习社区中很少发挥这个利器,一般都是用Backpropagation进行梯度求解,然后进行...

2018-05-30 15:14:33 586

翻译 CVPR2018论文翻译 Human Semantic Parsing for Person Re-identification

论文链接:https://arxiv.org/pdf/1804.00216.pdf摘要    混乱的背景、光照、视角等因素制约了提取鲁棒性表示的能力,因此reid是个挑战性的任务。为了改进表示学习,通常提取行人身体各部分的局部特征。然而,实际中通常基于包围框的部分检测。本文提出了改编的human semantic parsing,它有着像素等级的精确率和建模任意轮廓的能力,因此一个很好的选择。  ...

2018-05-21 23:18:39 2753

原创 Horizontal Pyramid Matching for Person Re-identification 论文笔记

Motivation    Failure cases where the discriminative body parts (key parts) are missing.Contribution    1. horizontal pyramid scales (增强body parts的判别能力)    2. average and max pooling strategies    3. ...

2018-05-21 20:30:02 2310 9

原创 行人属性识别 PETA数据集

数据集主页(内含数据集下载地址):http://mmlab.ie.cuhk.edu.hk/projects/PETA.html百度网盘连接:链接: https://pan.baidu.com/s/1Yt47VmpozNSYI3DDxzZtVA 密码: qkbj描述:    PETA (PEdesTrian Attribute)数据集包含了8705个行人,共19000张图像(分辨...

2018-05-15 15:02:44 12367 7

原创 Re-ranking Person Re-identification with k-reciprocal Encoding 重排序算法解析

论文:Re-ranking Person Re-identification with k-reciprocal Encoding代码:https://github.com/layumi/Person_reID_baseline_pytorch/blob/master/re_ranking.py3.提出的方法3.1问题定义给定probeperson和gal...

2018-04-08 11:29:51 7546 5

原创 度量学习方法 - KISSME

        KISSME(keep it simple and straightforward metric), 属于有监督的线性度量学习方法,本质上还是学习马氏距离中的矩阵M.推导        首先,认为对于样本对,它们之间的差异程度(dissimilar)可以通过似然比检验(likelihood ratio test)来观测,如下式所示:        其中,H0假设该样本对为负样本对(...

2018-03-21 14:26:18 7554

原创 LBP特征及其变体和python实现

一. LBP特征LBP(Local Binary Pattern),局部二值模式,主要用于提取纹理特征,根据文献[1]我们可以了解到LBP及其变体。一般的使用方法是,先将图像转换为灰度图,接着计算LBP特征图,最后计算其直方图作为特征向量。0.如何描述纹理信息 不多说,看图。LBP特征可以表示平坦、边缘、角点等区域。1.original LB...

2018-03-19 23:07:50 12281 12

原创 行人重识别 VIPeR数据集描述

    VIPeR数据集包括632个行人的1264张图像,每个行人有两张图像,采集自摄像头a和摄像头b. 每张图像都调整为了128x48的大小。该数据集的特点为视角和光照的多样性。参考论文:D. Gray, and H. Tao, "Viewpoint Invariant Pedestrian Recognition with an Ensemble of Localized Features,"...

2018-03-16 17:31:35 6783 1

原创 Huber Loss 及 tensorflow实现

    Huber Loss 相当于平方误差的推广,通过设置delta的值,使损失函数鲁棒性更强,从而减弱离群点(outliers)对模型的影响。当delta为无穷大时,Huber Loss 退化为Squared Loss.解释:Huber Loss对平方损失进行了分段,分为平方损失和线性损失。当偏差小于δ时,为平方损失,当偏差大于δ时,为线性损失。由于离群点往往具有很大的偏差,因此会...

2018-03-15 17:22:33 6219 1

原创 CUHK数据集和Market-1501数据集计算CMC方法的差别

Cumulative Matching Characteristics (CMC) curves 是目前行人重识别领域最流行的性能评估方法。考虑一个简单的 single-gallery-shot 情形,每个gallery identity只有一个instance. 对于每一次的query, 算法将根据 query 到所有gallery samples的距离从小到大排序,CMC top-k accu...

2018-03-06 13:21:45 8093

原创 行人重识别 CUHK03数据集描述

简要描述:MATLAB数据文件格式,1467个行人,收集自The Chinese University of Hong Kong校园内的10个(5对)不同的摄像头。 数据集结构:由三部分组成:---   "detected":行人框由pedestrian detector绘出,5x1 cell,分别由5对摄像头组收集得到。      --   843x10 cell,收集自...

2018-02-27 13:45:53 20206 2

原创 Ubuntu16.04 nvidia显卡驱动 cuda9.0 cudnn7.0.5 简要配置流程

一.安装显卡驱动直接使用Ubuntu自带的 附加驱动 来安装最新版Nvidia闭源驱动,能省下许多麻烦; 但是如果还要安装primus(bumblebee)进行双显卡切换的话,则应让primus自行安装对应驱动,否则会安装配置失败(大坑)。二.CUDA安装1. 安装完显卡驱动后,再到官网下载cuda runfile文件安装CUDA,按提示操作,非常简单。但注意不要重复安装显卡驱动。2. cuda ...

2018-02-21 15:40:38 1038

翻译 Voice Conversion using Convolutional Neural Networks 翻译

原文来自arXiv.org (Mobin S, Bruna J. Voice Conversion using Convolutional Neural Networks[J]. 2016.)摘要:除了音调外,音色是识别说话人的关键,但我们对此了解不多。在这篇论文我们利用神经网络来变换说话人声音。(不仅转换说话人音调,还包括了音色的转换)。我们用能够学习类比的神经网络结构来构建生成模型。

2017-07-27 16:43:58 674

Scalable Person Re-identification: A Benchmark 外文翻译

ICCV2015行人重识别论文 Scalable Person Re-identification: A Benchmark 翻译

2018-08-14

TexLive中文安装教程

TexLive2018 的中文安装教程。支持Linux、Windows、Mac OS系统。

2018-06-16

第十五章 表示学习 PPT

深度学习经典教材《deep learning》第十五章 表示学习 的PPT课件

2017-12-06

PCA-matlab实现(详细注释)

降维算法PCA在matlab平台下的使用demo,采用自带函数,注释详细。

2017-11-28

空中写字与数字识别

使用说明:手动框出特定部位,使用KCF算法对其进行跟踪,绘出轨迹图案,再将手写图案送去分类器分类。该程序实现的分类器有opencv自带的knn、svm,以及用tensorflow实现的基于minst数据集训练出的cnn模型、softmax模型。文档包含训练模型所需的python代码。

2017-04-03

MATLAB-批转换MP3文件为语谱图,并保存为二进制格式

读取指定文件夹下的所有mp3文件,转换成语谱图,并保存为二进制文件,便于后续进行语言识别等处理。

2017-03-31

机器人学导论 SOLUTIONS MANUAL

机器人学导论 SOLUTIONS MANUAL

2017-03-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除