hyk_1996-CSDN博客

原创 LaTeX 系列(5) —— 特殊符号

1. 导入所需的包\usepackage{pifont} % \ding{xx}\usepackage{bbding} % \Checkmark,\XSolid,... (需要和pifont宏包共同使用)\usepackage{fontawesome} % \faCheck,\faTimes2. 打勾打叉latex代码：\checkmark\Checkmark\CheckmarkBold\XSolid\XSolidBold\XSolidBrush

2022-04-28 23:36:04 4637 1

原创 LaTeX 系列(4) —— Table

接上一篇LaTeX 系列(3) —— Figure，这篇文章介绍Latex中的各种Table样式和排版的实现。1.导入所需的包全部导入就完事了：\usepackage{booktabs} % toprule, midrule, bottomrule\usepackage{multirow} % multirow, multicolumn\usepackage{graphicx} % resizebox\usepackage{threeparttable} % footnot...

2022-04-18 16:53:57 1360

原创 LaTeX 系列(3) —— Figure

使用Latex的时候经常需要绘制各种图示，但是一直记不清，每次要用的时候都去找模板还是挺麻烦的，所以在这里总结一下常用的几种Figure类型。1.导入所需的包不管画什么图，全部导入就完事了：\usepackage{graphicx}\usepackage{float}\usepackage{subfig}\usepackage{overpic}2.1 单张图片显示Latex代码：% 单张图片显示\begin{figure}\centering\includegrap.

2021-11-25 14:57:00 13256 2

原创数据结构和算法笔记（2）基础算法模板

有很多的基础算法经常会用到，但是又容易写错。而网上查到的实现又五花八门、良莠不齐，故在此整理记录。本文的目录如下：1.二分查找1.二分查找一个细节就是计算middle时，用 (left + right) / 2 容易数值溢出，所以改成 middle = left + (right - left) / 2.c++实现：#define LEFT_BOUND 0#def...

2020-02-07 00:18:17 238

原创基于深度学习的低光照图像增强方法总结（2020.09.15更新）

之前在做光照对于高层视觉任务的影响的相关工作，看了不少基于深度学习的低光照增强（low-light enhancement）的文章[3,4,5,7,8,9,10]，于是决定简单梳理一下。光照估计（illumination estimation）和低光照增强（low-light enhancement）的区别：光照估计是一个专门的底层视觉任务（例如[1,2,6]），它的输出结果可以被用到其它任务...

2019-08-15 16:29:21 28359 12

原创编程时踩过的坑（主要是c++）

1.数值溢出存储数据时要考虑数值溢出的问题，选择合适的类型，特别要注意数值运算时的数值范围是否合适。比方说，如果使用了int类型，尽管数据本身没有超范围，但是在进行乘法计算时却可能会产生数值溢出。c++类型的数值范围速查表：Type Typical Bit Width Typical Range char 1byte -127 to 127 or 0 to ...

2019-07-17 14:49:53 730 1

原创数据结构和算法笔记（1）数论相关

最近在刷编程题，发现了许多杂七杂八的知识点，稍微归类并记录下来方便后续查阅。本文的目录如下：1.组合数 2.快速幂 3.大数取模（乘法逆元和费马小定理） 4.菲波拉契数列1.组合数的求法组合数，为了方便也写作C(n, k)，表示从n个不同元素中取出k (k≤n)个元素的所有组合的个数。我们知道存在公式C(n, k) = [n*(n-1)*(n-2)*.....

2019-07-10 17:44:44 413

原创 PyTorch中的padding（边缘填充）操作

简介我们知道，在对图像执行卷积操作时，如果不对图像边缘进行填充，卷积核将无法到达图像边缘的像素，而且卷积前后图像的尺寸也会发生变化，这会造成许多麻烦。因此现在各大深度学习框架的卷积层实现上基本都配备了padding操作，以保证图像输入输出前后的尺寸大小不变。例如，若卷积核大小为3x3，那么就应该设定padding=1，即填充1层边缘像素；若卷积核大小为7x7，那么就应该设定padding=...

2019-07-02 16:16:58 49478 5

原创人体解析任务和 Look into Person数据集（附源码分享）

人体解析任务人体解析（human parsing），属于语义分割任务的子任务，旨在对人类图像进行像素级的是细粒度分割（例如，划分出身体部位和服装）。根据不同的场景，又可以分为单人人体解析（single-person human parsing）和多人人体解析（multi-person human parsing，或者 instance-level human parsing）。除此之外，按照处...

2019-06-14 15:38:37 7620 6

原创 python列表的三种拷贝方式的性能分析

对于一个很大的列表，如果要对其进行复制，那么有三种方式可以选择。第一种是直接用for循环复制，第二、第三种则是使用python自带的copy和deepcopy方法。copy和deepcopy的区别在于，copy仅仅对被复制对象本身的值进行复制，而deepcopy则还会对被复制对象的所有子对象进行递归和拷贝。举例来说，如果一个字典里的value里包含了列表，那么在复制这个字典时，deepco...

2019-04-26 12:56:09 837

原创 LaTeX 系列(2) —— 中文支持

本文内容基于 Ubuntu16.04 和 TexLive 2018.对于完整安装的TexLive2018, 应该是已经包含了中文支持的，使用 xeCJK 宏包即可。我们可以测试一下以下代码：\documentclass{article}\usepackage{xeCJK}% use buildin Chinese font in linux\setCJKmainfont{We...

2019-04-20 18:23:55 1368

原创 Domain Adaptation through Synthesis for Unsupervised Person Re-identification 论文笔记

这篇文章来自ECCV2018. 主要针对无监督的行人再识别任务，首先用3D引擎和环境渲染技术构建了一个多光照条件的虚拟行人数据集，接着用该合成数据集和其它大型真实数据集合并，共同预训练了一个模型。由于涵盖了各种光照情况，该模型具有良好的泛化性能。为了进一步提升无监督性能，该文章提出了一种域自适应技术（有约束的cycleGAN），选择和目标域的光照情况最相似的那些合成图像，迁移到目标域上，再利用迁移...

2019-02-22 17:13:25 1655

原创损失函数SSIM (structural similarity index) 的PyTorch实现

SSIM介绍结构相似性指数（structural similarity index，SSIM）, 出自参考文献[1]，用于度量两幅图像间的结构相似性。和被广泛采用的L2 loss不同，SSIM和人类的视觉系统（HVS）类似，对局部结构变化的感知敏感。SSIM分为三个部分：照明度、对比度、结构，分别如下公式所示：将上面三个式子汇总到一起就是SSIM：其中，上式各符号分...

2019-02-21 20:56:33 40727 34

原创 PyTorch的可重复性问题（如何使实验结果可复现）

由于在模型训练的过程中存在大量的随机操作，使得对于同一份代码，重复运行后得到的结果不一致。因此，为了得到可重复的实验结果，我们需要对随机数生成器设置一个固定的种子。许多博客都有介绍如何解决这个问题，但是很多都不够全面，往往不能保证结果精确一致。我经过许多调研和实验，总结了以下方法，记录下来。全部设置可以分为三部分： 1. CUDNNcudnn中对卷积操作进行了优化，牺牲了精度来...

2018-11-20 20:53:12 20055 26

原创网络调参时踩过的坑（长期更新）

1.学习率大小的设置一般情况下，当网络收敛到一定程度时，loss曲线的变化不明显，并出现上下的小幅度波动，这时候可以考虑调小学习率，帮助网络进一步收敛到最优值。如下图所示：但有些情况，网络看似收敛了，但实际上是到了某些平坦的曲面，离最优值还有一段距离。典型的loss curve如下图所示：可以观察到，曲线还在非常稳定地缓慢下降，并且没有上下波动。这时不要误以为网络已经收敛，而要...

2018-09-15 16:35:07 462

原创卷积神经网络的权值初始化方法

卷积层：normal 从均值为0，方差为1的高斯分布中采样，作为初始权值。PyTorch中的相关函数如下：torch.nn.init.normal_(tensor, mean=0, std=1)kaiming_normal 由FAIR的大牛Kaiming He提出来的卷积层权值初始化方法，目的是使得每一卷积层的输出的方差都为1，具体数学推导可以参考论文[1]. 权值的初始化方...

2018-08-28 14:07:56 19755

原创 Linux Ubuntu 笔记（长期更新）

软链接、硬链接：前者相当于快捷方式，后者则相当于重新拷贝了一次。软链接命令：ln -s /home/sb/a /home/sb/b注意！删除软链接时，注意rm a 和 rm -r a/的区别，后者会将源文件夹也删除，血的教训。批删除文件：sudo find . -name 'xxx.tmp' | xargs sudo rm -rf支持通配符和正则表达式。...

2018-08-17 14:20:03 280

翻译 ICCV2015论文翻译 Scalable Person Re-identification: A Benchmark

网页的排版效果不好，可以从以下链接下载pdf版本：https://download.csdn.net/download/hyk_1996/10602389 Scalable Person Re-identification: A Benchmark可拓展的行人重识别：一个基准摘要这篇论文贡献了一个新的用于行人重识别领域的高质量数据集，称为“Market-1501”.一...

2018-08-14 10:20:27 3374

原创行人重识别 MSMT17数据集描述

最近的CVPR2018会议上，提出了一个新的更接近真实场景的大型数据集MSMT17，即Multi-Scene Multi-Time，涵盖了多场景多时段。早期数据集的缺点（1）和实际的监控网络相比，数据集中行人和摄像头的数目不多；（2）大多数数据集仅覆盖单一场景；（3）时间跨度短，没有显著的光照变化；（4）行人检测器有昂贵的人工标注或过时的DPM模型实现。...

2018-08-12 16:52:04 21858 35

原创论文笔记的格式

关于阅读文献采用三步走的方法，而不是逐字逐句的全文阅读。第一步阅读让你对文献的主要想法有一个了解，判断该文献是否值得阅读（自己掌握的知识是否足够理解该文献）；第二步阅读文献内容，而不是细节，做文献调研的话，到这一步就足够了；第三步是深入理解细节，以期望能够复现论文结果。第一步，快速浏览，从而获得对文献的一个全局的把握，需要仔细地阅读文章标题、摘要、导论，以及各章节的标题。这...

2018-07-23 13:20:47 1390

转载 2017 深度学习语义分割指南

A 2017 Guide to Semantic Segmentation with Deep LearningSasank Chilamkurthy | July 5, 2017At Qure, we regularly work on segmentation and object detection problems and we were therefore interested ...

2018-07-18 13:53:04 883

原创 PyTorch踩过的坑（长期更新，转载请注明出处）

最近在知乎看到有人转载了这里的内容，提醒一下，欢迎转载，但是请注明出处，谢谢。1. nn.Module.cuda() 和 Tensor.cuda() 的作用效果差异无论是对于模型还是数据，cuda()函数都能实现从CPU到GPU的内存迁移，但是他们的作用效果有所不同。对于nn.Module:model = model.cuda()model.cuda()上面两句能...

2018-06-27 10:43:48 30133 11

原创 LaTeX 系列(1) —— 介绍、安装和使用

撰写学术论文，经常会听人提到的一个排版工具就是LaTeX，于是今天就来入坑学习一下这个神奇的工具。本文主要基于Windows系统，先简单体验一下。介绍TeX是一个排版工具，然后LaTeX是基于TeX的宏集。基于TeX的各种衍生实在是太多了，这篇博客有一个很好的介绍。我们要记住的就是，宏集（LaTeX、plain TeX）相当于编程语言，引擎相当于编译器（XeTeX、pdfTeX）. 发行版就是一个...

2018-06-16 13:58:23 4391

转载转载-自动微分(Automatic Differentiation)入门教程

转载自https://blog.csdn.net/aws3217150/article/details/70214422 现代深度学习系统中（比如MXNet， TensorFlow等）都用到了一种技术——自动微分。在此之前，机器学习社区中很少发挥这个利器，一般都是用Backpropagation进行梯度求解，然后进行...

2018-05-30 15:14:33 586

翻译 CVPR2018论文翻译 Human Semantic Parsing for Person Re-identification

论文链接：https://arxiv.org/pdf/1804.00216.pdf摘要混乱的背景、光照、视角等因素制约了提取鲁棒性表示的能力，因此reid是个挑战性的任务。为了改进表示学习，通常提取行人身体各部分的局部特征。然而，实际中通常基于包围框的部分检测。本文提出了改编的human semantic parsing，它有着像素等级的精确率和建模任意轮廓的能力，因此一个很好的选择。 ...

2018-05-21 23:18:39 2753

原创 Horizontal Pyramid Matching for Person Re-identification 论文笔记

Motivation Failure cases where the discriminative body parts (key parts) are missing.Contribution 1. horizontal pyramid scales (增强body parts的判别能力) 2. average and max pooling strategies 3. ...

2018-05-21 20:30:02 2310 9

原创行人属性识别 PETA数据集

数据集主页（内含数据集下载地址）：http://mmlab.ie.cuhk.edu.hk/projects/PETA.html百度网盘连接：链接: https://pan.baidu.com/s/1Yt47VmpozNSYI3DDxzZtVA 密码: qkbj描述： PETA （PEdesTrian Attribute）数据集包含了8705个行人，共19000张图像（分辨...

2018-05-15 15:02:44 12367 7

原创 Re-ranking Person Re-identification with k-reciprocal Encoding 重排序算法解析

论文：Re-ranking Person Re-identification with k-reciprocal Encoding代码：https://github.com/layumi/Person_reID_baseline_pytorch/blob/master/re_ranking.py3.提出的方法3.1问题定义给定probeperson和gal...

2018-04-08 11:29:51 7546 5

原创度量学习方法 - KISSME

KISSME（keep it simple and straightforward metric）, 属于有监督的线性度量学习方法，本质上还是学习马氏距离中的矩阵M.推导首先，认为对于样本对，它们之间的差异程度（dissimilar）可以通过似然比检验（likelihood ratio test）来观测，如下式所示：其中，H0假设该样本对为负样本对（...

2018-03-21 14:26:18 7554

原创 LBP特征及其变体和python实现

一. LBP特征LBP（Local Binary Pattern），局部二值模式，主要用于提取纹理特征，根据文献[1]我们可以了解到LBP及其变体。一般的使用方法是，先将图像转换为灰度图，接着计算LBP特征图，最后计算其直方图作为特征向量。0.如何描述纹理信息不多说，看图。LBP特征可以表示平坦、边缘、角点等区域。1.original LB...

2018-03-19 23:07:50 12281 12

原创行人重识别 VIPeR数据集描述

VIPeR数据集包括632个行人的1264张图像，每个行人有两张图像，采集自摄像头a和摄像头b. 每张图像都调整为了128x48的大小。该数据集的特点为视角和光照的多样性。参考论文：D. Gray, and H. Tao, "Viewpoint Invariant Pedestrian Recognition with an Ensemble of Localized Features,"...

2018-03-16 17:31:35 6783 1

原创 Huber Loss 及 tensorflow实现

Huber Loss 相当于平方误差的推广，通过设置delta的值，使损失函数鲁棒性更强，从而减弱离群点（outliers）对模型的影响。当delta为无穷大时，Huber Loss 退化为Squared Loss.解释：Huber Loss对平方损失进行了分段，分为平方损失和线性损失。当偏差小于δ时，为平方损失，当偏差大于δ时，为线性损失。由于离群点往往具有很大的偏差，因此会...

2018-03-15 17:22:33 6219 1

原创 CUHK数据集和Market-1501数据集计算CMC方法的差别

Cumulative Matching Characteristics (CMC) curves 是目前行人重识别领域最流行的性能评估方法。考虑一个简单的 single-gallery-shot 情形，每个gallery identity只有一个instance. 对于每一次的query, 算法将根据 query 到所有gallery samples的距离从小到大排序，CMC top-k accu...

2018-03-06 13:21:45 8093

原创行人重识别 CUHK03数据集描述

简要描述：MATLAB数据文件格式，1467个行人，收集自The Chinese University of Hong Kong校园内的10个(5对)不同的摄像头。数据集结构：由三部分组成：--- "detected"：行人框由pedestrian detector绘出，5x1 cell，分别由5对摄像头组收集得到。 -- 843x10 cell，收集自...

2018-02-27 13:45:53 20206 2

原创 Ubuntu16.04 nvidia显卡驱动 cuda9.0 cudnn7.0.5 简要配置流程

一.安装显卡驱动直接使用Ubuntu自带的附加驱动来安装最新版Nvidia闭源驱动，能省下许多麻烦; 但是如果还要安装primus(bumblebee)进行双显卡切换的话，则应让primus自行安装对应驱动，否则会安装配置失败(大坑)。二.CUDA安装1. 安装完显卡驱动后，再到官网下载cuda runfile文件安装CUDA，按提示操作，非常简单。但注意不要重复安装显卡驱动。2. cuda ...

2018-02-21 15:40:38 1038

翻译 Voice Conversion using Convolutional Neural Networks 翻译

原文来自arXiv.org (Mobin S, Bruna J. Voice Conversion using Convolutional Neural Networks[J]. 2016.)摘要：除了音调外，音色是识别说话人的关键，但我们对此了解不多。在这篇论文我们利用神经网络来变换说话人声音。（不仅转换说话人音调，还包括了音色的转换）。我们用能够学习类比的神经网络结构来构建生成模型。

2017-07-27 16:43:58 674