自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

xuluohongshang的博客

专注做事情

  • 博客(101)
  • 资源 (8)
  • 收藏
  • 关注

原创 ubuntu下无root权限下用anaconda2从源码编译并安装caffe2 采坑日记!

相信做目标检测的同学都知道facebook已经开源了一个集成很多先进目标检测算法的库,但是官网教程主要针对采用ubuntu系统python来编译安装caffe2,由于采用深度学习服务器没有sudo权限,我花费了一天半安装GPU版的caffe2,最多的错误就是protobuff错误!!很难搞,做了很多测试才弄懂,下面做一个简单的总结,希望能帮助后来的初学者: 编译Anaconda下的Caffe2常...

2018-02-07 14:52:38 3956 13

原创 FashionAI全球挑战赛-服饰属性识别赛后技术分享

FashionAI全球挑战赛-服饰属性识别赛后技术分享(欢迎指正)

2018-06-07 22:42:14 4117 7

原创 numpy中数组和矩阵的索引方法及不同点

NumPy中数组和矩阵有些重要的区别: NumPy提供了两个基本的对象:一个N维数组对象和一个通用函数对象。其它对象都是建构在它们之上的。特别的,矩阵是继承自NumPy数组对象的二维数组对象。像平常在Python中一样,索引是从0开始的。传统上我们用矩形的行和列表示一个二维数组或矩阵,其中沿着0轴的方向被穿过的称作行,沿着1轴的方向被穿过的是列。 注:他们的索引一般都采用一维数组或者布尔值组成...

2018-02-09 10:37:57 7613

原创 list,tuple和numpy中nparray及np.hstack(),np.vstack(),np.stack()函数关系及用法解析

增补stack的理解:The stacked array has one more dimension than the input arrays.注意:arrays的含义!!!! numpy.stack(arrays, axis=0, out=None) arrays:sequence of array_like即arrays总要比输出arrays低一维,arrays里面的每一个array里...

2018-02-08 17:26:27 2582

原创 PyTorch:LeNet实现

In [5]:import torchimport torchvisionfrom torch.utils.data import DataLoaderfrom torchvision.datasets import MNISTfrom torchvision import transformsfrom torch.autograd import Variablefrom torch

2018-02-04 11:44:21 2896 2

原创 PyTorch入坑---初记

1.Pytorch简介Pytorch是Facebook 的 AI 研究团队发布了一个基于 Python的科学计算包,旨在服务两类场合:替代numpy发挥GPU潜能(在线环境暂时不支持GPU)一个提供了高度灵活性和效率的深度学习实验性平台2.Pytorch特点及优势2.1 Pytorch特点PyTorch 提供了运行在 GPU/CPU 之上、基础的张量操作库;可以内置的神经网络库;

2018-02-04 11:41:07 5511

原创 KNN

KNN 思想非常简单, 当一个新的数据输入的时候, 把该数据和训练集中的所有的数据比较一下, 距离输入数据最近的一个训练样本所属类别就是该输入数据的预测值, 这是 NN (最近邻)算法. 如果, 把上述过程的最近的一个修改成最近的 k 个, 然后这 k 个进行投票来决定预测结果, 那么, 这就是 kNN. 原理非常简单, 实现起来也不难.# -*- coding: utf8 -*-imp

2018-01-29 11:21:49 370

原创 linux/ubuntu 常用操作

1.按照进程名字 kill 一种方法是使用 pkill(pkill 按照名称 pattern kill 掉), 但是, 有时候 pkill 不好使, 还是用最原始的方法吧,即ps -ef | grep "name" | awk '{print $2}' | xargs kill -9其中:awk '{print $2}':$2:表示第二个字段,表示第2列,即进程号PID; pri

2018-01-29 11:20:27 288

原创 阅读论文:1502.InceptionV2-BN

参考: 论文地址:https://arxiv.org/pdf/1502.03167.pdf 详细说明:http://blog.csdn.net/hjimce/article/details/50866313 理解:http://blog.csdn.net/shuzfan/article/details/50723877 效果为什么好:https://www.zhihu.com/ques

2018-01-24 12:08:23 492

原创 1409.GoogLeNet-Going deeper with convolutions

paper:链接 论文信息: inception V1(也称GoogLeNet)是2014年Christian Szegedy提出的一种全新的深度学习结构,在这之前的AlexNet、VGG等结构都是通过增大网络的深度(层数)来获得更好的训练效果,但层数的增加会带来很多负作用,比如overfit、梯度消失、梯度爆炸等。inception的提出则从另一种角度来提升训练结果:能更高效的利用计算资

2018-01-23 11:43:15 332

原创 深度学习框架caffe 和 tensorflow

深度学习框架caffe 和 tensorflow

2018-01-19 17:55:09 1441

原创 阅读论文:1312.ICLR-Network In Network

Network In Network论文信息: 论文细节: 一般来说,所要提取的特征是高度非线性的,在传统的 CNN 中尝试使用超完备的滤波器来提取各种潜在的特征,具体来说,当需要提取某个抽象特征时,我们初始化大量的滤波器去提取尽可能多的特征,将我们期望的特征也覆盖到。如此产生的结果是网络结构复杂,参数空间过大。作者利用 Mlpconv 和 全局平均 pooling 建立了 N

2018-01-16 11:38:09 384

原创 CNN及主要模型框架的技术演进

卷积神经网络的要点就是局部连接(Local Connection)、权值共享(Weight Sharing)和池化层(Pooling)中的降采样(Down-Sampling)。其中,局部连接和权值共享降低了参数量,使训练复杂度大大下降,并减轻了过拟合。同时权值共享还赋予了卷积网络对平移的容忍性,而池化层降采样则进一步降低了输出参数量,并赋予模型对轻度形变的容忍性,提高了模型的泛化能力。卷积神经

2018-01-15 22:39:20 2134

原创 阅读论文:AlexNet

AlexNet:ImageNet Classification with Deep Convolutional Neural Networks论文信息: 训练了一个大规模的深度卷积神经网络来将ImageNet LSVRC-2010比赛中的包含120万幅高分辨率的图像数据集分为1000种不同类别。在测试集上,本文所得的top-1和top-5错误率分别为37.5%和17.0%,该测试结果大大

2018-01-15 21:20:26 416

原创 常见机器学习名词及解释

距离相关:

2018-01-12 17:01:40 997

原创 多任务学习

简介: 多任务学习(Multitask learning)是迁移学习算法的一种,迁移学习可理解为定义一个一个源领域source domain和一个目标领域(target domain),在source domain学习,并把学习到的知识迁移到target domain,提升target domain的学习效果(performance)。概念解析:多任务学习(Multi-task le

2018-01-12 16:35:45 37933

转载 triplet改进和变种

1.一开始是FaceNet2.一个重要的改进:image-based, Ding etal.3.对于样本挑选的改进:1)hard samples: hard positive 和hard negative (In Defense of Triplet Loss for person Re-Identification)2) hard negative (cvpr2016,车辆检索

2018-01-11 17:22:42 3430 1

原创 part-aligned系列论文:1711.Beyond Part Models- Person Retrieval with Refined Part Pooling 论文阅读笔记

Beyond Part Models- Person Retrieval with Refined Part Pooling这篇论文和1711.AlignedReID- Surpassing Human-Level Performance in Person Re-Identification这篇论文同样的出色,都将Market-1501数据集的TopRank-1性能刷到了95以上,但该论文没

2018-01-10 23:02:47 3496

原创 part-aligned系列论文:1707.Deep Representation Learning with Part Loss for Person ReID 论文阅读笔记

Deep Representation Learning with Part Loss for Person ReID本论文为了更好的提升reid模型在未见过的行人图像判别能力,正对现有大部分只有全局特征表达(转化为分类,一般minimize the empirical classification risk即loss)且容易过拟合而不考虑parts 局部特征表达(the representa

2018-01-10 22:58:14 1336 1

原创 1709.HydraPlus-Net-Attentive Deep Features for Pedestrian Analysis 论文笔记

HydraPlus-Net-Attentive Deep Features for Pedestrian Analysis 面向行人分析的注意力深度特征表达—HydraPlus(“九头蛇”)网络 代码资源:https://github.com/xh-liu/HydraPlus-Net论文信息: 论文介绍: 行人分析属于细粒度的行人识别任务,如行人属性识别和行人ID再识别,作者提出了一个新颖的

2018-01-09 22:33:38 1677 1

原创 正则化技术(分类识别):PatchShuffle Regularization 论文阅读笔记

PatchShuffle Regularization论文下载:https://arxiv.org/abs/1707.07103 论文详细信息: 过拟合问题发生的本质是模型更多的去学习噪声而不是捕捉潜在的存在于数据中的Varations关键因素,即由于缺少数据的多样性或者模型过于复杂使得模型的学习被不相关的局部信息所误导,学习了没用的噪声数据,考虑人的机制,即观察图像整体结构不变情况下,局部

2018-01-08 16:49:50 2228

原创 数据增强(检测,分类,识别):1708.Random Erasing Data Augmentation 论文笔记

Random Erasing Data Augmentation 论文下载地址:https://arxiv.org/abs/1708.04896详细信息: 论文资源代码: https://github.com/zhunzhong07/Random-Erasing论文解读: 首先,为了增强模型的泛化的性能,一般的手段有数据增强和正则化方法(如dropout,BN),而用于数

2018-01-08 11:26:06 10125

原创 part-aligned系列论文:1707.ICCV.Pedestrian Alignment Network for Large-scale Person Re-identification 论文

Pedestrian Alignment Network for Large-scale Person Re-identification github源码:https://github.com/layumi/Pedestrian_Alignment 本论文着重对错检和body部分缺失引起的尺度和姿态变化问题研究(如上图),前者可能会使检测得到的图像含有过多的背景,后者则是part mis

2018-01-06 23:02:42 2007

原创 1707.ICCV.Neural Person Search Machines检测加识别 论文阅读笔记

Neural Person Search Machines(NPSM)一个新颖的end-to-end的(检测+reid)行人搜索识别方法论文贡献: 1.提出了一种NPSM框架(基于LSTM记忆递归网络attention机制)来模拟人的视觉搜索机制,在记忆query/probe特征信息的指导下,递归地由小到大定位有效区域,由粗到精的得到iamge中与query匹配的行人区域。 2.相比于现阶

2018-01-06 17:45:13 1065 3

原创 part-aligned系列论文:1707.Deeply-Learned Part-Aligned Representations for Person Re-Identification 论文笔记

Deeply-Learned Part-Aligned Representations for Person Re-Identification一种超简单有效的行人对齐识别网络! inspired by attention model,propose a part-aligned human representation基于特征图 FCN全卷积提取特征图部分应用GoogLeNet部分网络,特征图

2018-01-06 12:07:25 5099

原创 1707.Deep Learning for Person Reidentification Using Support Vector Machines 论文笔记

作者文章参考自:S.-Z. Chen, C.-C. Guo, and J.-H. Lai, “Deep ranking for person re-identifcation via joint representation learning,” IEEETransactions on Image Processing, vol. 25, no. 5, pp. 2353–2367,2016.其

2018-01-05 21:46:55 829

原创 1705.Person Re-Identification by Deep Joint Learning of Multi-Loss Classification 论文阅读笔记

Person Re-Identification by Deep Joint Learning of Multi-Loss Classification 本文采用多loss分类联合训练同时学习行人条纹局部特征和全局特征,受益于局部和全局学习到的特征具有互补性,因此得到的特征更具区分性。具体框架如下: 提出的JLML(Joint Learning Multi-Loss)模型框架如下:

2018-01-05 21:29:53 967

原创 1705.Person Re-Identification by Deep Joint Learning of Multi-Loss Classification 论文阅读笔记

Person Re-Identification by Deep Joint Learning of Multi-Loss Classification 本文采用多loss分类联合训练同时学习行人条纹局部特征和全局特征,受益于局部和全局学习到的特征具有互补性,因此得到的特征更具区分性。具体框架如下: 提出的JLML(Joint Learning Multi-Loss)模型框架如下:

2018-01-05 15:16:03 709

原创 1705.IAN- The Individual Aggregation Network for Person Search 论文阅读笔记

本论文工作量不大,只是把A Discriminative Feature Learning Approach for Deep Face Recognition这篇论中的中心loss迁移了过来,对xiao tong的端到端的行人框架做了一些改进,不过作者改进工作是在港中文xiao tong最早先发布在axiv上的老版论文进行的,那篇论文用的是RSS随机采样loss,来解决训练问题。不过,文中也提到了

2018-01-04 17:43:48 1038

原创 1703.In Defense of the Triplet Loss for Person Re-Identification 论文阅读笔记

1703.In Defense of the Triplet Loss for Person Re-Identification-v2 本文为Triplet 的改进方法进行end-to-end 的基于深度学习的度量学习,作者改进了tripletloss,分别采用现成的可参数迁移的resnet-50v2模型和基于resnet设计的从头训练的模型进行了实验,在CUHK03,Market-1501和MA

2018-01-03 21:12:15 4028

原创 1701.Re-ranking Person Re-identification with k-reciprocal Encoding--PRW 论文阅读笔记

1701.Re-ranking Person Re-identification with k-reciprocal Encoding 本论文的书写格式写的很有条理。 基于k倒排编码的reid重排研究,论文中,作者提到当用reid方法获得初始的top-k排序后,重排方法是提升reid准确率的有效手段,作者提出了一种重排方法,通过编码特征降低计算量,并引入Jaccard距离,与原始距离做加权进行最

2018-01-03 20:26:58 4164

原创 1611.A Discriminatively Learned CNN Embedding for Person Re-identification论文阅读笔记

reid相关的问题: car recognition/fine-grained classification/objective retrieval/image retrieval/instance retrieval/Pedestrian retrieval基于identification loss的reid方法和基于verification loss的reid方法框架图: 作者分析了基于id

2018-01-02 22:35:31 1749

原创 1610.Deep Learning Prototype Domains for Person Re-Identification-CUHK-SYSU-PRW 论文笔记

基于深度学习原型域感知自适应的行人重识别 DLDP:deep learning model for domain perception selection and reid matching 行人重识别的核心就是一个跨域识别的问题,作者希望建立对摄像机视角鲁棒的模型来应用到未知视角的域中,因此,其提出了一种两步训练的深度学习方法,从训练集中发现固有的几个原型域模式,该方法训练好的的模型可

2018-01-02 10:39:42 1701 1

原创 1607.Gated Siamese Convolutional Neural Network Architecture for Human Re-identificationl论文笔记

作者的贡献: 作者针对Siamese network结构进行改进,采用更小的卷积核和更深的架构,包括采用最后几层采用更小的不对称的卷积核,引入BN层加快网络收敛,更重要的是,作者在最后四层之间插入matching gate层,通过比较每一特征图的每一排,在水平条纹上生成基于同一ID的更底层的特征掩膜,并将同一水平区域的有效区域特征整合到最终每层的特征提取中,作者将这种新颖的架构最终命名为Gat

2018-01-01 22:48:27 669

原创 1607.CVPR-Joint Learning of Single-image and Cross-image Representations for Person ReID 论文笔记

作者将reid任务按照最终测度方法的不同,分成了两类:即按照距离loss训练方法的SIR(single-image representation)和按照对比loss训练网络的CIR(cross-image representation),作者提出了一种卷积神经网络框架,可以将两类方法整合到一个框架里,进行联合训练,最终以得分和阈值设置的形式应用训练好的模型。这样可以提升匹配率的直觉上的原因: SI

2018-01-01 12:09:42 631

原创 1606.End--to-End Comparative Attention Networks for Person Re-identification 论文笔记

简介 参考人类视觉机制:即重复性的抓住某一区域主要信息来发现比较对象的相似性和差异性,来发现最匹配的目标, 利用LSTM网络设计注意力机制,增加了时空信息,设计端到端训练的比较性注意力网络(CAN),训练阶段,该网络采用online triplet损失,可以使LSTM网络部分对同一ID的对个显著性局部区域比较,并pull他们之间的相似性,而对不同ID的两个行人的多个显著性区域也进行学习,使之pu

2017-12-31 11:13:44 911 2

原创 1604.Person Re-identification in the Wild 论文笔记

1.摘要这篇论文发布了一个可以研究端到端的行人检测-重识别的大规模数据集和一些baselines,baselines主要包括不同检测器和reid识别算法组合的性能,行人检测怎么有助于reid准确率的提升及评估不同检测器对reid的有效性。 贡献:PRW数据集及基于数据集的广泛的benchmark(state-of-the-art detection and recognition methods

2017-12-30 22:22:40 1907

原创 1604. Learning deep feature representations with domain guided dropout for re-id论文阅读笔记

摘要: 本文提出了一种通用的基于深度学习的多源数据联合学习的算法(使用本文提出的 Domain Guided Dropout 替换传统的 Dropout),并通过广泛的实验,在 Learning ReID feature representation 任务上有效的验证和分析了算法的有效性。作者来自香港中文大学。 论文链接:https://arxiv.org/abs/1604.07528 代码地

2017-12-30 11:18:00 639

原创 深度学习框架技术解析及caffe实战一些总结

深度学习框架技术解析及caffe实战总结对应的PDF文件:下载

2017-12-29 18:51:32 488

原创 linux-Caffe技术总结

写python脚本:#!/usr/bin/env python写bash脚本:#!/bin/bash 或#!/usr/bin/env sh 其后常加set e 对于深度学习网络的训练任务中一般会需要三组数据库: 训练集,验证集及测试集。这里训练集中主要是用于训练网络,而验证集中主要是在训练网络中验证测试部分网络超参数,而测试集是用于考察网络的精度。因此,虽然三组数据集都是带标签的数据集,但训练

2017-12-29 18:44:51 871

深度学习框架技术解析及caffe实战总结

深度学习框架技术解析及caffe实战总结,自己的一些总结,主要是对Caffe和Tensorflow两个框架做一个对比介绍,并结合自己学习caffe的过程遇到的问题和理解做一个技术总结,很简单,本来是做一次小专题,感觉分享出来比较好。

2017-12-29

cascade检测器+DPM-C++实现

cascade检测器+DPM-C++实现,代码来自网络,仅供参考,亲测可以运行,用的C++实现的DPM目标检测算法,值得学习

2017-09-07

DPM算法实现:voc-release5(Win7+matlab2016b可运行

资源来自网络,经过我的配置,可完整运行,实现DPM算法对行人的检测,是一个一个完整的实现,含有注释和完整的工程文件,环境为win7+vs2013+matlab2016b,其他版本MATLAB也可

2017-09-07

voc-release4.01(Win7+matlab2016b可运行)

资源来自网络,经过我的配置,可完整运行,实现DPM算法对行人的检测,是一个一个完整的实现,含有注释和完整的工程文件,环境为win7+vs2013+matlab2016b,其他版本MATLAB也可

2017-09-07

利用Opencv3.2中的DPM模块,实现DPM算法对行人的检测,一个完整的实现,含有注释和完整的工程文件,环境为win7+vs2013

利用Opencv3.2中的DPM模块,实现DPM算法对行人的检测,一个完整的实现,含有注释和完整的工程文件,环境为win7+vs2013

2017-09-07

image tool 图像自动标注工具 很好用!!!

image tool 图像自动标注工具 很好用!!!可以自动把视频分拆成一张张图片,图片合成视频,内含说明文件。

2017-09-07

自己的学习心得

一些自己的opencv学习笔记,与大家分享

2016-09-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除