Shawn0901-CSDN博客

原创 pip安装出现FileNotFoundError: [Errno 2] No such file or directory: ‘/Disk/D/software/anaconda3/lib/pytho

在利用pip安装package的时候出现错误提示：“FileNotFoundError: [Errno 2] No such file or directory: ‘/Disk/D/software/anaconda3/lib/python3.6/site-packages/pip-20.2.dist-info/METADATA’解决方法第一种情况如果在pip-20.2.dist-info目录下还存在一个同样的子目录pip-20.2.dist-info，将该子目录中的METADATA文件拷贝到上一层的

2020-08-04 02:42:39 5560

原创 CVPR2019: Bag of Tricks for Image Classification with Convolutional Neural Networks

概况自2012年AlexNet提出以后涌现了大量的深度神经网络结构，例如VGG、Inception 及ResNet等等，这些不同网络结构之间的性能差异不仅仅是由网络结构的差异造成的，其它很多小的trick，比如stride size、学习率等等都会对结果带来很大的影响。为了综合评估各种手段对于训练结果的影响程度，本文对多种训练技巧进行了评估，并提出了一系列可以提升深度神经网络训练效果的trick...

2019-04-02 21:54:13 614

原创 VScode 调试的时候报错：Node.js Debugging fails - Request VSCodeAdapterService.nodeFork failed unexpectedly

VScode 调试的时候报错：Node.js Debugging fails - Request VSCodeAdapterService.nodeFork failed unexpectedly 原因在扩展插件LiveShare，卸载之后再重新启动Vscode 问题得以决绝。...

2019-02-17 17:00:38 849

原创零样本学习公开代码整理

2018_CVPR_Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs [code]2018_CVPR_Learning to Compare: Relation Network for Few-Shot Learning [code]2018_CVPR_A Generative Adversarial App...

2018-12-09 16:47:44 6634 5

原创零样本图像检索：Towards Affordable Semantic Searching: Zero-shot Retrieval via Dominant Attributes

Towards Affordable Semantic Searching: Zero-shot Retrieval via Dominant Attributes， AAAI 20181. 概要论文首次提出了零样本检索任务（Zero-shot Retrieval, ZSR）。该任务中包括两种场景，一种是通过未知类别图像的主要属性信息查询实例图像(Attributes to Image, A...

2018-11-14 14:41:46 1011

原创 CVPR2018 Sight and Sound 短文总结

CVPR2018 Sight and Sound 短文总结今年CVPR中关于视频和音频workshop： Sight and Sound一、视频（图像）与音频之间的相互生成1. A Multimodal Approach to Mapping Soundscapes （University of Kentucky）2. Image generation associated with music ...

2018-11-07 15:39:45 1872

原创 torch.randperm()

torch.randperm(n, out=None, dtype=torch.int64, layout=torch.strided, device=None, requires_grad=False)返回一个0到n-1的数组Parameters: n (int) – the upper bound (exclusive) out (Tensor, optiona...

2018-10-10 20:07:22 22149 4

原创 Pytorch学习：加载batch数据

参考：https://pytorch.org/tutorials/beginner/data_loading_tutorial.html数据集：https://download.pytorch.org/tutorial/faces.zip数据集概况：该数据集包含了图像和landmarks两部分，其中图像数据包含69张人脸图像，对应的landmarks中给出了相应图像的特征点。landmar...

2018-09-26 22:24:31 6882

原创 pandas数据结构：DataFrame

DataFrame是一个表格型的数据结构，包含行索引和列索引。下面通过传入一个由等长列表组成的字典来建立一个简单的DataFrame:import pandas as pddata={'name':['Shawn','Jason','Cindy','Danny','Jack','Rosen','Mike'], 'English':[80,70,30,60,50,29,40],...

2018-09-18 14:54:58 262

原创 pandas数据结构：Series

Series是一个带有标签（索引）的一维数组，由一组数据可以创建一个简单的Series:import pandas as pdx=pd.Series([3,5,6,8])>>> print(x)0 31 52 63 8dtype: int64Series的数据格式是索引在左边，数值在右边。由于没有指定索引，所以在此自动生成了0到N-...

2018-09-18 10:41:59 375

原创 Pytorch学习：自定义nn模块——一种搭建复杂网络的途径

参考：https://pytorch.org/tutorials/beginner/pytorch_with_examples.html#id19有时候顺序化的模型并不能满足我们搭建复杂网络的需求，这时候就可以使用子类nn.Module来定义一个向前传播过程。下面的例子中通过自定义模块定义了一个两层的前向传播模型：# -*- coding: utf-8 -*-import torc...

2018-09-17 20:54:07 2966 1

原创 Python学习：super()

参考：https://www.jianshu.com/p/45619cf50aa7super()在Python中常用于类的继承，相比于直接调用继承，采用super()可以保证父类不被重复调用。对于简单的调用父类：class parent: def fun1(self,message): print(message)class child(parent): ...

2018-09-17 20:17:22 1212

原创 Pytorch学习：nn & optim

计算图和autograd是定义复杂运算和自动求导的强大工具，但是在搭建大型的神经网络时，采用原生态的autograd会显得效率比较低下。在tensorflow中提供了诸如Keras, TensorFlow-Slim以及TFLearn等高层封装以便更有效地搭建神经网络，同样的，在Pytorch中提供了nn包来实现相同的目的。nn包中定义了一系列的module, 一个module对接收的张量进行计...

2018-09-17 16:27:53 726

原创 Pytorch学习：张量和自动求导——搭建一个简单的神经网络

参考pytorch官方文档：https://pytorch.org/tutorials/beginner/pytorch_with_examples.html#id17 （可能需要科学上网）当使用自动求导时(autograd)，网络的向前传播过程将会定义一个计算图，图中的结点由张量(tensor)构成，而运算过程将构成图的边(edge)。通过图的后向传播将会很容易实现对梯度的计算。如上所...

2018-09-17 12:20:34 1084

原创基于手绘草图的图像检索：Sketch Me That Shoe

摘要1.首次解决了基于手绘图进行细粒度图像实例检索(SBIR, sketch-based image retrieval)的问题。2.推出了两个新的细粒度SBIR数据集3.基于大量辅助的数据利用triplet ranking模型进行了阶段性的预训练4.对深度学习模型如何从增加的数据集中获得更好的提升进行了进一步的实验探索。数据集包含鞋和椅子两个数据集，共计716对草图-照片对。其...

2018-09-16 22:17:36 5411 2

原创手绘图像识别：Sketch-a-Net that Beats Humans

该工作针对手绘草图识别问题提出了一个多通道的深度神经网络框架，使得计算机对手绘草图的识别能力首次超过了人类。1. 针对手绘草图设计了专门的深度神经网络结构。2. 通过多通道的方式增加了对绘图过程中不同的绘制顺序的考虑。3. 利用贝叶斯融合的手段对多尺度的网络进行了融合，从而可以有效解决手绘草图不同程度的提取和稀疏问题。论文整体的框架如上图所示，其中深度神经网络结构如下：...

2018-09-15 21:23:04 4091

原创图像检索与三维重建：From Single Image Query to Detailed 3D reconstruction

先前基于图像检索的三维重建方式由于只关注尺度和外表相似的图像而往往会导致细节缺失问题，为解决该问题，本文结合了基于运动的重建(SfM, Structure-from-Motion)和多尺度场景下的图像检索进行三维重建。文中对重建系统和检索系统建立的连接，使得能够根据当前的3D重建情况控制检索特性。整体框架如上图所示，共分为以上几个步骤：1.图像查询阶段：利用查询图像作为初始种子进行...

2018-09-11 11:15:24 947

原创手绘图像检索：Deep Spatial-Semantic Attention for Fine-Grained Sketch-Based Image Retrieval

摘要文中提出了一种新的FG-SBIR(Fine-Grained Sketch-Based Image Retrieval)模型，虽然其本质上是一个常用的多分枝深度结构，不过相比于其它模型，其有以下特点：1）在每一个深度神经网络上都添加了注意力模块，因此使其对特征的学习可以更多的关注到显著性区域。2）通过对一个特征融合的方式将粗糙和细致的语义信息进行了融合。3）引入了一个基于高阶可学...

2018-09-05 15:57:23 3046 1

原创行人再识别：Joint Learning of Single-image and Cross-image Representations for Person Re-identification

摘要行人再识别问题一般有两种解决思路，一种是对单张图像的特征进行匹配(SIR, single-image represention)，另一种是对交叉图像特征进行二分类处理(CIR,cross-image representation)。在本文中，我们对两种方式之间的联系进行了探索，并借助CNN提出了一种联合两种方式的学习框架。对于上述的两种方式，第一种是通过比较两张图像特征之间的距离与阈值...

2018-09-04 19:26:05 1200

原创行人再识别：Mask-guided Contrastive Attention Model for Person Re-Identification

摘要1.引进二值化的行人分割轮廓图作为额外输入，并与彩色图像合成为四通道的新输入，然后设计一种基于分割轮廓图的对比注意模型来学习背景无关的行人特征。在此基础上，提出一种区域级别的三元组损失函数，分别来约束来自全图区域、行人身体区域、背景区域的特征，提出的损失函数可以让来自全图区域和行人身体区域的特征在特征空间靠近，并远离背景区域，最终达到去除背景的作用。2.提出一种特殊的样本来扩充数据集：...

2018-08-31 17:02:47 2042 1

原创行人再识别：Beyond triplet loss: a deep quadruplet network for person re-identification

摘要1.设计了一个四元损失函数，相比于三元损失该损失函数可以有效增加类间间距、减小类内间距2.提出了一种自适应选取hard examples的方法3.对比分析了不同损失函数之间的关系损失函数常用的三元损失：其中[z]+=max(z,0)，f(xi), f(xj), f(xk)表示三张输入图像的特征。文中采用了类似于[CVPR2016_Joint learning o...

2018-08-30 17:10:42 2660

原创 Kaggle “Google Landmark Retrieval” 竞赛第七名:Landmark Retrieval via Local Guidance and Global Expansion

摘要：谷歌最近就目前世界上最大的图像数据集“Google Landmarks”举办了一次检索比赛“Google Landmark Retrieval Challenge”。我们综合了不同的图像检索技术，提出了自己的检索模型，并在比赛中获得了第七名的成绩。本文将介绍我们的检索模型和结果，以及我们在竞赛中所克服的挑战查询系统的整个流程如上图所示，其主要包含五个步骤：1) 深度局部特征(DE...

2018-08-23 16:39:57 2365

原创地点识别：NetVLAD: CNN architecture for weakly supervised place recognition

摘要：我们着力于解决大规模地点识别的视觉问题，在该任务中需要快速、准确地识别给定查询图像的地点信息。本文主要有以下三个贡献：第一，我们针对地点识别问题以端到端的方式训练了一个卷积神经网络。该网络结构的主要组成部分NetVLAD是一个通用的新VLAD层，该层的提出主要源自于广泛应用在图像检索领域的特征“Vector of Locally Aggregated Descriptors”。该层可以很容易...

2018-08-22 18:06:33 3145 1

原创大规模图像检索深度特征：Large-Scale Image Retrieval with Attentive Deep Local Features

在今年CVPR的“Revisiting Oxford and Paris_ Large-Scale Image Retrieval Benchmarking”一文中，对比了当前几种比较优异的图像检索算法在landmark中的表现，其中由“Large-Scale Image Retrieval with Attentive Deep Local Features”提出的DELF特征展现出最为突出的检...

2018-08-21 15:12:05 9442

原创基于tensorflow+python3.5环境实现Faster R-CNN

1.程序源代码下载https://github.com/dBeker/Faster-RCNN-TensorFlow-Python3.5该程序是针对windows环境写的，所以在ubuntu中配置时需要做一些修改，详见以下步骤。2.安装所依赖的库按照源程序的readme.md文件，安装以下库：pip install cythoncython opencv-opencv easy...

2018-08-18 09:52:51 2222 10

原创 Ubuntu16安装cuda9.0+cudnn+GPU版Tensorflow

1.安装NVIDIA 驱动开始的时候根据一些教程下载了驱动安装包，然后在禁用nouveau，卸载原有驱动等一系列操作后再进入到字符界面进行的驱动安装，结果在遇到了不少麻烦。后来在反复重装系统无效的情况下发现其实安装NVIDIA驱动原本很简单，即通过系统自带的驱动更新功能即可完成：先代开terminal 输入以下指令：sudo apt-get update然后打开系统设置：进入...

2018-08-17 17:09:14 1008

原创 GPU 版tensorflow在训练CIFAR数据集时GPU 没有参与计算/出现假死机状态/CPU满负荷运转

代码：《TensorFlow实战》黄文坚著，第5.3节 TensorFlow 实现进阶的卷积网络，所用数据集为CIFAR-10出现问题的电脑型号:thinkpad T470; 显卡： GeForce 940mx问题描述：书中提供的代码之前在不同的台式机上运行都没有问题，后来在笔记本运行的时候发现CPU满负荷运转，而GPU没有参与计算。开始以为是显卡相关驱动没有安装好，在对显卡驱动进行了几番...

2018-07-27 08:45:36 1372 3

原创空间语义图像检索: Spatial-Semantic Image Search by Visual Feature Synthesis

如上图b所示，该论文提出一种利用画布的方式将空间信息考虑在内的图像检索方式。这种检索方式属于多模态的图像检索，即在检索中，queries和database属于不同的模态。在此前的图像检索领域中，大多是对语义相近或者视觉内容相近的图像进行检索，相应的特征也往往是为了图像的语义或者视觉内容而提取的。但是为了实现空间语义特征的图像检索，仅仅只有语义特征或者视觉特征是不可能实现的，因此需要一种特殊...

2018-07-24 15:15:53 1583

原创基于内容的图像检索之多尺度局部特征提取：Visual Instance Retrieval with Deep Convolutional Networks

由于检索目标在图像中出现的位置以及大小是变化不定的，因此采用多尺度的局部特征代替整张图像的特征在一定程度上可以改善检索效果。该论文是采用多尺度局部特征提取比较前期的一片文章，其直接在原图像上进行区域的划分，然后对划分后的图像进行特征的提取，最后将一张图像所有区域提取出的特征向量拼接到一起进行后处理工作。本文主要讲解该论文子区域划分的方法。论文...

2018-04-05 17:08:38 2279

原创 SIFT图像特征检测的Python代码实现

1.主要内容利用Python调用VLFeat（官方下载地址）提供的SIFT接口对图像进行特征检测。如果CSDN中图片加载不出来，可移步知乎相关文章：https://zhuanlan.zhihu.com/p/34890676 2.参考资料主要参考资料为由朱文涛和袁勇翻译的《python 计算机视觉》原书为《ProgrammingComputer Vision with Python》,该书主要内容包...

2018-03-24 11:36:50 26389 35

Shawn