5 ZeroZone零域

尚未进行身份认证

研究方向:计算机视觉/目标检测/深度学习(硕士在读)

等级
TA的排名 1w+

基于深度学习的目标检测

前言下面对每篇文章及模型的亮点和优势进行了简单总结,点击标题可以跳转至相关论文解读(难免存在纰漏或者词不达意的地方,望谅解)基于深度学习的目标检测发展轨迹下面是自RCNN以来有关目标检测的文章,其中,加粗的部分为具有标志性意义的检测模型。RCNN(CVPR,2013)⟶\longrightarrow⟶OverFeat(ICLR,2014)⟶\longrightarrow...

2019-03-13 11:00:02

module 'torchvision.datasets' has no attribute 'VOCDetection'

module‘torchvision.datasets’hasnoattribute‘VOCDetection’这是因为VOCDetection还没有添加到最新的release版本的导致的错误,我们可以通过源码的方式重新安装torchvision.方法如下:首先查看当前虚拟环境的torchvision的安装位置:importtorchvisionastv...

2018-12-19 11:26:47

MaskrcnnBenchmark 源码解析-模型定义(modeling)之骨架网络(backbone)

源码文件不论是在训练脚本文件train_net.py还是在测试脚本文件test_net.py中,都调用了build_detection_model(cfg)函数来创建模型,该函数封装了模型定义的内部细节,使得我们可以通过配置文件轻松的组合出不同类型的模型,为了能够更好的了解模型的内部细节,我们有必要知道这些模型是如何被定义,又是如何组合到一起的,为此我们需要对Mask...

2018-12-14 16:38:59

安装 maskrcnn-benchmark: command ':/usr/local/cuda/bin/nvcc' failed with exit status 1

command‘:/usr/local/cuda/bin/nvcc’failedwithexitstatus1unabletoexecute':/usr/local/cuda/bin/nvcc':Nosuchfileordirectoryerror:command':/usr/local/cuda/bin/nvcc'failedwithexitstatu...

2018-12-06 16:26:36

安装 maskrcnn-benchmark 报错command 'gcc' failed with exit status 1

command ‘gcc’ failed with exit status 1更换 gcc 版本.(太高不行, 太低也不行)建议使用4.9或者5.4版本的gcc.如果更换后, 会产生一大堆其他cpp文件错误, 则删除那些文件(我这里是在练习用的cpp文件夹下报错)...

2018-12-06 16:24:46

用Numpy实现一个简单的神经网络

本示例来自于PyTorch的官网上的一个warm-up小示例,觉得很有代表性,所有这里单独记录一下.对于numpy来说,它对计算图,深度学习,梯度等等概念几乎是不知道的,但是,如果我们了解简单神经网络的具体结构,那么我们就可以很轻易的用numpy来实现这个简单网络,对此,我们通常需要自己来实现前向计算和反向计算的逻辑,下面我们来实现一个具有两层隐藏层的简单网络:impor...

2018-11-13 21:33:56

Speed Accuracy TradeOffs (CVPR, 2017)

title:sitemap: truecategories: 计算机视觉date: 2018-11-10 16:27:03tags:目标检测计算机视觉文章: Speed/accuracy trade-offs for modern convolutional object detectors作者: Jonathan Huang, Vivek Rathod, Chen Sun...

2018-11-12 12:59:22

MaskRCNN-ICCV2017 论文解读

文章:MaskRCNN作者:KaimingHe,GeorgiaGkioxari,PiotrDollar,RossGirshick备注:FAIR,ICCVbestpaper核心亮点1)提出了一个简单,灵活,通用的实例分割模型框架MaskRCNN在FasterRCNN的基础上进行改进,在模型的head部分引入了一个新的mask预测分支,在训练阶段,该分...

2018-11-10 16:09:32

PyTorch官方教程(四)-Transfer_Learning_Tutorial

通常情况下, 我们不会从头训练整个神经网络, 更常用的做法是先让模型在一个非常大的数据集上进行预训练, 然后将预训练模型的权重作为当前任务的初始化参数, 或者作为固定的特征提取器来使用. 既通常我们需要面对的是下面两种情形:Finetuning the convnet: 在一个已经训练好的模型上面进行二次训练ConvNet as fixed feature extractor: 此时, 我们...

2018-11-09 21:32:16

PyTorch官方教程(三)-Learning PyTorch with Examples

TensorsWarm-up: numpy对于numpy来说, 它对计算图, 深度学习, 梯度等等概念几乎是不知道的, 但是, 如果我们了解简单神经网络的具体结构, 那么我们就可以很轻易的用numpy来实现这个简单网络, 对此, 我们通常需要自己来实现前向计算和反向计算的逻辑, 下面我们来实现一个具有两层隐藏层的简单网络:import numpy as np# N 为batch size...

2018-11-09 20:21:49

PyTorch官方教程(二)-DataLoadingAndProcessing

对于一个新的机器/深度学习任务, 大量的时间都会花费在数据准备上. PyTorch提供了多种辅助工具来帮助用户更方便的处理和加载数据. 本示例主要会用到以下两个包:scikit-image: 用于读取和处理图片pandas: 用于解析csv文件导入下面的包from __future__ import print_function, divisionimport osimport t...

2018-11-09 20:21:04

PyTorch官方教程(一)-A 60 Minute Blitz

WhatisPyTorch?一个基于Python的科学计算包,设计目的有两点:numpy在GPUs实现上的替代品具有高度灵活性和速度的深度学习研究平台TensorsTensors可以理解成是Numpy中的ndarrays,只不过Tensors支持GPU加速计算.x=torch.empty(5,3)print(x)#输出5×3的未初始化的矩阵,矩阵元素未初始化...

2018-11-09 20:20:11

SSD pytorch 源码demo报错: ValueError: not enough values to unpack (expected 2, got 0)

https://github.com/amdegroot/ssd.pytorch/issues/154#issuecomment-384856547将 detection.py 文件中第49行(行数可以因版本不同而不同):if scores.dim() == 0: continue改为if scores.size(0) == 0: continue...

2018-10-29 20:01:03

梯度消失和梯度爆炸问题详解

1.为什么使用梯度下降来优化神经网络参数?反向传播(用于优化神网参数):根据损失函数计算的误差通过反向传播的方式,指导深度网络参数的更新优化。采取反向传播的原因:首先,深层网络由许多线性层和非线性层堆叠而来,每一层非线性层都可以视为是一个非线性函数f(x)f(x)f(x)(非线性来自于非线性激活函数),因此整个深度网络可以视为是一个复合的非线性多元函数。我们最终的目的是希望这个非线性函数很好...

2018-10-28 22:42:33

机器学习经典算法之SVM深入解析

前言起初让我最头疼的是拉格朗日对偶和SMO,后来逐渐明白拉格朗日对偶的重要作用是将w的计算提前并消除w,使得优化函数变为拉格朗日乘子的单一参数优化问题。而SMO里面迭代公式的推导也着实让我花费了不少时间。对比这么复杂的推导过程,SVM的思想确实那么简单。它不再像logistic回归一样企图去拟合样本点(中间加了一层sigmoid函数变换),而是就在样本中去找分隔线,为了评判哪条分界线更好,引入...

2018-10-28 22:41:28

Focal Loss for Dense Object Detection

文章: Focal Loss for Dense Object Detection作者: Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, Piotr Dollár核心亮点(1) 分析并指出了One Stage方法精度不高的原因:极度不平衡的正负样本比例: anchor是一种类似sliding windows的选框方式, 这会使得...

2018-10-28 22:38:03

Detectron源码解读-roidb数据结构

roidb数据结构roidb的类型是list, 其中的每个元素的数据类型都是dict, roidb列表的长度为数据集的数量(即图片的数量), roidb中每个元素的详细情况如下表所示:for entry in roidb数据类型详细说明entry['id']int代表了当前image的img_identry['file_name']string表示当前图片的...

2018-10-28 22:36:34

Caffe2-Detectron源码解读-数据载入

Coordinator 类由于 RoIDataLoader 类将 Coordinator 类对象作为成员变量, 因此我们先看一下这个类的作用和底层实现, 该类位于detectron/utils/coordinator.py文件中, 定义如下:#detectron/utils/coordinator.py# 从名字可以看出, 该类的作用主要是协调各个数据载入管道之间的信息同步# 实现上, ...

2018-10-28 22:35:08

Batch-Normalization深入解析

BN:总的来说,BN通过将每一层网络的输入进行normalization,保证输入分布的均值与方差固定在一定范围内,减少了网络中的Internal Covariate Shift问题,并在一定程度上缓解了梯度消失,加速了模型收敛;并且BN使得网络对参数、激活函数更加具有鲁棒性,降低了神经网络模型训练和调参的复杂度;最后BN训练过程中由于使用mini-batch的mean/variance每次都不同...

2018-10-22 19:18:32

安装Caffe报错: Cannot load caffe2.python. Error... not

警告WARNING:root:This caffe2 python run does not have GPU support. Will run in CPU only mode.出现上面的问题的话, 首先看看是不是没有安装NCCL, 如果没有安装的话, 安装以后应该就能好使使用下面的指令测试caffe安装是否成功python -c 'from caffe2.python import ...

2018-10-03 19:34:23

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!