3 linolzhang

尚未进行身份认证

我要认证

资深产品经理,系统架构师,PMP,PMI-ACP敏捷开发专家,个人主要研究领域为 AI、AR、3D Visualization。

等级
TA的排名 3k+

YoloV4模型解析及TensorRT加速

一. Yolo演化史Faster RCNN诞生以后,目标检测准确度得到保证,但是two-stage的方式存在天然的效率缺陷,SSD和Yolo填补了这一空白,Yolo一共经历了4个版本。模型 数据增强/训练 Backbone 网络特征层 性能对比 备注 Yolo v1 Lenet -maxPooling 每个点支持2个box ...

2020-05-02 14:23:09

Mask Scoring RCNN训练自己的数据

一.代码准备基于pytorch。maskscoringrcnn代码参考:【github】maskrcnnbenchmark【github】二.环境安装1.基于conda创建pytorch环境:condacreate-npytorchpython=3.7.4condainstallipythoncondainst...

2019-07-30 23:39:14

Anchor Free检测算法之FCOS

一.提出背景2019 是 Anchor Free 大行其道的一年,从CornerNet 到 ExtremeNet,从FSAF到FCOS,层出不穷。论文:FCOS: Fully Convolutional One-Stage Object Detection【paper】【github】二.算法框架FCOS框架比较简单,架构图参考:基础backbone是一个3层的卷积网络(对...

2019-06-16 22:05:11

CVPR2019-实例分割Mask Scoring R-CNN

今年的Oral,在coco数据集表现超过了Mask RCNN,来自地平线的华科实习生。论文:Mask Scoring R-CNN【paper】【github】1. 提出背景 Mask RCNN 提出以来,一直是作为经典霸屏,但这里面一直存在一个严重的问题,那就是其score机制: 由于沿用了Faster RCNN 的 class和box,对应class是类别sco...

2019-05-24 23:01:19

CVPR2019-目标检测分割技术进展

CVPR 2019 没有出现像Faster RCNN,YOLO这种开创性的工作,基于现有方案和框架的改进为主,技术进步着实有些缓慢,或许也代表方案逐步趋于成熟。 本文重点介绍如下几个改进方法:GA-RPN GIOU FSAF Mask Score RCNN1. GA-RPN GA-RPN由港中文、商汤和亚马逊联合提出,COCO Challeng...

2019-05-11 22:46:29

Tensorflow object detection API训练自己的数据

一. 安装    Tensorflow object detection api是tensorflow官方出品的检测工具包,集成了像ssd、faster rcnn等检测算法,mobilenet、inception、resnet等backbone和fpn、ppn等方法,各模块之间能够通过组合的方式来work。    Github下载地址:https://github.com/tensorfl...

2019-02-12 23:33:43

OCR文字识别(2)

一. 文字识别       文字识别是指在确定检测框之后,识别出对应的文字,文字识别的方法有很多,包括:1)基于分割后单个字符的分类;2)基于序列的CNN方法,包括 基于STN矫正,CTC loss,Attention机制等策略;3)基于one step的检测-识别方法,比如fots、Radical Analysis Network;二. Attention Model  ...

2019-02-07 10:25:33

OCR文字识别(1)

一. 研究背景       文字识别是CV领域应用最广,最接地气的方向之一,从证件识别到智慧医疗,从拍照识别到无人驾驶,从车牌识别到物流分拣,几乎涵盖了AI的所有场景。       通常文字识别分成两步,文本位置检测 + 识别。    > 论文参考:        【场景文本位置感知与识别】    > 常用数据集:数据集名称 内容说明 下载 中...

2018-09-20 00:37:12

基础网络架构探究之DiracNets

CNN研究者总是面临一个共同的话题:如何提升神经网络的表达能力?分两个方向去探讨:1)拉长增加网络层数是最直观的一种方法,但这种方法所面临的是 梯度消失问题,网络越深,梯度的回传越困难。基于此,MSRA提出了ResNet,通过skipconnection的方式,通过残差思想很好的解决了这个问题。可以参考论文:Deep Residual Learning forImage Recognition这一...

2018-03-28 02:11:08

Facebook开源检测工具包 Detectron (by Caffe2)

一. Detectron 特征        大名鼎鼎的 FAIR 开发的软件包,可以从【github】了解一下。        个人感觉比较有用的是 基于 ResNet 基础框架的 Faster RCNN和Mask RCNN。        Detectron 基于 Caffe2(貌似被诟病的不轻),就目前阶段来看,caffe2 还有待于完善(pytorch也是一个意思),其工程化程度远不如 T...

2018-02-02 23:31:55

TensorRT深度学习推理框架介绍

一.  产生背景       深度学习的发展带动了一批深度学习框架,caffe、tensorflow、pytorch等,对于计算量庞大的CNN,效率一直是大家所关注的,接触过深度网络压缩的同学应该知道网络压缩最关键的两个思路,剪枝和量化。       TensorRT就是量化,将FP32位权值数据优化为 FP16 或者 INT8,而推理精度不发生明显的降低。       关于TensorRT首先要...

2018-01-16 23:52:37

人群密度估计-Crowd Density

一.应用背景   在安防大背景下,对敏感区域人流量的管控是一个重要的课题,防止人群骚乱、踩踏现象的发生,对非预期的人员汇聚进行预警等等,最常用的方法是检测到每个目标,然后借助Perspective矩阵完成到实际位置的映射,当然,在目标很难检测的情况下(密度极大、遮挡严重),基于回归的方法就派上了用场。   本节主要讲基于深度学习的回归方法来实现人群密度检测。二.人群密度之Cr

2017-12-18 23:47:49

语义分割网络之PSPnet

一.提出背景       基于FCN全卷积网络的分割面临诸多问题,这篇文章从多尺度入手,提出了金字塔模型来提取多尺度的信息,达到了 State-of-the-art 的结果       论文:PSPnet:Pyramid Scene Parsing Network 【点击下载】       Caffe代码:【Github】二.算法框架       算法细节比较多,这里我主要强调以下几个关键点:

2017-11-14 22:53:55

深度网络模型压缩 - CNN Compression

一. 技术背景       一般情况下,CNN网络的深度和效果成正比,网络参数越多,准确度越高,基于这个假设,ResNet50(152)极大提升了CNN的效果,但inference的计算量也变得很大。这种网络很难跑在前端移动设备上,除非网络变得简洁高效。       基于这个假设,有很多处理方法,设计层数更少的网络、更少的卷积和、每个参数占更少的字节,等等。       前面讲过的 PVANet、

2017-10-13 23:22:39

视频人员行为识别(Action Recognition)

一.提出背景    目标:给定一段视频,通过分析,得到里面人员的动作行为。    问题:可以定义为一个分类问题,通过对预定的样本进行分类训练,解决一个输入视频的多分类问题。    这里提出的问题是简单的图片(视频)分类问题,该问题的前提条件是:场景目标为单人,并且占据图片比较大的比例,如下图所示:         还有一类问题是基于行人检测,去估计行人的姿态和动作,

2017-09-19 21:28:28

Mark 一些有意思的深度学习方向

1. VQA       Visual Question Answering,给出一张图片,就该图片提出任何问题?自动get到你所期望的答案。这属于Visual Reasoning 的范畴,学者们不满足于传统的图像识别、分割、Caption等工作,尝试去挖掘更高级的机器推理能力。来看解决思路,CNN、LSTM(RNN)、Attention Model、BOW,都是图像、文本、NLP领域的通用手法,

2017-09-08 22:35:56

NoScope:极速视频目标检测

一.提出背景       在基于CNN的方法提升到一个很高的准确度之后,效率又成为人们所关注的话题,目前兼备准确度和效率的方法包括 SSD、YOLO v2,其检测效率通常能到达 30-100FPS,而这里面的代价就是上万块的显卡,这个代价是相当高的。当下视频获取设备(CCTV摄像头)成本通常是几百块,而采用上述分类算法,其成本可能是几千,这就是视频获取和视频分析之间的巨大鸿沟。       基于此

2017-08-29 23:22:04

DenseNet:更接近于真实神经网络的跨层连接

一. 提出背景       论文:Densely Connected Convolutional Networks 【点击下载】       Caffe代码:【Github】       受 Highway、ResNet 等算法思路的启发,提出一种跨层的连接网络,思路非常简单,直接上图:        二. 算法思路       作者这个提法比较大胆,每个层的 input 包括之前所有层的信息,通

2017-08-16 22:11:08

对抗网络之目标检测应用:A-Fast-RCNN

对抗网络之目标检测应用:A-Fast-RCNN       论文:A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection 【点击下载】       Caffe代码:【Github】一. 深度学习正确的打开方式       深度学习的根基在于样本,大量的样本决定了深度网络的精确度和收敛性,针对样本的挖掘是深度学

2017-08-05 00:21:16

轻量级网络 - PVANet & SuffleNet

一. PVANet       论文:PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection    【点击下载】       Caffe代码:【Github】       设计了一种轻量级的网络,取名叫 PVANet,特点是 Channel少、Layer多,在 VOC2007 和 VOC2012  精确

2017-07-28 23:56:22

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。