5 Elaine_Bao

尚未进行身份认证

研究方向:计算机视觉

等级
博文 76
排名 1w+

神经网络量化简介

本文转载自:https://jackwish.net/neural-network-quantization-introduction-chn.html前言计划写一系列关于神经网络量化(NeuralNetworkQuantization)的文章已经有一段时间了。这篇神经网络量化简介列出了一些重要的主题。近年来快速发展的深度学习(DeepLearning)有很多关于量化方法的研究。...

2019-06-20 20:58:20

自然场景文本检测技术综述(CTPN, SegLink, EAST)

文章转载自:https://www.cnblogs.com/skyfsm/p/9776611.html前言文字识别分为两个具体步骤:文字的检测和文字的识别,两者缺一不可,尤其是文字检测,是识别的前提条件,若文字都找不到,那何谈文字识别。今天我们首先来谈一下当今流行的文字检测技术有哪些。文本检测不是一件简单的任务,尤其是复杂场景下的文本检测,非常具有挑战性。自然场景下的文本检测有如下几个难点:...

2019-03-25 13:38:40

【论文笔记】CNN图像分类Tricks合集

paper:BagofTricksforImageClassificationwithConvolutionalNeuralNetworksauthor:TongHe,ZhiZhang,HangZhang,ZhongyueZhang,JunyuanXie,MuLi(AmazonWebServices)code:https://github.com...

2019-01-09 19:39:08

【论文笔记】视频分类与图网络的结合 Videos as Space-Time Region Graphs

Paper:https://arxiv.org/abs/1806.01810(ECCV2018)Author:XiaolongWang,AbhinavGupta(CMU)0.引言GNN最近在深度学习领域受到了广泛关注,其具有解决深度学习无法解决的因果推理和可解释性的问题,可以说是一个比较有前景的方向。今天来分享一篇ECCV2018的paper,结合图网络来做视频分类。视频和...

2018-12-26 20:40:04

【论文笔记】时空域特征学习的反思:视频分类中速度与精度的权衡

论文链接:rethinkingspatiotemporalfeaturelearning:speed-accuracytrade-offsinvideoclassificationGoogleResearch&UniversityofCaliforniaSanDiego1.文章想回答的3个问题我们是否真的需要3dconv?如果需要的话,哪些层我...

2018-10-12 20:06:31

【论文笔记】光流在视频行为识别中的作用

Paper:OntheIntegrationofOpticalFlowandActionRecognitionAuthor:Facebook,ZhejiangUniversity,MPIforIntelligentSystems,NVIDIA0.引言在做视频行为识别时,特别是基于two-stream框架时,常常会引入光流图作为双流网络其中一支的输入。这是很...

2018-07-02 23:06:22

【论文笔记】Non-local Neural Networks

Paper:https://arxiv.org/abs/1711.07971v1Author:XiaolongWang,RossGirshick,AbhinavGupta,KaimingHe(CMU,FAIR)0.简述convolution和recurrent都是对局部区域进行的操作,所以它们是典型的localoperations。受计算机视觉中经典的非局部均值...

2018-06-26 21:34:50

【论文笔记】视频分类系列 Recognize Actions by Disentangling Components of Dynamics

Paper:http://openaccess.thecvf.com/content_cvpr_2018/papers/Zhao_Recognize_Actions_by_CVPR_2018_paper.pdfAnthor:YueZhao,YuanjunXiong,andDahuaLin(SenseTime,CUHK,AmazonRekognition)这是商汤在20...

2018-06-25 23:03:30

【论文笔记】视频分类系列 Optical Flow Guided Feature: A Fast and Robust Motion Representation for Video (OFF)

Paper:OpticalFlowGuidedFeature:AFastandRobustMotionRepresentationforVideoActionRecognition(CVPR2018,SenseTime)0.简述运动信息对于视频中动作的识别有着重要的作用。其中最常用的一种运动信息,是光流。之前的方法计算光流是offline的,比较耗时,...

2018-06-24 21:44:45

【论文笔记】视频分类系列 Temporal Relational Reasoning in Videos (TRN)

Paper:https://arxiv.org/abs/1711.08496v1Code:https://github.com/metalbubble/TRN-pytorch作者:BoleiZhou,AlexAndonian,AntonioTorralba(CSAIL,MIT)简述时间关系推理(Temporalrelationalreasoning)是指理...

2018-06-20 22:24:36

【论文笔记】CVPR2018 Detecting and Recognizing Human-Object Interactions

Paper:https://arxiv.org/abs/1704.07333作者:GeorgiaGkioxari,RossGirshick,PiotrDollár,KaimingHe。从题目中看出这篇文章主要是研究人与物的互动。根据统计,CVPR2018中分析图像中的人类的有100多篇,说明人们开始关注对图像中主体和关系的理解(这也是GraphNetwork火的原因)。...

2018-06-19 22:39:57

【论文笔记】视频分类系列 Appearance-and-Relation Networks for Video Classification (ARTNet)

时间空间域的特征学习对于视频分类来说很重要。文章提出了Appearance-and-RelationNetworks(ARTNet)的结构,用于end-to-end地学习视频时间空间域的特征。ARTNet是由多个名为SMART的block堆叠而成。SMART模块的目标是从RGB帧中分别学习到appearance和relation。

2018-03-05 23:04:49

【论文笔记】视频分类系列 Temproal Segment Networks (TSN)

论文:https://arxiv.org/abs/1608.00859代码:https://github.com/yjxiong/temporal-segment-networks1.引言在视频分类中,对长时间域的建模有利于掌握整个视频的类别。而ConvNets擅长的是对appearance的建模和短时的motion。因此对于长时域结构的建模,CUHK提出了TSN。

2018-03-04 22:16:29

【caffe源码笔记】VideoDataLayer解析

caffe中video_data_layer.cpp的解析,直接看代码中的注释。//include的部分就不介绍了#include<fstream>#include<iostream>#include<string>#include<utility>#include<vector>#include"ca...

2018-03-03 22:55:00

Mac 挂载NTFS移动硬盘进行读写操作 Readonly file system

1. diskutilinfo/Volumes/YOUR_NTFS_DISK_NAME 找到 DeviceNodeDeviceNode:       /dev/disk1s12. hdiutileject/Volumes/YOUR_NTFS_DISK_NAME"disk1"unmounted."disk1"ejected.弹出你的硬盘3

2018-02-07 10:05:15

【论文笔记】视频物体检测(VID)系列 NoScope:1000x的视频检索加速算法

计算机视觉的进展,特别是近期深度神经网络的进展,使得在不断增长的视频数据中进行检索成为可能。但是,基于神经网络去做大规模视频检索,直接的问题就是计算量激增。比如现在最快的物体检测器能达到1~2.5xrealtime的效率(30~80fps),前提是买一个$4000的GPU。

2017-12-17 12:17:34

【论文笔记】物体检测系列 SSD: Single Shot MultiBox Detector

一句话概述:SSD是One-stage的物体检测器,它是直接预测每个defaultbox(在RCNN中称为anchor)是各物体类别的概率,并做回归。另外,SSD使用不同层的featuremap来handle不同大小的物体。

2017-12-17 11:17:29

【论文笔记】物体检测系列 Light-Head R-CNN: In Defense of Two-Stage Object Detector

文章:https://arxiv.org/abs/1711.07264v1这篇文章是旷视科技和清华大学联合出品的,主要是对其今年在COCO检测竞赛上的部分成果分享。他们总共拿下了COCODetection/SegmentationChallenge(检测/分割)、COCOKeypointChallenge(人体关键点检测)、PlacesInstanceSegmentation(实体

2017-12-03 17:27:35

C++ API载入tensorflow graph

通过C++API载入tensorflowgraph在tensorflowrepo中,和C++相关的tutorial远没有python的那么详尽。这篇文章主要介绍如何利用C++来载入一个预训练好的graph,以便于单独使用或者嵌入到其他app中。Requirements安装bazel:tensorflow是使用bazel来进行编译的,所以如果要编译其他需要用到tensorflow的文件,我们就

2017-12-03 16:19:33

Bazel入门2:C++编译常见用例

1.在一个target中包含多个文件可以利用glob在单个target中包含多个文件,例如:cc_library(name="build-all-the-files",srcs=glob(["*.cc"])hdrs=glob(["*.h"]),)在这个target中,Bazel会编译BUILD文件所在目录下的所有.cc和.h文件(不包括子目录)。2.in

2017-11-29 23:05:17
奖章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!