8 Will-Lin

尚未进行身份认证

计算机视觉/自动化/SJTU

等级
TA的排名 1w+

[CVPR 2018论文笔记] 真实监控场景中的异常事件检测

安防作为近年最热门的计算机视觉研究落地方向,与视频分析研究有着很紧密的关系。在真实的监控视频中,一个常见的需求就是要自动识别视频流中的异常事件,也就是异常事件检测任务(Anomaly detection)。这个任务有许多的难点,比如异常事件发生的频率很低,导致数据的收集和标注比较困难;异常事件的稀少导致训练中的正样本远少于负样本;在监控场景中,不管是通常(normaly)还是异常(a...

2018-06-03 22:09:12

[论文笔记] 用于在线视频理解的高效卷积网络

视频理解算法有很多的应用场景,包括视频推荐、监控分析、人机交互等等。在这些真实的应用场景中,通常对算法的实时性有很高的要求。现有的行为识别方法还未能在分类的准确性和运行速度都达到比较好的效果(双流类的方法效果较好,但光流等步骤使得速度很受限;3D 网络类的方法目前的精度和速度也都还不够理想)。所以在保证分类效果的前提下,提高网络的运行速度是当前一个很重要的研究课题。针对这个问题,这篇论文笔记主...

2018-06-03 21:59:57

【论文笔记】光流与行为识别的结合研究

在视频行为识别(action recognition)方向,目前最常见的网络框架有两类,一类是直接将视频作为输入的3D卷积网络,另一类即是将图像以及光流(optical flow)分别作为输入的two-stream网络。目前two-stream类的方法在效果上还是明显要优于3D卷积类的方法,本文主要讨论two-stream类方法中光流的应用。虽然光流在two-stream类的方法里被广泛应

2017-12-29 22:55:10

Moments in Time:IBM-MIT联合提出最新百万规模视频动作理解数据集

在过去一年中,视频理解相关的领域涌现了大量的新模型、新方法,与之相伴的,今年也出现了多个新的大规模的视频理解数据集。近期,MIT-IBM Watson AI Lab 就推出了一个全新的百万规模视频理解数据集Moments-in-Time[1]。虽然没有之前的YouTube-8M数据集大,但应该是目前多样性,差异性最高的数据集了。该数据集的任务仍然为视频分类任务,不过其更专注于对“动作”的分类,此处

2017-12-27 19:28:51

百度BROAD-Video Highlights视频精彩片段数据集简要介绍与分析

前两天在微信上看到这条新闻 ,百度搞了一个数据集开源计划 Baidu Research Open-Access Dataset (BROAD),其网址为 Baidu Research Open-Access Dataset。首期开放了3个数据集,其中有一个数据集 称为 Video Highlights 。我发现这个数据集与我研究的temporal action detection 以及temp

2017-12-27 19:24:17

论文笔记:第一人称视角视频中的行人轨迹预测

本文投稿于AI科技评论公众号。视频中的人体动作分析是计算机视觉研究领域中的一个重要方向,包括动作分类,时序动作检测,时空动作检测等等方向。前几天日本东京大学在 arXiv 上放出的一篇论文(大概是 CVPR 投稿文章吧)提出了一个新的人体动作分析问题:第一人称视频中的行人轨迹预测问题,并提出了一个新的数据集以及一个新的行人轨迹预测算法。论文的题目为:Future Person Lo

2017-12-27 19:18:32

【ICCV 2017论文笔记】我们应当如何理解视频中的人类行为?

搬运自我的知乎专栏:https://zhuanlan.zhihu.com/wzmsltw  。欢迎大家关注。最近ICCV 2017公布了论文录用的情况,我照例扫了一遍论文列表寻找感兴趣的文章。“WhatActions are Needed for Understanding Human Actions in Videos?”[arXiv 链接] 一文是我觉得很有趣的一篇文章。这

2017-12-27 19:13:40

ActivityNet Challenge 2017 冠军方案分享

搬运自我的知乎专栏:https://zhuanlan.zhihu.com/wzmsltw  。欢迎大家关注。CVPR 2017 这几天开始在夏威夷火热举行,CVPR’17 上举行的各类challenge在近期也纷纷落下帷幕。在过去的两个多月时间里,我在赵旭老师和寿政学长的指导下,参加了CVPR‘17 上举办的 ActivityNet Large Scale Activity Rec

2017-12-27 19:09:56

Temporal Action Detection (时序动作检测)方向2017年会议论文整理

2017年马上要过去,自己也在时序动作检测这个方向正好做了一年时间,所以最近整理了一下今年各大视觉会议上(CVPR,ICCV,ACMMM,BMVC,AAAI等)时序动作检测这个方向的论文,供大家参考。关于Temporal Action Detection (Localization) 时序动作检测这一方向的介绍,可以见我之前的专栏文章: Video Analysis 相关领域解读之Temporal

2017-11-29 16:00:05

Single Shot Temporal Action Detection 论文介绍

这篇笔记主要介绍我今年上半年投稿到ACM Multimedia会议的工作。这篇论文的实验大概从寒假放假回来后开始,在ICCV截稿前一个礼拜开始准备论文,但时间太赶没能完成实验和论文写作,所以花了一个多月完善后投稿了ACM multimedia。ACM multimedia 今年取消了long/short paper的区分,而是改为oral/poster paper,这两者均为9页长度(8页正文,1页

2017-07-12 22:16:28

SOHU图文匹配竞赛-方案分享

注:本文为原创文章,如需转载请先私信联系。最近参加的sohu图文匹配竞赛在这周二在北京举办了决赛,虽然期末忙没去成,但也全程视频直播围观了比赛。我所在的团队(“中国国家跳水队”,排名如队名,一度严重跳水)获得了初赛第3, 复赛第9, 决赛第6的成绩,正好擦边获得了三等奖。参加这次比赛的初衷是作为机器学习课程的大作业,这两天写了课程报告,所以将报告内容修改了一下进行分享。主要分为三个部分,分别为比赛背

2017-06-16 13:10:22

Video Analysis 相关领域介绍之Video Captioning(视频to文字描述)

之前两次分别介绍了video analysis中的action recognition 以及 temporal action detection 这两个领域。这两个领域算是对视频mid-level的理解,而我最近看论文主要在关注如何去理解视频的高层语义(high-level)信息,这方面一个重要的领域就是video captioning。video caption

2017-05-05 10:58:39

Video Analysis 相关领域解读之Temporal Action Detection(时序行为检测)

本文投稿于极视角公众号,链接为文章链接.也欢迎大家关注我的知乎专栏CV论文笔记及其他。上一篇笔记介绍了ActionRecognition领域的研究进展。ActionRecognition主要是用于给分割好的视频片段分类,但实际中大部分视频都是未分割的长视频。所以这就引出了今天要介绍的领域:TemporalActionDetection

2017-04-27 12:15:06

Video Analysis相关领域介绍之Action Recognition(行为识别)

这篇文章投稿在极视角公众号,微信链接随着深度学习技术的发展,以及计算能力的进步(GPU等),现在基于视频的研究领域越来越受到重视。视频与图片最大的不同在于视频还包含了时序上的信息,此外需要的计算量通常也大很多。目前主要在做视频中动作定位相关的工作,为了开拓思路,读了不少视频分析相关领域的文章,所以打算写几篇博客,对视频分析相关的几个领域做一个简要的介绍。这篇主要介绍ActionRecogniti

2017-04-19 12:28:35

SCNN-用于时序动作定位的多阶段3D卷积网络

注:本文首发在微信公众号-极市平台。如需转载,请联系微信Extreme-Vision这篇文章主要介绍Zheng Shou在CVPR2016上的工作”Temporal action localization in untrimmed videos via multi-stage cnns”[1]。之后会再介绍他在CVPR2017 上的新工作。首先介绍一下这篇文章要解决的问题。视频中的人体行为识别主要包

2017-03-23 10:02:55

行为识别笔记:C3D network-用于视频特征提取的3维卷积网络

注:本文首发在微信公众号-极市平台。如需转载,请联系微信Extreme-Vision卷积神经网络(CNN)近年被广泛应用于计算机视觉中,包括分类、检测、分割等任务。这些任务一般都是针对图像进行的,使用的是二维卷积(即卷积核的维度为二维)。而对于基于视频分析的问题,2D convolution不能很好得捕获时序上的信息。因此3D convolution就被提出来了。3D convolution 最早应

2017-03-10 10:17:52

计算机视觉-论文阅读笔记-基于高性能检测器与表观特征的多目标跟踪

这篇笔记主要是对今年ECCV2016上的论文:POI:Multiple Object Tracking with High Performance Detection and Appearance Feature 进行整理. 这篇文章的基本思路是在每帧上用检测器检测行人位置,在每帧之前利用行人检测框的表观特征(Appearance Feature)进行前后帧行人框的匹配,从而实现对行人的跟踪.所以这

2016-12-16 11:50:48

行为识别笔记:iDT算法用法与代码解析

转载请注明出处:在上一篇笔记:iDT算法 中,对iDT算法的原理做了简单的介绍。由于iDT算法提供了算法源码,自己也用它做了不少实验,因此介绍一下其代码的使用方法,并对源代码做一些解析。iDT算法的代码在作者个人主页可以下载到,也可以点击此处下载:iDT算法源码 。除了本篇博客之外,还有iDT用法及源码剖析 这篇文章介绍的也不错,供参考。基本功能iDT算法框架中还包括Fisher Vector编码和

2016-11-18 19:03:29

行为识别笔记:improved dense trajectories算法(iDT算法)

iDT算法是行为识别领域中非常经典的一种算法,在深度学习应用于该领域前也是效果最好的算法。由INRIA的IEAR实验室于2013年发表于ICCV。目前基于深度学习的行为识别算法效果已经超过了iDT算法,但与iDT的结果做ensemble总还是能获得一些提升。所以这几年好多论文的最优效果都是“Ourmethod+iDT”的形式。此前由于项目原因,对iDT算法进行了很多研究和实验,故此处对其核心思路与

2016-11-03 17:11:55

opencv学习笔记(三):几种去噪滤波器的实现

现在在上数字图像处理的课程,最近的一次作业要求不用OpenCV自带的滤波器函数来实现几种滤波器,以实现对加入椒盐噪声的图像的图像恢复。也是对markdown编辑器的一次练习。椒盐噪声椒盐噪声是一种很简单的噪声,即随机将图像中一定数量的像素点设置为0(黑)或255(白)。由于看起来好像在图像上撒了椒盐一样,故被称为椒盐噪声。

2016-10-25 22:02:08

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!