4 清欢守护者

尚未进行身份认证

我要认证

人间有味是清欢

等级
TA的排名 6w+

行为识别 - Deep Analysis of CNN-based Spatio-temporal Representations for Action Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&可借鉴之处0. 前言相关资料:arxivgithub论文解读论文基本信息领域:行为识别作者单位:MIT & IBM发表时间:2020.10一句话总结:实验报告,总结现有行为识别模型的特点1. 要解决什么问题当前行为识别模型研究现状:2D模型在Something-Something上效果更好,3D模型在Kinetics上效果更好。现在行为识别模型的对比上

2020-10-27 03:11:32

论文管理软件 Zotero 备忘

文章目录0. 前言1. 安装与配置1.1. 安装1.2. 设置数据存放路径1.3. 设置坚果云同步1.4. 设置笔记的Markdown渲染1.5. Sci-Hub 下载论文1.6. 监控文件夹与文件重命名2. 基本使用2.1. 添加item2.2. item管理2.3. 笔记系统2.4. 搜索0. 前言为什么要用论文管理软件?随着论文越看越多,自己使用文件夹管理感觉越来越力不从心。自己最近想要总结一下自己看过的论文,结果发现非常吃力。等待看的论文越来越多,自己使用文档管理感觉非常不方便。

2020-10-26 13:46:40

静态网站生成工具备忘

文章目录0. 前言1. 需求分析1.1. 博客/文档基本需求1.2. 网站构建需求2. 常见建站工具概述2.1. 总体评价2.2. Hexo2.3. Vuepress2.4. Docsify2.5. Gitbook0. 前言全文都非常主观。静态网站生成工具是实现自己博客的一种方式。特点:功能齐全、选择多、成本低。一开始配置复杂较复杂,但一旦配置完成后,可专注于内容创作。静态网站生成工具与第三方博客网站(如CSDN/简书/知乎)的比较首先明确一点,第三方博客网站并不是特别好的文

2020-10-16 02:04:11

Markdown 编辑器概述

文章目录1. 概述2. Markdown 编辑器 - 作业部落2.1. 概述2.2. 优势与劣势3. Markdown 编辑器 - Typora3.1. 概述3.2. 优势与劣势3.3. 添加新主题3.4. 图片相关设置3.5. 自定义快捷键3.6. 更多内容4. Markdown 编辑器 - VSCode4.1. 概述4.2. 优势与劣势4.3. VSCode 自带功能4.4. Markdown All In One 插件4.5. Markdown Preview Enhanced 插件4.6. mark

2020-10-10 12:35:18

Markdown 入门

文章目录0. 前言1. Markdown 基本功能2. Makrdown 编辑器需求分析2.1. 支持代码块/数学公式/快捷键2.2. 导入/分享图片方便2.3. 美观2.4. Markdown 文件转 PDF/HTML3. Markdown 编辑器与文档管理3.1. 纯编辑器3.2. 第三方博客网站3.3. 笔记软件4. 个人建议0. 前言定义:Markdown 轻量级标记语言,即输入纯文本,可通过编辑器等转换成html。为什么要用Markdown首先,强烈建议保持记笔记的习惯,而Markdo

2020-10-10 12:33:45

论文浏览(50) RubiksNet: Learnable 3D-Shift for Efficient Video Action Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxiv,下载github,官网论文解读论文基本信息领域:行为识别作者单位:斯坦福大学 李飞飞组发表时间:ECCV 20201. 要解决什么问题行为识别模型要求大量算力,主要就是对spatial和temporal维度进行卷积操作。最近的关于轻量化模型的研究,一个方向就是将对 spatial 与 temporal 维度上的操作拆

2020-10-05 23:27:57

论文浏览(49) Uncertainty-Aware Weakly Supervised Action Detection from Untrimmed Videos

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub论文解读论文基本信息领域:时空行为检测作者单位:Google发表时间:ECCV 20201. 要解决什么问题视频分类的进展十分迅速,但时空行为检测的进展却比较一般作者认为其中一个主要原因是:时空行为检测的数据标注困难较高,需要标注视频中的每一帧图像。2. 用了什么方法目标:只是用 clip-l

2020-10-05 15:47:17

论文浏览(48) Online Learnable Keyframe Extraction&Application with Semantic Word Vector in Action Recogn

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言论文名称:Online Learnable Keyframe Extraction in Videos and its Application with Semantic Word Vector in Action Recognition相关资料:arxivgithub论文解读论文基本信息领域:视频理解作者单位:加拿大 University of Albe

2020-10-04 14:39:54

论文浏览(47) CFAD: Coarse-to-Fine Action Detector for Spatiotemporal Action Localization

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub论文解读论文基本信息领域:时空行为检测作者单位:上海交大&上海大学发表时间:ECCV 20201. 要解决什么问题之前的 action detection 方法都是先在 frame-wise 或 clip wise 进行检测,得到 action proposals,在连接结果。因为要对每一帧都要进行

2020-09-29 00:52:33

论文浏览(46) SpeedNet: Learning the Speediness in Videos

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub,官网论文解读论文基本信息领域:视频理解作者单位:Google发表时间:CVPR 20201. 要解决什么问题预测视频中移动物体的速度。在现实世界中,一个人很容易就能分辨出视频是在快进还是普通速度还是慢放,因为我们都有一些先验知识,即稳重提到的 typical dynamics and natural ra

2020-09-24 18:15:21

PyTorch 1.4 源码编译记录

0. 前言目标:在 ubuntu 16.04 上编译PyTorch1.4源码。参考资料:PyTorch 1.4 源码,release链接1. 基本流程参考资料:官方提供了教程只提供了 conda 编译的流程,如果没有conda要从源码编译应该特别麻烦……流程:第一步:安装依赖。公共依赖:conda install numpy ninja pyyaml mkl mkl-include setuptools cmake cffi安装 mega:conda install -c pyt

2020-09-23 00:14:44

论文浏览(45) MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:cvpr页面github论文解读(官方解读)论文基本信息领域:行为识别(虽然标题里有tube,但其实做的是行为识别……)作者单位:中国科技大学&微软亚洲研究院发表时间:CVPR 20181. 要解决什么问题3D卷积计算量太大,影响行为识别的效果。当时的3D模型还是C3D,没花头。2. 用了什么方法提出了 Mixe

2020-09-22 15:14:49

使用 pre-commit 实现代码检查

文章目录0. 前言1. pre-commit 原理2. pre-commit 的使用2.1. 基本流程2.2. 配置文件编写2.3. 问题与疑问3. mmaction2 的配置文件举例0. 前言需求:希望在提交代码时,对代码的规范进行排查,不符合要求的不让提交。参考资料:官方文档1. pre-commit 原理在 git commit 前进行代码检查的解决方案思路git本身提供了 hook 功能(可参考git相关内容),其中一类就是在commit前调用的,即 .git/hooks/p

2020-09-21 00:05:28

Python进阶(10) pytest

文章目录0. 前言1. 命令与配置1.1. pytest 的基本使用1.2. 配置文件2. 代码编写2.1. 推荐的单元测试源码格式2.2. 文件/类/方法命名规则2.3. assert 相关2.4. pytest fixtures0. 前言简介:pytest是Python的测试框架,是第三方提供的,需要额外安装包。安装方法:pip install -U pytest,之后就可以通过 pytest --version 来检查是否安装。官方资料:官方文档1. 命令与配置1.1. pytes

2020-09-19 14:40:58

论文浏览(44) Towards Efficient Coarse-to-Fine Networks for Action and Gesture Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:pdf下载github论文解读论文基本信息领域:行为识别作者单位:加拿大华为诺亚实验室发表时间:ECCV 20201. 要解决什么问题现在的行为识别模型很多,也尽可能做小。但是,当前最优代表性的小模型TSM也需要较多算力。用了一个我没看懂的方法算了一下,在手机上运行TSM的小模型大概能够连续运行15分钟。2. 用了什么

2020-09-17 00:41:26

论文浏览(43) oops! Predicting Unintentional Action in Video

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub论文解读官方网站论文基本信息领域:行为识别数据集作者单位:哥伦比亚大学发表时间:CVPR20201. 要解决什么问题之前的工作主要是预测原子动作。2. 用了什么方法提出了 Oops 数据集,该数据及可以实现三类功能判断动作是否是故意的(intentionality)判断出现 inteniona

2020-09-15 13:27:10

论文浏览(42) Action Genome: Actions as Composition of Spatio-temporal Scene Graphs

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub官网论文解读论文基本信息领域:时空行为检测作者单位:斯坦福大学发表时间:CVPR 20201. 要解决什么问题在计算机视觉中,我们将行为(actions or activities)作为一个完整的整体。但其实在认知科学(Cognitive Science)和神经学的研究中发现,人的行为被编码为一个 hier

2020-09-14 15:04:23

论文浏览(41) STEP: Spatio-Temporal Progressive Learning for Video Action Detection

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub论文解读论文基本信息领域:时空行为检测作者单位:马里兰大学 & NVidia发表时间:CVPR 20191. 要解决什么问题Spatio-temporal action detection 任务的难度较大一个action tube一般来说包括了空间上的变换,这会导致proposal的生成与微调更有难

2020-09-10 17:19:21

论文浏览(40) Video Action Transformer Network

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub(非官方代码,只有结构没有结果)论文解读项目网站论文基本信息领域:时空行为检测作者单位:卡耐基梅隆大学 & DeepMind发表时间:CVPR 20191. 要解决什么问题就是想把 Transformer 的思路引入时空行为检测中。判断人的行为之所以困难,有一步分原因在于行为类别需要依赖于目标人物周

2020-09-10 10:55:44

论文浏览(39) Action Tubelet Detector for Spatio-Temporal Action Localization

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub(CAFFE)论文解读论文基本信息领域:时空行为检测作者单位:格勒诺布尔大学 & 爱丁堡大学发表时间:CVPR 20171. 要解决什么问题之前的时空检测模型都是先检测frame的结果,然后再link。单独处理每一帧图片并不是最优方法。没有完全利用到视频的连续性(temporal continui

2020-09-09 14:37:37

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。