zhang_can-CSDN博客

原创 [CVPR2022] 面向时序行为定位任务的无监督预训练

虽然近年来无监督视频表征学习取得了显著的成就，但大多数现有的方法都是针对视频行为分类任务（TAC）进行设计和优化的。当应用于时序定位任务（TAL）时，由于视频级别分类和片段级别定位之间的固有差异，这些预先训练的模型的迁移性能会受限。为了缓解这一问题，我们首次尝试对时序行为定位任务进行无监督预训练，提出一种新的自监督代理任务，称为“伪动作定位（Pseudo Action Localization，PAL）”。

2022-03-30 22:33:45 715

原创 ECO在线视频理解PyTorch代码实现(Efficient Convolutional Network for Online Video Understanding)

近期，arXiv上出现了一篇用于在线视频理解的高效卷积网络ECO。论文题目：《ECO: Efficient Convolutional Network for Online Video Understanding》。论文作者来自弗莱堡大学。我自己实现了一个ECO的PyTorch版本，项目地址： https://github.com/zhang-can/ECO-pytorch该repo进度...

2018-08-09 15:23:11 5843 27

原创 PyTorch实用模块总结

1. 使用预训练的模型初始化网络的一部分参数# 1. 本地加载预训练模型pretrained_dict = torch.load(weights_path)# 或：url加载方式pretrained_dict = torch.utils.model_zoo.load_url(weights_url)# 2. 获取网络的state_dictmodel_dict = model.sta...

2018-05-30 11:51:56 2356

原创光流与行为识别讨论

一直以来，行为识别（Action Recognition）中的双流（two-stream）方法将RGB图像和光流（Optical Flow）作为网络输入，并取得了不错的效果，通常会将光流作为“黑盒”。我们可能会想：为什么光流对于行为识别问题有帮助？光流中的什么信息对行为识别问题是有利的？我们怎么能让光流biand作者在这篇文章[1]中深入讨论了光流与行为识别的结合，并通过实验观察到如下结论...

2018-05-09 21:28:40 2374

原创 nohup执行python程序log文件写入不及时

问题今天用nohup后台执行python程序，并将标准输出和错误输出重定向到一个log文件，但发现log文件隔好久才会更新，很煎熬。。。然而正常屏幕输出时候非常及时。不确定程序是不是在正常运行。运行脚本举例：nohup python test.py > test.log 2>&1 &原因python的输出进行了缓冲，导致test.log并不能...

2018-04-20 11:32:58 5181

原创 RuntimeError: all tensors must be on devices[0]问题解决方案

RuntimeError: all tensors must be on devices[0]该问题由于PyTorch程序设置的gpu_id编号未从0开始导致的。解决方案，在运行python命令前设置一下CUDA_VISIBLE_DEVICES：CUDA_VISIBLE_DEVICES=1,2,3 python example.py --gpu_id 0 1 2注意：在程序中设置g...

2018-04-06 18:43:19 13764 2

原创 [行为识别论文详解]SSN(Temporal Action Detection with Structured Segment Networks)

SSN发表在ICCV 2017上，题目为：《Temporal Action Detection with Structured Segment Networks》，作者是Yue Zhao, Yuanjun Xiong, Limin Wang, Zhirong Wu, Xiaoou Tang, Dahua Lin。　论文下载：https://arxiv.org/pdf/170...

2018-04-01 22:01:35 8561

原创 ActivityNet 2018介绍

简介ActivityNet是一个大规模行为识别竞赛，自CVPR 2016开始，今年是该竞赛的第三届。它侧重于从用户产生的视频中识别出日常生活，高层次，面向目标的活动，视频取自互联网视频门户Youtube。ActivityNet 2018将进行7项不同的任务，致力于推动对视频的语义视觉理解的限制以及将视觉内容用标题概括出来。7项任务中的3项基于ActivityNet数据集，这3个任务侧重于以...

2018-03-28 11:09:42 17052

原创 gpt格式的移动硬盘在Linux系统下挂载方法

首先查看系统磁盘信息：fdisk -l找到移动硬盘对应盘符，如：sdb再执行：parted /dev/sdb print显示如下：可以知道sdb2(135M to 6001G)为基本数据分区，格式为NTFS下一步，挂载到指定目录即可：sudo mount –t ntfs /dev/sdb2 /home/6T参考自：https://www.cnbl...

2018-03-27 15:34:08 13679 1

原创 TSN（Temporal Segment Networks）代码实验

前言：Temporal Segment Networks (TSN)是在 ECCV 2016 上提出的，作者是Limin Wang, Yuanjun Xiong, Zhe Wang, Yu Qiao, Dahua Lin, Xiaoou Tang, and Luc Van Gool，是一个用于视频中人的行为识别的框架。论文中数据集表现：HMDB51(69.4%)、UCF101（94.2%），在 A...

2018-03-26 20:58:59 12508 52

原创 [行为识别论文详解]TSN(Temporal Segment Networks)

摘要本文旨在设计有效的卷积网络体系结构用于视频中的动作识别，并在有限的训练样本下进行模型学习。TSN基于two-stream方法构建。论文主要贡献：提出了TSN（Temporal Segment Networks），基于长范围时间结构（long-range temporal structure）建模，结合了稀疏时间采样策略（sparse temporal sampling strat...

2018-03-19 22:29:29 52736 24

原创 Linux和Windows下php ssh2扩展安装方法（确保可用）

目录 1 Linux系统下安装php ssh2扩展（Ubuntu为例）1.1 安装libssh1.2 安装php ssh2扩展1.3 配置php.ini2 Windows系统下安装php ssh2扩展1 Linux系统下安装php ssh2扩展（Ubuntu为例）1.1 安装libssh下载libssh2-1.2.8wget https...

2018-03-09 21:29:22 2635 3

原创 ubuntu两条命令安装nodejs8.x或nodejs9.x

安装nodejs 8.x版本：curl -sL https://deb.nodesource.com/setup_8.x | sudo -E bash -sudo apt-get install -y nodejs如果安装nodejs 9.x版本：curl -sL https://deb.nodesource.com/setup_9.x | sudo -E bash -sudo a...

2018-03-09 21:25:58 4970

原创 php 执行 shell 脚本环境变量设置

未设置环境变量问题当使用php的脚本执行命令（如：shell_exec()）时，若脚本需要系统环境变量PATH支持（如：python使用import等），则会出现找不到的错误。并且查看系统PATH，如下：echo(shell_exec('echo $PATH'));/usr/sbin:/usr/bin:/sbin:/bin可以看出，系统和用户PATH均未被设置，这是由于Apache...

2018-03-09 21:22:24 3317

原创 [多尺度物体目标检测]技术概述/综述

目录 1 绪论1.1 引言1.2 研究背景1.3 研究意义1.4 目前存在的问题2 传统目标检测方法2.1 HOG+SVM2.1.1 简介2.1.2 检测流程2.2 DPM2.2.1 简介2.2.2 检测流程3 基于REGION PROPOSAL的方法3.1 R-CNN3.1.1 算法思想3.1.2 检测流程3.2 SPP-NE...

2018-03-08 21:59:41 14235 1

原创 EasyPR C#调用dll版本实现可视化界面

本项目通过C#调用dll来实现开源中文车牌识别系统。系统具有如下特点：对蓝牌、黄牌、新能源车牌识别均支持对光照强度的鲁棒性强支持单图检测和批量检测可以分步查看车牌定位和字符分割过程自动样本标记工具项目源码公开，可自行修改项目地址：https://github.com/zhang-can/EasyPR-DLL-CSharp环境要求Microsoft Visual ...

2018-03-08 20:57:48 2536 3

原创 [SVM系列之三]间隔与支持向量

问题引入（1）首先回答一个问题，下面哪一条线最优？显然，最右侧的分割最优。（2）为什么最优呢？由上图可以看出，它的容错性更好，它使得所有样本与分割超平面的距离尽可能远，或者可以说最差的样本（离分割超平面最近的样本）与分割超平面的距离要尽可能远。因此，SVM的目的就是从无数多个分割超平面中，找到这样最好的分割超平面。通常情况下，一个点距离超平面的远近可以表...

2018-03-07 22:29:14 4618 1

原创 [SVM系列之二]线性分类

在上一节中，我们对支持向量机（SVM）有了一个大概的印象，当然，这还远远不够。在深入了解之前，在本节中我们将涉及分类问题。分类的目的是学会一个分类函数或分类模型（或者叫做分类器），该模型能将数据库中的数据项映射到给定类别中的某一个，从而可以用于预测未知类别。分类在机器学习、数据挖掘等领域中得到广泛的应用，可以用来解决各种实际应用问题，因此它的重要性不言而喻。支持向量机（SVM）算法也是分类方法...

2018-03-05 13:29:38 2620 1

原创 [SVM系列之一]白话支持向量机（SVM）

初识支持向量机（SVM）我们来玩一个游戏：首先在桌子上放两种颜色的球，它们似乎存在某种关系，那你能不能用一根木棒将两种颜色分开呢？要求：尽可能在桌面上放置更多的小球后仍然适用。你大概会这么放吧：为了测试你的答案是不是符合要求，我在桌上又放了更加多的蓝红小球，可以发现，一个红球被分错了位置：支持向量机（SVM）可以白话为：试图找到一个木棍放置的...

2018-03-01 11:16:31 2211 1

Can的博客