Alex丶Chen-CSDN博客

原创近期Tag | Caffe编译 & pydebuger Issue & Cuda ERROR

效率工具文献整理软件：Zetoro，方便点：文献打Tag，方便检索任务面板软件：Notion，以上是近期最提升效率的两个软件。还有很多，有空出个合集编译 Caffe 1.0Fork 官方源代码修改了一些编译选项和代码以适应新依赖时间：2021.5.5发布：Release v1.1部署指南：README重要依赖： Support: CentOS Linux release 7.2.1511 CUDA-11.1 CuDNN-8 Support: gcc 9.1.0

2021-05-11 17:48:09 244 1

原创 mmaction2 指南 (7) 自定义运行配置

mmaction2 指南Outlinemmaction2 指南7. 自定义Runtime Settings使用pytorch的优化器自定义优化器附加配置自定义训练策略自定义工作流 Workflow自定义 Hooks1. 实现新的hook2. 注册3. 修改配置使用MMCV定义的hooks修改 checkpoint hook修改 log hook修改 evaluation hook7. 自定义Runtime Settings使用pytorch的优化器optimizer = dict(type='Ada

2021-01-27 23:35:12 910

原创 mmaction2 指南 (5) 自定义新模块

mmaction2 指南Outlinemmaction2 指南5. 自定义新模块自定义优化器自定义优化器 Constructor自定义新组件新的backbone新的head新的损失添加新的学习策略（learning rate scheduler (updater)）5. 自定义新模块自定义优化器参考 CopyOfSGD例子：mmaction/core/optimizer/my_optimizer.pyfrom .registry import OPTIMIZERSfrom torch.opt

2021-01-27 23:09:41 909

原创 mmaction2 指南 (6) 导出模型到ONNX

Open Neural Network Exchange (ONNX) is an open ecosystem that empowers AI developers to choose the right tools as their project evolves.mmaction2 指南Outlinemmaction2 指南6. 导出模型到ONNX6. 导出模型到ONNX支持：I3DTSNTINTSMR(2+1)DSLOWFASTSLOWONLYBMNBSN(tem,.

2021-01-27 23:05:59 765

原创 mmaction2 指南 (4) 自定义数据处理流程

mmaction2 指南Outlinemmaction2 指南4. 自定义数据处理流程流程设计lazy opsExtend and Use Custom Pipelines 自定义一个pipeline4. 自定义数据处理流程流程设计RawframeDataset 原始数据SampleFrames 帧采样（原视频切clip，clip长度，帧间隔，clip数量，【后续流程继承 frame_inds 帧index】）FrameSelector（【后续流程继承imgs 图片列表】，原尺寸）Resize

2021-01-27 21:21:05 1197 1

原创 mmaction2 指南 (3) 添加新的数据集

mmaction2 指南Outlinemmaction2 指南3. 添加新的数据集自定义行为识别数据集新的数据重新组织到已有格式自定义数据集的例子支持混合数据训练3. 添加新的数据集自定义行为识别数据集新的数据重新组织到已有格式重新构建标注文件就行标注格式一：rawframe标注【路径，帧数，类别】some/directory-1 163 1some/directory-2 122 1some/directory-3 258 2some/directory-4 234 2some

2021-01-27 16:23:31 1318

原创 mmaction2 指南 (2) Finetune模型

mmaction2 指南Outlinemmaction2 指南2. Finetunning 模型修改任务头 Head修改数据集修改训练策略使用pre-trained模型2. Finetunning 模型Step 1: 定义数据集Step 2: 修改配置修改任务头 Head2D/3D模型，backbone配置，分类头/定位头/检测头的配置（TSN，TSM，BSN）model = dict( type='Recognizer2D', backbone=dict( t

2021-01-27 15:24:05 676

原创 mmaction2 指南 (1) 配置文件

mmaction2 指南Outlinemmaction2 指南1. 配置文件配置文件命名规则配置文件structureAction localizartion 配置Action Recognition 配置配置文件中的中间变量1. 配置文件https://github.com/open-mmlab/mmaction2/blob/master/docs/tutorials/1_config.md配置文件命名规则{model}_[model setting]_{backbone}_[misc]_{da

2021-01-27 15:23:45 1100

原创 mmaction2 sthv2 数据处理

参考自己走一遍STEP 1下载数据，解压到videos路径：220,847 个后缀为webm的视频STEP 2cd $MMACTION2/tools/data/sthv2/bash extract_rgb_frames.sh#!/usr/bin/env bashcd ../python build_rawframes.py ../../data/sthv2/videos/ ../../data/sthv2/rawframes/ --task rgb --level 1 --ext

2021-01-26 19:35:52 629

原创压缩文件MD5校验

python 脚本import hashlibimport osimport pathlibdef GetFileMd5(): query = {} files_obj = pathlib.Path("./") for file_obj in files_obj.glob("20bn*"): if "" == file_obj.suffix: query[file_obj] = file_obj.with_suffix(".md5

2021-01-05 10:25:58 1299

原创 Linux|kill killall 杀不掉的进程

问题：有进程占用显存，但是通过kill -9 PID杀不掉，进程Running态应该是等不到数据导致阻塞。➜ ~ alias pgpg='ps aux | grep $1'➜ ~ pg 22109chenkan+ 10350 0.0 0.0 112680 992 pts/24 S+ 21:33 0:00 grep --color=auto --exclude-dir=.bzr --exclude-dir=CVS --exclude-dir=.git --exclude-d

2021-01-04 16:05:30 2427

原创 shell脚本|批量重命名文件名为数字序列

#!/bin/zsh# rename files in dirs, xx.[mp4,avi,...] ==> [1,2...].[mp4,avi,...]dir=$(eval pwd)IFS_old=$IFSIFS=$'\n'# cmd ls default split pattern is space or tab, change it to \nfor file in $(ls $dir) do echo $file i=0 for subf

2021-01-03 11:09:51 1278

转载姿态估计论文笔记|结合检测和跟踪进行视频中的人体姿势估计|Combining detection and tracking for human pose estimation in videos

文章目录摘要一、介绍（1）本文方法（2）本文贡献二、相关工作（1）图片中的人类姿态估计（2）视频中的人类姿态估计和追踪三、方法（1）剪辑跟踪网络（2）视频跟踪网络（3）姿态假设的时空融合四、实验（1）数据集和评估（2）实施细节（3）与最新技术的比较（4）方...

2020-12-22 14:16:30 810 2

原创行为识别论文笔记|SlowFast|SlowFast Networks for Video Recognition

行为识别论文笔记|SlowFast|SlowFast Networks for Video RecognitionFeichtenhofer, Christoph, et al. “Slowfast networks for video recognition.” Proceedings of the IEEE international conference on computer vision. 2019. ——FAIRMotivationsThe categorical spatial se

2020-12-07 12:56:21 681

原创行为识别论文笔记|TSM|TSM: Temporal Shift Module for Efficient Video Understanding

行为识别论文笔记|TSM|TSM: Temporal Shift Module for Efficient Video UnderstandingLin, Ji , C. Gan , and S. Han . “TSM: Temporal Shift Module for Efficient Video Understanding.” 2019 IEEE/CVF International Conference on Computer Vision (ICCV) IEEE, 2019.Motiv

2020-12-07 12:49:37 2037

原创行为识别论文笔记|Non-local|Non-local Neural Networks

行为识别论文笔记-Non-Local-Non-local Neural NetworksWang, Xiaolong, et al. “Non-local neural networks.” Proceedings of the IEEE conference on computer vision and pattern recognition. 2018. 引用数2000+ cmu(Wangxiaolong)和FAIR(HeKaiming)MotivationConv and recurre

2020-12-07 12:41:08 504

原创一文搞定3D卷积

在讨论卷积核的时候，是不把channel维加进去的核 = 一个可以滑动的窗口窗口内不同位置数据之间的权值共享3D卷积，卷积核会在3个方向上运动，那么卷积核的运动需要有三个自由度（一小块立方体，在一个大面包块内3个方向上滑动2D卷积，卷积核只在2个方向上运动，因此只有两个自由度（一小片纸，在一大张纸内2个方向上滑动1D卷积，卷积核只在1个方向上运动，因此只有一个自由度（一条滑窗，在一大长线上1个方向上滑动一个卷积核运算一次得到一个输出值以上讨论了单个卷积核，接下来考虑多通道，一个卷积核对应一

2020-11-30 08:51:28 29894 12

原创行为识别论文笔记|ARTNet|Appearance-and-Relation Networks for Video Classification

视频理解论文笔记-ARTNet-Appearance-and-Relation Networks for Video ClassificationWang, Limin, et al. “Appearance-and-relation networks for video classification.” Proceedings of the IEEE conference on computer vision and pattern recognition. 2018.Motivation3 k

2020-11-30 08:48:15 351

原创行为识别论文笔记|I3D S3D R(2+1)D P3D CSN

视频理解论文笔记-I3D S3D R(2+1)D P3D CSNI3DCarreira, Joao, and Andrew Zisserman. “Quo vadis, action recognition? a new model and the kinetics dataset.” proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017.S3DXie, Saining, et al.

2020-11-30 08:45:50 3802

原创 python object += 操作符

普通list中元素的 += 操作l = [i for i in range(5)] # [0,1,2,3,4]tmp = l[0]tmp += l[0]对l无影响但是对于如下嵌套的list时l = [[0,0],[1,1]]tmp = l[0]tmp += l[0]l 被修改为[[0,0,0,0],[1,1]]而将 += 拆解则对原本list无影响l = [[0,0],[1,1]]tmp = l[0]tmp = tmp + l[0]解答：Why does += behav

2020-11-23 16:58:12 116

原创谷歌 MediaPipe 框架环境配置，无法 fetch libyuv

Windows安装指南Install MSYS2 and edit the %PATH% environment variable.If MSYS2 is installed to C:\msys64, add C:\msys64\usr\bin to your %PATH% environment variable.MSYS2 （Minimal SYStem 2）MSYS2 是MSYS的一个升级版,准确的说是集成了pacman和Mingw-w64的Cygwin升级版, 提供了bash shel

2020-11-04 15:19:06 1126 3

转载在Windows中对程序运行时依赖cygwin1.dll文件的一点看法

cygwin1.dll 是 Cygwin 提供给 Windows的一个 POSIX 接口库，该库允许你在 Windows 上体验 UNIX/Linux 的感觉。在Windows上用过Cygwin的人都很清楚一点, 所有基于Cygwin的项目在底层都必须依赖于cygwin1.dll这个文件, 而且任何以Cygwin环境来构建的软件在运行时也必须依赖cygwin1.dll。因此, 对于想让软件实现静态编译的人来说, 摆脱对cygwin1.dll的依赖便成了一个头疼的问题。关于去除对cygwin1.dll.

2020-11-04 09:16:45 1137

原创强迫症的多系统下的磁盘分区重整

硬盘0：SATA接口的机械硬盘硬盘1：M2接口的固态硬盘0已经装有两个系统，Ubuntu+Win10新搞来的硬盘1装了一个新的系统，快乐！打开磁盘管理一看，EFI分区居然在磁盘0上，新的磁盘1没有EFI分区！那我启动固态的时候，岂不是会使用慢吞吞的机械上的EFI引导！？固态扇区的开头居然不是EFI分区？我不允许EFI分区位置乱放！重装！格式化磁盘0，同时也格式化了 ---- 唯一仅存的EFI分区开机！挂机！EFI引导被我删光了，BIOS已经晕头转向，不知道如何开机了！选择从装系统的U盘

2020-10-19 15:40:03 272

原创 libjpeg-turbo 在vs2019下的配置

工具：libjpeg-turbo 可以快速编解码，Azure Kinect Sensor SDK中就用到了这个工具https://github.com/microsoft/Azure-Kinect-Sensor-SDK/blob/release/1.3.x/src/record/internal/matroska_read.cpplibjpeg-turbo Githubhttps://github.com/libjpeg-turbo/libjpeg-turbo可以从 github 的源代码，

2020-10-16 12:52:02 1230 1

转载以OpenCV库为例讲解如何在VS中配置第三方动态库

正常情况下，你拿到的别人的第三方动态库（静态库调用方式这里不讲，有另外一篇文章）至少应该包含下面三种文件： 1. 头文件，这个一般放在include这样字眼的文件夹下，比如OpenCV的：然后include里面还分成了许多文件夹，便于管理。 2. dll文件，这个一般放在bin这样字眼的文件夹下，比如： 3. dll配套的动态lib文件，这个就一般放在lib这样字样的文件夹下，比如...

2020-10-16 11:10:39 445

原创 cs213n课程笔记

文章目录1. 计算神经网络（P1）1 激活函数实际操作：2 数据预处理3 权重初始化4 批标准化2. 训练神经网络（P2）1.梯度下降实际使用中2.避免过拟合3.正则化Training：Add random noiseTesting: Marginalize over the noise4.超参数调节3. 实践CNN卷积转为矩阵运算(im2col)图像卷积看作是信号中的频谱函数相乘加速矩阵乘法O(n^3)4. 迁移学习Case StudysAlso...5. 卷积神经网络案例AlexNetZFNetVGGG

2020-10-13 17:19:14 882

原创 vs2017/2019 + opencv42 环境配置

vs2017 + opencv42 环境配置系统环境变量系统环境环境变量中新建OPENCV42_PATH为D:\opencv42\build目录，自创Path中添加 %OPENCV42_PATH%x64\vc15\bin注销使得环境变量生效vs2017 项目配置中载入opencv依赖vs2017新建空项目“opencv模板配置”，解决方案管理器中源文件中，新建main.cpp1. 配置包含路径调试–>属性，配置:Debug 选择x64平台VC++目录包含：$(OPENCV42_PA

2020-10-13 17:04:04 121

原创计算机视觉（本科课程）北京邮电大学鲁鹏

计算机视觉 2020 北京邮电大学本科课程这里的计算机视觉中的数学都是比较简单的，不如图形学1. 卷积与边缘提取卷积的padding方式：clip filter （black）wrap aroundcopy edgereflect across edge锐化原图-平滑图=边缘图原图+边缘图=锐化图I * e - I * g = detailI * e + I*(e-g) = sharpened = I * (2e-g)detail前方再加一个参数alpha，调节锐化度，

2020-10-12 16:02:17 3065 1

原创行为识别论文笔记|TSN|Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

Temporal Segment Networks: Towards Good Practices for Deep Action Recognition 论文笔记Temporal Segment Networks: Towards Good Practices for Deep Action Recognition, Limin Wang, Yuanjun Xiong, Zhe Wang, Yu Qiao, Dahua Lin, Xiaoou Tang, and Luc Van Gool, ECCV

2020-09-25 19:32:01 806

原创 NLPR 模式识别与机器学习课程笔记 | Lecture01

NLPR 模式识别与机器学习课程笔记 | Lecture01ML：机器学习，强调数据，最大化某个学习目标DM：数据挖掘，从无监督数据中发现未知的知识，强调商业应用PR：模式识别，强调描述，解释和可视化一个特定的模式之后，介绍了当前的模式识别的各方面应用，闲聊，授课老师介绍了一些自己组的成果，有图像分割，高光谱，GAN，60亿像素的一个卫星遥感数据标注（花费至少半年时间…）在2017年发了个 trans和计算机视觉老师一样，都认为深度学习这个工具只是会活跃一段时间，20年甚至更久把吧所以不要

2020-09-24 16:51:37 200

原创行为识别论文笔记|SlowFusion|Large-scale Video Classification with Convolutional Neural Networks|

Large-scale Video Classification with Convolutional Neural Networks 论文笔记Andrej Karpathy et al. “Large-scale Video Classification with Convolutional Neural Networks” CVPR 2014Motivation缺少使用CNN进行视频分类的数据集和方法，所以推出了数据集 Sports-1M（1 million YouTube videos,

2020-09-24 16:42:10 906

原创 NLPR 计算机视觉课程|Lecture01

课程路线：#mermaid-svg-nfXvqr1vbVT513l2 .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-nfXvqr1vbVT513l2 .label text{fill:#333}#mermaid-svg-nfXvqr1vbVT513l2 .node rect,#mermaid-svg-nfXv

2020-09-23 17:43:27 264

pdf论文批量重命名

空空如也