自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 资源 (1)
  • 收藏
  • 关注

原创 近期Tag | Caffe编译 & pydebuger Issue & Cuda ERROR

效率工具文献整理软件:Zetoro,方便点:文献打Tag,方便检索任务面板软件:Notion,以上是近期最提升效率的两个软件。还有很多,有空出个合集编译 Caffe 1.0Fork 官方源代码 修改了一些编译选项和代码以适应新依赖时间:2021.5.5发布:Release v1.1部署指南:README重要依赖: Support: CentOS Linux release 7.2.1511 CUDA-11.1 CuDNN-8 Support: gcc 9.1.0

2021-05-11 17:48:09 244 1

原创 mmaction2 指南 (7) 自定义运行配置

mmaction2 指南Outlinemmaction2 指南7. 自定义Runtime Settings使用pytorch的优化器自定义优化器附加配置自定义训练策略自定义工作流 Workflow自定义 Hooks1. 实现新的hook2. 注册3. 修改配置使用MMCV定义的hooks修改 checkpoint hook修改 log hook修改 evaluation hook7. 自定义Runtime Settings使用pytorch的优化器optimizer = dict(type='Ada

2021-01-27 23:35:12 910

原创 mmaction2 指南 (5) 自定义新模块

mmaction2 指南Outlinemmaction2 指南5. 自定义新模块自定义优化器自定义优化器 Constructor自定义新组件新的backbone新的head新的损失添加新的学习策略(learning rate scheduler (updater))5. 自定义新模块自定义优化器参考 CopyOfSGD例子:mmaction/core/optimizer/my_optimizer.pyfrom .registry import OPTIMIZERSfrom torch.opt

2021-01-27 23:09:41 909

原创 mmaction2 指南 (6) 导出模型到ONNX

Open Neural Network Exchange (ONNX) is an open ecosystem that empowers AI developers to choose the right tools as their project evolves.mmaction2 指南Outlinemmaction2 指南6. 导出模型到ONNX6. 导出模型到ONNX支持:I3DTSNTINTSMR(2+1)DSLOWFASTSLOWONLYBMNBSN(tem,.

2021-01-27 23:05:59 765

原创 mmaction2 指南 (4) 自定义数据处理流程

mmaction2 指南Outlinemmaction2 指南4. 自定义数据处理流程流程设计lazy opsExtend and Use Custom Pipelines 自定义一个pipeline4. 自定义数据处理流程流程设计RawframeDataset 原始数据SampleFrames 帧采样(原视频切clip,clip长度,帧间隔,clip数量,【后续流程继承 frame_inds 帧index】)FrameSelector(【后续流程继承imgs 图片列表】,原尺寸)Resize

2021-01-27 21:21:05 1197 1

原创 mmaction2 指南 (3) 添加新的数据集

mmaction2 指南Outlinemmaction2 指南3. 添加新的数据集自定义行为识别数据集新的数据重新组织到已有格式自定义数据集的例子支持混合数据训练3. 添加新的数据集自定义行为识别数据集新的数据重新组织到已有格式重新构建标注文件就行标注格式一:rawframe标注【路径,帧数,类别】some/directory-1 163 1some/directory-2 122 1some/directory-3 258 2some/directory-4 234 2some

2021-01-27 16:23:31 1318

原创 mmaction2 指南 (2) Finetune模型

mmaction2 指南Outlinemmaction2 指南2. Finetunning 模型修改任务头 Head修改数据集修改训练策略使用pre-trained模型2. Finetunning 模型Step 1: 定义数据集Step 2: 修改配置修改任务头 Head2D/3D模型,backbone配置,分类头/定位头/检测头的配置(TSN,TSM,BSN)model = dict( type='Recognizer2D', backbone=dict( t

2021-01-27 15:24:05 676

原创 mmaction2 指南 (1) 配置文件

mmaction2 指南Outlinemmaction2 指南1. 配置文件配置文件命名规则配置文件structureAction localizartion 配置Action Recognition 配置配置文件中的中间变量1. 配置文件https://github.com/open-mmlab/mmaction2/blob/master/docs/tutorials/1_config.md配置文件命名规则{model}_[model setting]_{backbone}_[misc]_{da

2021-01-27 15:23:45 1100

原创 mmaction2 sthv2 数据处理

参考 自己走一遍STEP 1下载数据,解压到videos路径:220,847 个后缀为webm的视频STEP 2cd $MMACTION2/tools/data/sthv2/bash extract_rgb_frames.sh#!/usr/bin/env bashcd ../python build_rawframes.py ../../data/sthv2/videos/ ../../data/sthv2/rawframes/ --task rgb --level 1 --ext

2021-01-26 19:35:52 629

原创 压缩文件MD5校验

python 脚本import hashlibimport osimport pathlibdef GetFileMd5(): query = {} files_obj = pathlib.Path("./") for file_obj in files_obj.glob("20bn*"): if "" == file_obj.suffix: query[file_obj] = file_obj.with_suffix(".md5

2021-01-05 10:25:58 1299

原创 Linux|kill killall 杀不掉的进程

问题:有进程占用显存,但是通过kill -9 PID杀不掉,进程Running态应该是等不到数据导致阻塞。➜ ~ alias pgpg='ps aux | grep $1'➜ ~ pg 22109chenkan+ 10350 0.0 0.0 112680 992 pts/24 S+ 21:33 0:00 grep --color=auto --exclude-dir=.bzr --exclude-dir=CVS --exclude-dir=.git --exclude-d

2021-01-04 16:05:30 2427

原创 shell脚本|批量重命名文件名为数字序列

#!/bin/zsh# rename files in dirs, xx.[mp4,avi,...] ==> [1,2...].[mp4,avi,...]dir=$(eval pwd)IFS_old=$IFSIFS=$'\n'# cmd ls default split pattern is space or tab, change it to \nfor file in $(ls $dir) do echo $file i=0 for subf

2021-01-03 11:09:51 1278

转载 姿态估计论文笔记|结合检测和跟踪进行视频中的人体姿势估计|Combining detection and tracking for human pose estimation in videos

文章目录 摘要一、介绍(1)本文方法(2)本文贡献 二、相关工作(1)图片中的人类姿态估计(2)视频中的人类姿态估计和追踪 三、方法(1)剪辑跟踪网络(2)视频跟踪网络(3)姿态假设的时空融合 四、实验(1)数据集和评估(2)实施细节(3)与最新技术的比较(4)方...

2020-12-22 14:16:30 810 2

原创 行为识别论文笔记|SlowFast|SlowFast Networks for Video Recognition

行为识别论文笔记|SlowFast|SlowFast Networks for Video RecognitionFeichtenhofer, Christoph, et al. “Slowfast networks for video recognition.” Proceedings of the IEEE international conference on computer vision. 2019. ——FAIRMotivationsThe categorical spatial se

2020-12-07 12:56:21 681

原创 行为识别论文笔记|TSM|TSM: Temporal Shift Module for Efficient Video Understanding

行为识别论文笔记|TSM|TSM: Temporal Shift Module for Efficient Video UnderstandingLin, Ji , C. Gan , and S. Han . “TSM: Temporal Shift Module for Efficient Video Understanding.” 2019 IEEE/CVF International Conference on Computer Vision (ICCV) IEEE, 2019.Motiv

2020-12-07 12:49:37 2037

原创 行为识别论文笔记|Non-local|Non-local Neural Networks

行为识别论文笔记-Non-Local-Non-local Neural NetworksWang, Xiaolong, et al. “Non-local neural networks.” Proceedings of the IEEE conference on computer vision and pattern recognition. 2018. 引用数2000+ cmu(Wangxiaolong)和FAIR(HeKaiming)MotivationConv and recurre

2020-12-07 12:41:08 504

原创 一文搞定3D卷积

在讨论卷积核的时候,是不把channel维加进去的核 = 一个可以滑动的窗口窗口内不同位置数据之间的权值共享3D卷积,卷积核会在3个方向上运动,那么卷积核的运动需要有三个自由度(一小块立方体,在一个大面包块内3个方向上滑动2D卷积,卷积核只在2个方向上运动,因此只有两个自由度(一小片纸,在一大张纸内2个方向上滑动1D卷积,卷积核只在1个方向上运动,因此只有一个自由度(一条滑窗,在一大长线上1个方向上滑动一个卷积核运算一次 得到一个输出值以上讨论了单个卷积核,接下来考虑多通道,一个卷积核对应一

2020-11-30 08:51:28 29894 12

原创 行为识别论文笔记|ARTNet|Appearance-and-Relation Networks for Video Classification

视频理解论文笔记-ARTNet-Appearance-and-Relation Networks for Video ClassificationWang, Limin, et al. “Appearance-and-relation networks for video classification.” Proceedings of the IEEE conference on computer vision and pattern recognition. 2018.Motivation3 k

2020-11-30 08:48:15 351

原创 行为识别论文笔记|I3D S3D R(2+1)D P3D CSN

视频理解论文笔记-I3D S3D R(2+1)D P3D CSNI3DCarreira, Joao, and Andrew Zisserman. “Quo vadis, action recognition? a new model and the kinetics dataset.” proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017.S3DXie, Saining, et al.

2020-11-30 08:45:50 3802

原创 python object += 操作符

普通list中元素的 += 操作l = [i for i in range(5)] # [0,1,2,3,4]tmp = l[0]tmp += l[0]对l无影响但是对于如下嵌套的list时l = [[0,0],[1,1]]tmp = l[0]tmp += l[0]l 被修改为[[0,0,0,0],[1,1]]而将 += 拆解则对原本list无影响l = [[0,0],[1,1]]tmp = l[0]tmp = tmp + l[0]解答:Why does += behav

2020-11-23 16:58:12 116

原创 谷歌 MediaPipe 框架 环境配置,无法 fetch libyuv

Windows安装指南Install MSYS2 and edit the %PATH% environment variable.If MSYS2 is installed to C:\msys64, add C:\msys64\usr\bin to your %PATH% environment variable.MSYS2 (Minimal SYStem 2)MSYS2 是MSYS的一个升级版,准确的说是集成了pacman和Mingw-w64的Cygwin升级版, 提供了bash shel

2020-11-04 15:19:06 1126 3

转载 在Windows中对程序运行时依赖cygwin1.dll文件的一点看法

cygwin1.dll 是 Cygwin 提供给 Windows的一个 POSIX 接口库,该库允许你在 Windows 上体验 UNIX/Linux 的感觉。在Windows上用过Cygwin的人都很清楚一点, 所有基于Cygwin的项目在底层都必须依赖于cygwin1.dll这个文件, 而且任何以Cygwin环境来构建的软件在运行时也必须依赖cygwin1.dll。因此, 对于想让软件实现静态编译的人来说, 摆脱对cygwin1.dll的依赖便成了一个头疼的问题。关于去除对cygwin1.dll.

2020-11-04 09:16:45 1137

原创 强迫症的多系统下的磁盘分区重整

硬盘0:SATA接口的机械硬盘硬盘1:M2接口的固态硬盘0已经装有两个系统,Ubuntu+Win10新搞来的硬盘1装了一个新的系统,快乐!打开磁盘管理一看,EFI分区居然在磁盘0上,新的磁盘1没有EFI分区!那我启动固态的时候,岂不是会使用慢吞吞的机械上的EFI引导!?固态扇区的开头居然不是EFI分区?我不允许EFI分区位置乱放!重装!格式化磁盘0,同时也格式化了 ---- 唯一仅存的EFI分区开机!挂机!EFI引导被我删光了,BIOS已经晕头转向,不知道如何开机了!选择从装系统的U盘

2020-10-19 15:40:03 272

原创 libjpeg-turbo 在vs2019下的配置

工具:libjpeg-turbo 可以快速编解码,Azure Kinect Sensor SDK中就用到了这个工具https://github.com/microsoft/Azure-Kinect-Sensor-SDK/blob/release/1.3.x/src/record/internal/matroska_read.cpplibjpeg-turbo Githubhttps://github.com/libjpeg-turbo/libjpeg-turbo可以从 github 的源代码,

2020-10-16 12:52:02 1230 1

转载 以OpenCV库为例讲解如何在VS中配置第三方动态库

正常情况下,你拿到的别人的第三方动态库(静态库调用方式这里不讲,有另外一篇文章)至少应该包含下面三种文件: 1. 头文件,这个一般放在include这样字眼的文件夹下,比如OpenCV的: 然后include里面还分成了许多文件夹,便于管理。 2. dll文件,这个一般放在bin这样字眼的文件夹下,比如: 3. dll配套的动态lib文件,这个就一般放在lib这样字样的文件夹下,比如...

2020-10-16 11:10:39 445

原创 cs213n课程笔记

文章目录1. 计算神经网络(P1)1 激活函数实际操作:2 数据预处理3 权重初始化4 批标准化2. 训练神经网络(P2)1.梯度下降实际使用中2.避免过拟合3.正则化Training:Add random noiseTesting: Marginalize over the noise4.超参数调节3. 实践CNN卷积转为矩阵运算(im2col)图像卷积看作是信号中的频谱函数相乘加速矩阵乘法O(n^3)4. 迁移学习Case StudysAlso...5. 卷积神经网络案例AlexNetZFNetVGGG

2020-10-13 17:19:14 882

原创 vs2017/2019 + opencv42 环境配置

vs2017 + opencv42 环境配置系统环境变量系统环境环境变量中新建OPENCV42_PATH为D:\opencv42\build目录,自创Path中添加 %OPENCV42_PATH%x64\vc15\bin注销使得环境变量生效vs2017 项目配置中载入opencv依赖vs2017新建空项目“opencv模板配置”,解决方案管理器中源文件中,新建main.cpp1. 配置包含路径调试–>属性,配置:Debug 选择x64平台VC++目录包含:$(OPENCV42_PA

2020-10-13 17:04:04 121

原创 计算机视觉(本科课程) 北京邮电大学 鲁鹏

计算机视觉 2020 北京邮电大学本科课程这里的计算机视觉中的数学都是比较简单的,不如图形学1. 卷积与边缘提取卷积的padding方式:clip filter (black)wrap aroundcopy edgereflect across edge锐化原图-平滑图=边缘图原图+边缘图=锐化图I * e - I * g = detailI * e + I*(e-g) = sharpened = I * (2e-g)detail前方再加一个参数alpha,调节锐化度,

2020-10-12 16:02:17 3065 1

原创 行为识别论文笔记|TSN|Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

Temporal Segment Networks: Towards Good Practices for Deep Action Recognition 论文笔记Temporal Segment Networks: Towards Good Practices for Deep Action Recognition, Limin Wang, Yuanjun Xiong, Zhe Wang, Yu Qiao, Dahua Lin, Xiaoou Tang, and Luc Van Gool, ECCV

2020-09-25 19:32:01 806

原创 NLPR 模式识别与机器学习课程笔记 | Lecture01

NLPR 模式识别与机器学习课程笔记 | Lecture01ML:机器学习,强调数据,最大化某个学习目标DM:数据挖掘,从无监督数据中发现未知的知识,强调商业应用PR:模式识别,强调描述,解释和可视化一个特定的模式之后,介绍了当前的模式识别的各方面应用,闲聊,授课老师介绍了一些自己组的成果,有图像分割,高光谱,GAN,60亿像素的一个卫星遥感数据标注(花费至少半年时间…)在2017年发了个 trans和 计算机视觉老师一样,都认为 深度学习这个工具只是会活跃一段时间,20年甚至更久把吧所以不要

2020-09-24 16:51:37 200

原创 行为识别论文笔记|SlowFusion|Large-scale Video Classification with Convolutional Neural Networks|

Large-scale Video Classification with Convolutional Neural Networks 论文笔记Andrej Karpathy et al. “Large-scale Video Classification with Convolutional Neural Networks” CVPR 2014Motivation缺少使用CNN进行视频分类的数据集和方法,所以推出了数据集 Sports-1M(1 million YouTube videos,

2020-09-24 16:42:10 906

原创 NLPR 计算机视觉课程|Lecture01

课程路线:#mermaid-svg-nfXvqr1vbVT513l2 .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-nfXvqr1vbVT513l2 .label text{fill:#333}#mermaid-svg-nfXvqr1vbVT513l2 .node rect,#mermaid-svg-nfXv

2020-09-23 17:43:27 264

原创 使用python的pyQT5, pyPDF2批量重命名论文的小工具

使用pyQT5, pyPDF2批量重命名论文的小工具用于处理计算机类的英文文献,默认pdf info中title为空的文献来自于arxiv(arxiv上的文献,属性中只有一个时间戳,因此需要从文档内容中提取论文名,作者)选择一个路径,之后批量重命名该路径下的论文格式为:论文名称[作者][会议/期刊名/arxiv编号]paper-renamer-qt5.py#!/usr/bin/python3# -*- coding: utf-8 -*-import sysfrom PyQt5.QtW

2020-09-18 10:59:46 568 1

原创 经典神经网络论文阅读|GoogLeNet(Inception V3)

InceptionV3Sergey Ioffe and Christian Szegedy “Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift” ICML2015Christian Szegedy et al.“Rethinking the Inception Architecture for Computer Vision” CVPR2016动机(Why)

2020-09-16 16:39:24 635

原创 经典神经网络论文阅读|GoogLeNet(Inception V1)

InCeptionV1Christian Szegedy ; Wei Liu ; Yangqing Jia et al. “Going Deeper with Convolutions” CVPR 2015非常好的一篇文章动机(Why)Introduction 中就说了GoogleNet只有5 million 参数,12倍小于AlexNet,还更加准确。提出不要一味追求精度,还要考虑设备上部署的效率;启发:《Network in network》: 1x1 卷积,Global Avera

2020-09-16 11:00:35 528

原创 经典神经网络论文阅读|VGG

VGGSimonyan and Zisserman “Very Deep Convolutional Networks for Large-Scale Image Recognition” ICLR2015动机(Why)探讨加深网络的可能性,加深到16-19层,继续在ImageNet上刷点方法(How)所有层都采用3x3的小卷积核和AlexNet一样,都使用Local Response Normalization 局部响应归一化卷积卷积池化卷积卷积池化不断重复,最后累加f

2020-09-16 09:42:00 242

原创 经典神经网络论文阅读|ZFNet(神经网络可视化)

ZFNetZeiler and Fergus “Visualizing and Understanding Convolutional Networks” ECCV2014动机(Why)现有CNNs效果很棒,但是第一不知道他为什么好,第二不知道该从哪个方面改进;因此这篇文章对CNNs做了可视化,并提出了一些理解方法(How)8 层,改进AlexNet,更小的步长和卷积核,认识到的特征更细节并且有更少的"dead" featuresDeconvnet (各层通过Deconvne

2020-09-15 20:28:20 717

原创 经典神经网络论文阅读|AlexNet

AlexNetKrizhevsky et al. "ImageNet classification with deep convolutional Neural Networks " NIPS 2012动机(Why)ImageNet 图像分类竞赛中现有模型准确度不足,为了刷点方法(How)8层卷积神经网络使用ReLU,比Sigmoid效率高上很多数据增强:沿PCA主方向乘以随机系数向量,扩充数据使用Local Response Normalization 局部响应归一化;作用在同层中相

2020-09-15 17:58:19 387

原创 2020-9-10 回归 CSDN 博客

回归2020-9-10 回归 CSDN 博客,决定开始产出,思考,分享过去在阿里云上折腾过不少博客框架,wordpress,hexo,hugo … 想着弄成自己的个人网站(生活随感,作品分享,踩坑记录)可后来渐渐没了更新文章的动力,写文章,push文章,同步github.io,一套下来费时费力;也弄过宝塔面板方便管理网站,渐渐对阿里云每天发来的待处理漏洞报告做到熟视无睹…今年的阿里云服务器不打算续费了,域名也不会再使用了,纪念一下这个陪伴了我4年的域名:nuptalex.xyz产出是时候做

2020-09-10 19:27:02 111

原创 UVa1586 分子量 算法竞赛入门经典第二版CH-3习题3-2

UVa1586 分子量给出一种物质的分子式(不带括号)求分子量。本题分子只包含4种原子,分别为C,H,O,N 分子量为分别为12.01,1.008,16.00,14.01(单位:g/mol)例如:C6H5OH 的分子量为 94.108g/mol

2017-01-25 21:18:31 1216

pdf论文批量重命名

python qt5 编写的批量pdf论文批量重命名程序 只打包了 exe 格式 (ECCV/CVPR/...)希望能帮到大家,源代码在博客文章:https://blog.csdn.net/njuptalex/article/details/108660652 论文重命名格式: 论文名[作者][期刊/会议/arxiv编号]

2020-09-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除