CV界的文盲-CSDN博客

原创如何在Arxiv上预发表自己的手稿

4.3 将overleaf的文件打包成zip然后上传到arxiv上，然后检查你的文件列表。删除bib文件以及为了生成bbl文件而创建的那个tex文件。然后并将刚才编译的bbl文件上传。4. 主要的问题是参考文献的导入，如果你是用的.bib文件的话，首先你要在overleaf或者你的latex编辑器中制作一个.bbl的文件。尽量避免警告，否则会在上传到arxiv时出现意外的错误。4.2编译刚才新建的tex文件，然后如下所示，导出一个bbl文件。4.4 删除其他的pdf文件，然后选择处理你的文件。

2024-01-28 16:52:10 284

原创记录一些奇怪的报错

记录一些奇怪的报错

2023-09-12 21:55:07 140

原创损失函数是如何设计出来的

Loss函数如何理解

2022-12-08 13:49:57 961 1

原创 Python 学习笔记

学习python零基础笔记。

2022-12-06 22:42:45 889 2

原创安装mmcv报错note: This error originates from a subprocess, and is likely not a problem with pip

安装mmcv报错note: This error originates from a subprocess, and is likely not a problem with pip

2022-11-23 19:15:29 3567

原创 COCO数据集80个类的实例数量

COCO数据集每个类别的实例数量

2022-11-20 15:04:40 733 1

原创 PASCAL VOC数据集格式文件夹下文件配置

pascal voc文件夹下文件配置

2022-08-31 10:11:15 472

原创一些优质的学习资料

一些学习资料，便于广泛的学习

2022-06-12 13:40:22 127

原创动态卷积 Dynamic convolution

动态卷积的相关文章

2022-03-17 15:45:35 19631 8

原创计算机视觉中的半监督学习方法

最近在学习半监督学习的知识。找到了一篇博文写的非常好，比较适合入门，我这里说的入门是指有一定深度学习基础，但没有接触过半监督学习领域的人员。如果从未接触过深度学习，建议从基础的神经网络和目标检测算法开始学起。这是一篇英文博文。原文链接如下：https://amitness.com/2020/07/semi-supervised-learning/#1-self-training对应的中文翻译链接如下：https://blog.csdn.net/weixin_42137700/article/deta

2022-01-12 17:44:14 1543 1

原创 yolov5训练自己的数据集

在github上找到了非常良心的一个中文复现yolov5的链接。https://github.com/DataXujing/YOLO-v5这个是官方发布的链接：https://github.com/ultralytics/yolov5本想用yolor训练自己的数据集，因为比较着急，不熟悉docker，因此使用了yolo5替代。由于已经有了VOC格式的数据集，所以很快就复现了这个代码。现在记录一下过程和遇到的问题。1 配置环境这个链接和官方发布的版本基本是一样的。因此我按照官网陈述的环境进行配置

2022-01-09 16:24:10 595

原创目标检测的boundingbox的几种表示方法

目标检测中bounding box的几种表示形式1.xyxy型（x_min,y_min,x_max,y_max）——VOC边框表示法用多个.xml文件存放2.tlwh型（x_min,y_min,width,height）——coco边框表示法用一个.json文件存放3.xywh型（x_center,y_center,width,height）——yolo边框表示法用多个.txt文件存放还有一种是标注多个json文件的，具体我忘记了。用不同网络训练自己的数据时，需要将数据转换成网络能够处

2022-01-07 14:16:37 3208

原创 Tensorboard可视化远程服务器上保存的训练文件

tensorboard可视化远程服务器上的模型文件

2021-12-13 11:58:53 1948 1

原创图像文件与标注文件一一配对

情况：使用labelimg标注文档后，获得了大量的图片数据和标注数据。且图像名称与标注名称相同，只是后缀不同。但中间经过一些不为人所知的事情发生后，有些图像数据缺失了标注数据，有些标注数据对应的图像数据找不到了。我们需要对图像文件与标注文件1:1的关系配对。该代码写的时候，具体情况是图像数据有4000张，标注数据有6000张，且4000张图像数据均有标签。因此我直接用了图像的文件名进行匹配。删除了多余的标签。import osfrom shutil import copyimage_path =

2021-12-01 09:14:56 844 1

原创随机分配训练集测试集和验证集

这个代码更加适用于，一张图片对应一个标注文件的数据集。通过随机分配之后，将全部文件分为train、test、val以及对应的标注数据也会分开。如果您只有图像没有标注数据，那就更容易实现。本文就不再赘述。下面是代码，核心部分就是使用了一次随机排序。import os # os是用来切换路径和创建文件夹的。import randomfrom shutil import copy # shutil 是用来复制黏贴文件的# "blossom_end_rot", "graymold", "powde

2021-12-01 09:02:18 1186

原创可视化bounding-box

图像标注文件以xml文件保存下来。xml文件是个啥我就不多做解释了。现在要解决的问题是如何可视化xml文件到对应图像上。下面是代码实现。注释相信已经解释清楚了。jpg和png的代码是通用的。我使用了条件语句。如果您的格式不是png或jpg而是jpeg等结尾的文件，那么您自行修改。这是可视化后的图片。字体和框的尺寸您可以自行修改即可。import xml.etree.ElementTree as ETimport cv2import osxml_path = '/Users/Dong/De

2021-12-01 08:46:42 581

原创 Mac系统隐藏文件导致处理文件失败。

MacBook,Mac OS 系统经常出现点开头的隐藏文件。以至于遍历系统文件，比如处理图像时报错，说无法处理，无效文件等错误。建议使用Mac批量处理文件时，首先使用终端命令 ls -a 检查该路径下是否有.开头的隐藏文件。该文件经常在复制文件或者编辑文件之后产生。因此，在最后遍历文件之前，最好检查。删去即可。Mac OS上使用Python3读取文件过程中出现了UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x80 in position 313

2021-12-01 08:17:03 449

转载 Swin-Transformer理解

https://www.jianshu.com/p/0635969f478b一. 概要关于swin transformer的原理有很多文章已经讲得非常清楚了，而且很详细，自问自己的功底是不如这些大佬的，只能尽一份绵薄之力，让大家更方便的跑通代码。那么在这篇博客我想要分享的是我自己在理解swin transformer过程中产生的疑惑以及解决之后的想法。首先是假设大家已经读了论文，以及一些博客了。然后咱们来看看在这里会不会有一些共鸣。不知道大家看的时候有没有产生这样的疑问。1、关于swin transf

2021-11-08 10:48:10 1124

转载 cuda8he cuda9虚拟环境安装

在使用tensorflow或者keras时，有时需要安装不同版本的tensorflow，这些版本可能要求不同的cuda版本。类似于使用conda安装多个python环境，可以使用conda env环境安装不同版本的cuda和cudnn。1、显卡驱动drive安装显卡驱动的版本要符合安装的cuda最高版对显卡驱动的要求，一般来说，cuda版本越高对显卡驱动要求版本越高，且向上兼容。具体的显卡...

2019-12-04 11:48:15 579

原创 jupter上调用conda的虚拟环境

如何在jupyter上运行conda的虚拟环境jupyter的默认运行环境是电脑环境变量中的python运行环境。如果需要将项目运行在虚拟环境中，就需要在你所运行的虚拟环境中安装一个插件nb_conda。source activate your_env0_nameconda install nb_conda或者在虚拟环境中安装一个ipykernel包，将虚拟运行环境导入到j...

2019-09-19 15:41:20 408

原创 ubuntu16.04重装系统和cuda时遇到的问题

ubuntu分区选项重装CUDA后，开机提示图形处理器low，或者进入无线循环黑底白字的循环，关机时黑底白字，无法关机，任何键不起作用。参考下面这条。https://blog.csdn.net/teavamc/article/details/78330266如果还是无法解决：那么就放大招了，亲测有效：系统环境Windows10 + ubuntu16.04 双...

2019-09-14 19:44:55 1104

原创 pytorch奇葩错误

https://blog.csdn.net/zcgyq/article/details/83085028访问本站观看效果更佳在pytorch中遇到如下错误：libraries/torch/extra/cunn/lib/THCUNN/ClassNLLCriterion.cu:52: void cunn_ClassNLLCriterion_updateOutput_kernel(Dty...

2019-08-26 21:21:06 728

原创图卷积的一些想法

图卷积在行为识别领域的三个最主要的思路为：1.如何设计权重分配策略，可以考虑不同的label策略，还可以考虑为每个节点单独学习独立权重。2.如何设计邻接矩阵，可以是根据先验知识来调整邻接矩阵，也可以是让网络自己学习。3.如何将图卷积扩展到时空域。2019年行为识别方向顶会文章：https://blog.csdn.net/qq_36589469/article/details/915...

2019-08-06 08:59:47 338

原创 NTU-RGBD-120数据集

github：https://github.com/shahroudy/NTURGB-D上面有NTU-RGBD和NTU-RGBD120两个数据集，NTU-RGBD120是NTU-RGBD的增强版。从原先的60个动作，拓展到120个动作，从之前的40名演员，扩展到106名演员。具体内容去看github和论文中介绍吧。https://github.com/lshiwjx/2s-AGCN...

2019-06-16 21:22:03 9534 11

原创删除ubuntu后开机进入grub的解决办法

问题：电脑装双系统，后来不想要ubuntu系统，只想保留win10系统，在磁盘管理界面直接删除了ubuntu占用的磁盘。导致开机进入grub界面。无法直接进入系统。非常感谢这位博主分享的方法。开始在网上搜索的时候，全部都是一些建议用u盘进入启动项，然后回复引导项的答案，可是我身边没有win10的启动盘。急死我了，在网上找了好多种方法，最终找到解决方案。https://blog.csdn.n...

2019-04-23 19:58:54 27909 10

转载 ubuntu查看gpu运行状况

1. 显示当前GPU使用情况Nvidia自带了一个nvidia-smi的命令行工具，会显示显存使用情况：$ nvidia-smi输出： 2. 周期性输出GPU使用情况但是有时我们希望不仅知道那一固定时刻的GPU使用情况，我们希望一直掌握其动向，此时我们就希望周期性地输出，比如每 10s 就更新显示。这时候就需要用到 watch命令，来周期性地执行nvidia-smi...

2019-04-23 12:14:56 14633

原创配置ST-GCN体会

搞深度学习这东西配环境真的难。总是在达成目标的路上遇到各种错误。本文仅记录配置环境中的心得。Spatial Temporal Graph Convolutional Networks for Skeleton Based Action Recognition论文解读可参考：https://blog.csdn.net/qq_36893052/article/details/79860328...

2019-04-22 13:35:32 8178 46

原创 ubuntu默认播放器缺少解码器

直接安装一个vlc播放器代默认播放器。VLC播放器应该说是开源项目中最好的视频播放器，但功能不止于视频播放，还有视频直播等等。可以通过安装字幕插件搜索字母等。安装步骤：1、安装：sudo add-apt-repository ppa:videolan/master-dailysudo apt-get updatesudo apt-get install vlc2、配置默认...

2019-04-22 12:49:58 3709

原创 How to compile and install FFmpeg 4.0 on Debian/Ubuntu

Here’s how to build and install FFmpeg 4.0 from source with all the bells and whistles (i.e codec support). We’ll install it as a custom Debian package usingcheckinstall. That way, any other package...

2019-04-21 21:42:31 273

原创安装pythorch

下贼pytorch：http://pytorch.org/要安装和你python版本还有cudn版本对应的包。安装pytorch进入PyTorch的下载目录，使用pip命令安装：比如我下载的是0.4.0版本的pip install torch-0.4.0-cp35-cp35m-linux_x86_64.whl安装torchvision安装torchvision比较简单，...

2019-04-20 15:49:42 7190

转载 Deep High-Resolution Representation Learning for Human Pose Estimation

基本思想：作者观察到，现有姿态估计算法中往往网络会有先降低分辨率再恢复高分辨率的过程，比如下面的几种典型网络。为便于表达，在下面的a、b、c、d四幅图中，同一水平线上的特征图为相同分辨率，越向下分辨率越小，在最终的高分辨率特征图heatmap中计算姿态估计的关键点。下图描述了作者的思想：在上图中网络向右侧方向，深度不断加深，网络向下方向，特征图被下采样分辨率越小，相...

2019-04-13 15:06:48 2932

原创 ubuntu编译openpose采的坑

这两天搞openpose心态爆炸，环境问题好难配置。一开始有很多坑，比如装caffe，opencv。这些用源码编译都很繁琐，克服了很多困难后发现，openpose编译的时候还是报错。于是狠下心，从0开始装环境。以下所有的环境网上都有合适的教程。openpose主页：https://github.com/yysijie/openpose 直接从这个地方下载，然后解压，不要用命令去下载，下的东...

2019-04-03 22:33:10 3254 3

原创卷积神经网络与深度学习基础

发现了几篇写的比较好的文章，以后有类似的好文章直接吧网址粘贴这篇博客里面。卷积神经网络：https://mp.weixin.qq.com/s/287vamTc6QD4wo6maX0dbQCNN,RNN,前馈神经网络：https://mp.weixin.qq.com/s/2VhQOrZ5G-auQrXbwSLo7A机器学习与深度学习等6门课程吴恩达教学：https://study.163...

2019-03-14 21:04:05 223

原创滑动平均模型

指数加权平均算法的原理在书上看到了滑动平均模型，不懂什么意思，然后博客上有一篇写的很明白，摘抄了一段，然后附上书中的代码。TensorFlow中的滑动平均模型使用的是滑动平均（Moving Average）算法，又称为指数加权移动平均算法（exponenentially weighted average），这也是ExponentialMovingAverage()函数的名称由来。先来看...

2019-03-01 10:23:39 10252 4

转载 Optical Flow Guided Feature: A Fast and Robust Motion Representation for Video Action Recognition论文

这是我转载的别人的一片写的还不错的论文笔记，由于内容比较多，就没有自己写。这是一片2018年的CVPR上的一片文章，提出了一种基于光流引导的特征（OFF），将这个特征融入到CNN网络中论文地址：http://openaccess.thecvf.com/content_cvpr_2018/html/Sun_Optical_Flow_Guided_CVPR_2018_paper.htmlOpt...

2019-02-24 14:47:06 548

转载 MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition论文笔记

2D/3D联合卷积模块MiCT：全面提升行为识别的性能和效率编者按：行为识别是计算机视觉领域的一个重要研究方向，在监控、自动驾驶等日常场景中具有广泛的应用前景。为了提升3D CNN在行为识别分析中的性能，微软亚洲研究院网络多媒体组在CVPR 2018上提出了一个简单而高效的3D/2D混合卷积模块（MiCT）。MiCT模块使3D CNN能够以更少的3D时空融合、更小的模型、更快的速度来提取到更深...

2019-02-17 14:41:59 1415

原创目标检测算法

目标检测算法一般分为两阶段检测和单阶段检测，常见的两阶段的检测方法有滑动窗口、R-CNN系列，SPPNET等，单阶段检测器有YOLO/SSD/Retinanet等，之后将逐一介绍这些算法的核心思想和贡献。2012年之前，大部分的研究人员一直都在用传统的算法进行目标检测，大多是基于SIFT、HOG特征提取，然后送入分类器。比如滑动窗口的方法。滑动窗口将不同大小的窗口以不同的步长遍历图片每一个角落...

2019-01-18 22:27:40 2871

原创 tensorflow学习笔记（四）

代码学习有点吃力，学习了YOLOv1的代码，主要是训练部分的代码，对yolo的又有了进一步的理解。其文件夹下主要包含py文件为，train.py, yolo_net.py, pascal_voc.。下面是比较详细的代码解读。但是还是有一些内容理解的不是很透彻。暂时就这样吧。首先看一下yolo_net.py文件，这个文件主要定义了网络结构，损失函数的计算等内容。import numpy a...

2018-12-22 20:24:51 510

原创 tensorflow学习笔记（三）

在学习YOLO-tensorflow代码的过程中，继续学习了关于tensorflow的一些内容。随笔记下：1 tf.padimport tensorflow as tf#定义一个二维和三维的数据t1 = tf.constant([[1, 2, 3], [4, 5, 6]])t2 = tf.constant([[[1,2,3], [4,5,6], [7,8,9]]])with...

2018-12-13 22:48:17 280

原创自编码器AutoEncoder（二）

那么既然编码器可以将784维的数据压缩到128维，把原数据的精髓提取到128维的空间中，而且自编码有点类似于PCA的做法，那么既然可以压缩，我把它压缩到二维或者三维空间可视化一下可不可以呢？答案是可以的。当把数据不断地压缩，然后解码，然后跟原始数据对比求出残差再反向传递，逐步减小损失的过程中，自编码器学到的东西会越来越好，压缩的精髓也就越来越能代表原始数据的分布，那么我就把原始数据压缩到2维或者3...

2018-12-12 21:34:03 642

空空如也

空空如也