xiaoY322-CSDN博客

原创（自记录）LINUX部署docker+opencv的标注软件CVAT

报start request repeat too qiuckly错误一般这个错误就是/etc/docker/daemon.json改错了。其中涉及换源，不然太慢了，有个坑，官方的换源地址第四个是错的，多了一个https，会报错。vim更改文件/etc/docker/daemon.json。主要参考官方用户手册。

2023-08-21 08:32:10 195

原创 qt+opencv配置

自己记录，简单的QT+OPENCV配置

2022-10-10 11:08:01 1329 1

小工具，从总量为NUM_PIC 的数据集中随机抽取NUM_NEED张图片，复制到dst_path路径中。import globimport randomimport shutilNUM_PIC = 50000NUM_NEED = 1000src_path = "E:\python\detect\image\\valid\images\\"dst_path_image = "E:\python\detect\image\\valid\\new\\image\\"dst_path_lable

2022-05-25 11:05:02 1304 1

原创 YOLO识别视频时，识别框闪烁问题解决：增加前后帧记忆功能

一、简述使用YOLO完成航拍视频任务识别时，会遇到识别框不稳定问题。这是由于在连续帧处理时，YOLO不会记忆上一帧的识别结果，可能上一帧算法认为此处是一辆车，下一帧由于光照等变化，此处置信度下降，低于阈值，算法又不认为此处是车，下一帧置信度上升，算法又认为是车，因此造成了识别框闪烁问题，当同一视场下目标较多时，闪烁问题会更加明显。二、思路希望增加一个前后帧关联的策略，让前一帧的识别结果可以关联到后一帧，这里提供一个小思路，将前一帧超过一定阈值的置信度乘以一个系数叠加到下一帧对应的网格位置，相当于如果

2022-03-24 09:34:57 8279 17

原创 VPX板卡信号通过RTSP到VLC播放

一、背景介绍这次是一个偏工程的任务，需要将VPX板卡的信号通过RTSP推流出去再接收，通过这种方式远程调试人工智能算法。二、需要软件ffmpeg：推流工具，将视频转化为流推出https://ffmpeg.org/download.htmlrtsp服务器：中转服务器https://github.com/aler9/rtsp-simple-server/releasesvlc：流播放器，用来接收推出去的流视频并播放，有命令行版本。也可直接在ubuntu的应用商店下载或者直接apt-get。ht

2022-02-10 16:45:20 2280

原创 YOLOV5 模型和代码修改——针对小目标识别(红外小目标)

一、简述最近忙于各种奇奇怪怪的杂事，仔细一看居然有四个月没有写微博了，罪恶……这次主要是针对航拍的红外图像做定向识别，项目实际识别目标保密的由于原因不能展示，博客里面仅用车辆和行人进行说明。红外图像相比于三通道可见光图像，其边缘和细节信息更加模糊，但是最重要的难点在于目标在不同场景不同时间下表现的特征是完全不同甚至截然相反的！比如一辆car在停着的时候轮胎是偏黑色（因为温度低，无热辐射），但在路上行驶时由于与地面摩擦，其热辐射很高。再比如晚上和白天温差较大，其车身各部分由于吸热能力不同，呈现的细节

2021-12-20 14:11:48 6761 7

原创 YOLOV5 模型和代码修改——针对小目标识别

一、简述针对YOLOV5小目标识别部分做了算法改进：1.修改了MODEL，增加了小目标检测层2.修改了detect.py，增加了分割检测模块，以时间换准确度。代码已上传到GITHUB：https://github.com/Hongyu-Yue/yoloV5_modify_smalltarget思路主要参考引用了两个文章，如下：修改检测层http://www.qishunwang.net/news_show_12005.aspx修改detect.pyhttps://zhuanlan.zhi

2021-08-21 16:16:20 43864 71

原创自适应图像超分辨率算法的MATLAB代码与C++代码实现

代码中集成了几种基于opencv的插值方法，自己写了一个自适应插值法，对比了效果。背景和原理介绍参考我另一篇博客：原理解读一、MATLAB代码1、2已经可以了。3、4还没完全调通,因为没太理解matlab里这个样条插值，3、4做出来的结果比原图还差。。。这个是自适应的插值，与传统的插值方法不同，按理说应该会比直接opencv插效果要好，后面有对比。代码处理是基于一个灰度的处理，如果是RGB图像的话可以调用三次再整合。clear all;X=imread('/home/yhy/图片/butterf

2021-08-17 14:39:58 2712 3

原创 Pysot 长时单目标跟踪代码解读

一、项目简介最近项目的原因开始研究长时跟踪的解决方案，主要的难点在于需要在目标长时间丢失的情况下一直等待目标出现，出现后重新识别，传统的和AI的都尝试做了复现，AI的在调研复现了几个跟踪算法后感觉商汤的PYSOT针对我们的需求效果最好，因此学习了一下，做个笔记。二、简介PySOT是商汤科技视频智能研究团队设计的软件系统。它实现了最先进的单对象跟踪算法，包括SiamRPN和SiamMask。它是用 Python 编写的，由PyTorch深度学习框架提供支持。该项目还包含用于评估跟踪器的工具包的 Pyth

2021-08-16 22:04:07 2334 1

原创 YOLO5_Train初学注释

argparse 命令行解析的标准模块，内置于python，不需要安装。这个库可以让我们直接在命令行中就可以向程序中传入参数并让程序运行。

2021-07-23 16:20:17 329

原创图像超分辨率总结

一、理论几种基于传统插值方法的图像超分总结，项目还没弄完，边搞边学。最临近会丢失高频量导致锯齿双线性丢失瑞华细节模糊双三次边缘导向假设图像局部为高斯随机因此求出局部分量的协方差系数再带入要求的地方算出插值点ICCV2009采用相同像素搜索复制和负反馈法二、MATLAB代码1、2已经可以了。3、4还没完全调通。clear all;X=imread('/home/yhy/图片/woman.jpg');f1=X;f1=double(f1(:,:,1))/255;

2021-07-23 16:17:45 1657 1

原创全局平均池化为什么有效

思想：对于输出的每一个通道的特征图的所有像素计算一个平均值，经过全局平均池化之后就得到一个维度==类别数的特征向量，然后直接输入到softmax层作用：代替全连接层，可接受任意尺寸的图像优点： 1）可以更好的将类别与最后一个卷积层的特征图对应起来（每一个通道对应一种类别，这样每一张特征图都可以看成是该类别对应的类别置信图）2）降低参数量，全局平均池化层没有参数，可防止在该层过拟合 3）整合了全局空间信息，对于输入图片的spatialtranslation更加鲁棒疑惑：全局池化是放在最.

2021-05-17 22:09:46 3268 2

原创 yolov5——基于yolov5的钢材表面缺陷识别

1）背景介绍之前在东大读硕士的时候接触过NEU-DET数据集，用来做钢材表面的缺陷识别，最近学习yolov5想起来了，尝试使用YOLOV5实现识别钢材表面的缺陷。数据集：http://faculty.neu.edu.cn/yunhyan/NEU_surface_defect_database.html2) 检测算法YOLOV5讲算法的文章有很多，就不再复述一遍了。近期学习时主要看到比较好的文章推荐：YOLO系列(从v1到v5)模型解读 (上、中、下)：https://zhuanlan.zhih

2021-05-09 16:24:12 21750 42

原创 kaggle——Digit Recognizer MNIST手写数字识别（CNN版）

1）目标任务网址：kaggle_Digit Recognizer任务回顾：识别数字。上次采用KNN实现，最终准确率为0.97，受限于算法已经比较难以提升。本次采用CNN实现，开始使用pytorch。PyTorch主要优势：1、调用GPU多线程张量运算。2、深度神经网络自动求导。2）流程思路本次思路采用CNN实现，使用pytorch。参考LE-NET5模型：代码版本如下： #LENET-5 #nn.Conv2d(1, 6, kernel_size=5, stride=1, p

2021-05-05 12:57:49 943

原创 kaggle——Digit Recognizer MNIST手写数字识别（KNN版）

1）目标任务网址：kaggle_Digit RecognizerMNIST（“国家标准技术研究院”）是计算机视觉的事实上的“ hello world”数据集。自从1999年发布以来，这个经典的手写图像数据集已成为基准分类算法的基础。随着新的机器学习技术的出现，MNIST仍然是研究人员和学习者的可靠资源。在这场比赛中，您的目标是从数万个手写图像的数据集中正确地识别数字。我们策划了一系列教程风格的内核，涵盖了从回归到神经网络的所有内容。我们鼓励您尝试不同的算法，以第一手学习什么有效，以及如何比较技术。

2021-05-01 10:47:13 562

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_56184890的博客

原创（自记录）LINUX部署docker+opencv的标注软件CVAT

原创 qt+opencv配置

原创从数据集中随机抽取图片（验证集/测试集生成）

原创 YOLO识别视频时，识别框闪烁问题解决：增加前后帧记忆功能

原创 VPX板卡信号通过RTSP到VLC播放

原创 YOLOV5 模型和代码修改——针对小目标识别(红外小目标)

原创 YOLOV5 模型和代码修改——针对小目标识别

原创自适应图像超分辨率算法的MATLAB代码与C++代码实现

原创 Pysot 长时单目标跟踪代码解读

原创 YOLO5_Train初学注释

原创图像超分辨率总结

原创全局平均池化为什么有效

原创 yolov5——基于yolov5的钢材表面缺陷识别

原创 kaggle——Digit Recognizer MNIST手写数字识别（CNN版）

原创 kaggle——Digit Recognizer MNIST手写数字识别（KNN版）

原创 kaggle——Titanic泰坦尼克之灾

原创手撕bp——基于sigmoid的前向传播与反向传播推导

原创 Logistic回归——拟合多次项

原创 Logistic回归

原创多变量线性回归

原创单变量线性回归

基于matlab的自适应插值法（四种不同插值算法集成）

数据集处理函数：按键分数据集适用于目标识别 YOLO RCNN等

目标识别 YOLO RCNN等标签处理函数：为负样本添加空标签

空空如也

基于matlab的自适应插值法（四种不同插值算法集成）

数据集处理函数：按键分数据集 适用于目标识别 YOLO RCNN等

目标识别 YOLO RCNN等 标签处理函数：为负样本添加空标签

空空如也

数据集处理函数：按键分数据集适用于目标识别 YOLO RCNN等

目标识别 YOLO RCNN等标签处理函数：为负样本添加空标签