自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 (自记录)LINUX部署docker+opencv的标注软件CVAT

报start request repeat too qiuckly错误 一般这个错误就是/etc/docker/daemon.json改错了。其中涉及换源,不然太慢了,有个坑,官方的换源地址第四个是错的,多了一个https,会报错。vim更改文件/etc/docker/daemon.json。主要参考官方用户手册。

2023-08-21 08:32:10 195

原创 qt+opencv配置

自己记录,简单的QT+OPENCV配置

2022-10-10 11:08:01 1329 1

原创 从数据集中随机抽取图片(验证集/测试集生成)

小工具,从总量为NUM_PIC 的数据集中随机抽取NUM_NEED张图片,复制到dst_path路径中。import globimport randomimport shutilNUM_PIC = 50000NUM_NEED = 1000src_path = "E:\python\detect\image\\valid\images\\"dst_path_image = "E:\python\detect\image\\valid\\new\\image\\"dst_path_lable

2022-05-25 11:05:02 1304 1

原创 YOLO识别视频时,识别框闪烁问题解决:增加前后帧记忆功能

一、简述使用YOLO完成航拍视频任务识别时,会遇到识别框不稳定问题。这是由于在连续帧处理时,YOLO不会记忆上一帧的识别结果,可能上一帧算法认为此处是一辆车,下一帧由于光照等变化,此处置信度下降,低于阈值,算法又不认为此处是车,下一帧置信度上升,算法又认为是车,因此造成了识别框闪烁问题,当同一视场下目标较多时,闪烁问题会更加明显。二、思路希望增加一个前后帧关联的策略,让前一帧的识别结果可以关联到后一帧,这里提供一个小思路,将前一帧超过一定阈值的置信度乘以一个系数叠加到下一帧对应的网格位置,相当于如果

2022-03-24 09:34:57 8279 17

原创 VPX板卡信号通过RTSP到VLC播放

一、背景介绍这次是一个偏工程的任务,需要将VPX板卡的信号通过RTSP推流出去再接收,通过这种方式远程调试人工智能算法。二、需要软件ffmpeg:推流工具,将视频转化为流推出https://ffmpeg.org/download.htmlrtsp服务器:中转服务器https://github.com/aler9/rtsp-simple-server/releasesvlc:流播放器,用来接收推出去的流视频并播放,有命令行版本。也可直接在ubuntu的应用商店下载或者直接apt-get。ht

2022-02-10 16:45:20 2280

原创 YOLOV5 模型和代码修改——针对小目标识别(红外小目标)

一、简述最近忙于各种奇奇怪怪的杂事,仔细一看居然有四个月没有写微博了,罪恶……这次主要是针对航拍的红外图像做定向识别,项目实际识别目标保密的由于原因不能展示,博客里面仅用车辆和行人进行说明。红外图像相比于三通道可见光图像,其边缘和细节信息更加模糊,但是最重要的难点在于目标在不同场景不同时间下表现的特征是完全不同甚至截然相反的!比如一辆car在停着的时候轮胎是偏黑色(因为温度低,无热辐射),但在路上行驶时由于与地面摩擦,其热辐射很高。再比如晚上和白天温差较大,其车身各部分由于吸热能力不同,呈现的细节

2021-12-20 14:11:48 6761 7

原创 YOLOV5 模型和代码修改——针对小目标识别

一、简述针对YOLOV5小目标识别部分做了算法改进:1.修改了MODEL,增加了小目标检测层2.修改了detect.py,增加了分割检测模块,以时间换准确度。代码已上传到GITHUB:https://github.com/Hongyu-Yue/yoloV5_modify_smalltarget思路主要参考引用了两个文章,如下:修改检测层http://www.qishunwang.net/news_show_12005.aspx修改detect.pyhttps://zhuanlan.zhi

2021-08-21 16:16:20 43864 71

原创 自适应图像超分辨率算法的MATLAB代码与C++代码实现

代码中集成了几种基于opencv的插值方法,自己写了一个自适应插值法,对比了效果。背景和原理介绍参考我另一篇博客:原理解读一、MATLAB代码1、2已经可以了。3、4还没完全调通,因为没太理解matlab里这个样条插值,3、4做出来的结果比原图还差。。。这个是自适应的插值,与传统的插值方法不同,按理说应该会比直接opencv插效果要好,后面有对比。代码处理是基于一个灰度的处理,如果是RGB图像的话可以调用三次再整合。clear all;X=imread('/home/yhy/图片/butterf

2021-08-17 14:39:58 2712 3

原创 Pysot 长时单目标跟踪代码解读

一、项目简介最近项目的原因开始研究长时跟踪的解决方案,主要的难点在于需要在目标长时间丢失的情况下一直等待目标出现,出现后重新识别,传统的和AI的都尝试做了复现,AI的在调研复现了几个跟踪算法后感觉商汤的PYSOT针对我们的需求效果最好,因此学习了一下,做个笔记。二、简介PySOT是商汤科技视频智能研究团队设计的软件系统。它实现了最先进的单对象跟踪算法,包括SiamRPN和SiamMask。它是用 Python 编写的,由PyTorch深度学习框架提供支持。该项目还包含用于评估跟踪器的工具包的 Pyth

2021-08-16 22:04:07 2334 1

原创 YOLO5_Train初学注释

argparse 命令行解析的标准模块,内置于python,不需要安装。这个库可以让我们直接在命令行中就可以向程序中传入参数并让程序运行。

2021-07-23 16:20:17 329

原创 图像超分辨率总结

一、理论几种基于传统插值方法的图像超分总结,项目还没弄完,边搞边学。最临近会丢失高频量 导致锯齿双线性丢失瑞华细节 模糊双三次边缘导向 假设图像局部为高斯随机 因此求出局部分量的协方差系数 再带入要求的地方 算出插值点ICCV2009采用相同像素搜索复制和 负反馈法二、MATLAB代码1、2已经可以了。3、4还没完全调通。clear all;X=imread('/home/yhy/图片/woman.jpg');f1=X;f1=double(f1(:,:,1))/255;

2021-07-23 16:17:45 1657 1

原创 全局平均池化为什么有效

思想: 对于输出的每一个通道的特征图的所有像素计算一个平均值,经过全局平均池化之后就得到一个 维度==类别数 的特征向量,然后直接输入到softmax层作用: 代替全连接层,可接受任意尺寸的图像优点: 1)可以更好的将类别与最后一个卷积层的特征图对应起来(每一个通道对应一种类别,这样每一张特征图都可以看成是该类别对应的类别置信图)2)降低参数量,全局平均池化层没有参数,可防止在该层过拟合 3)整合了全局空间信息,对于输入图片的spatialtranslation更加鲁棒疑惑:全局池化是放在最.

2021-05-17 22:09:46 3268 2

原创 yolov5——基于yolov5的钢材表面缺陷识别

1)背景介绍之前在东大读硕士的时候接触过NEU-DET数据集,用来做钢材表面的缺陷识别,最近学习yolov5想起来了,尝试使用YOLOV5实现识别钢材表面的缺陷。数据集:http://faculty.neu.edu.cn/yunhyan/NEU_surface_defect_database.html2) 检测算法YOLOV5讲算法的文章有很多,就不再复述一遍了。近期学习时主要看到比较好的文章推荐:YOLO系列(从v1到v5)模型解读 (上、中、下):https://zhuanlan.zhih

2021-05-09 16:24:12 21750 42

原创 kaggle——Digit Recognizer MNIST手写数字识别(CNN版)

1) 目标任务网址:kaggle_Digit Recognizer任务回顾:识别数字。上次采用KNN实现,最终准确率为0.97,受限于算法已经比较难以提升。本次采用CNN实现,开始使用pytorch。PyTorch主要优势:1、调用GPU多线程张量运算。2、深度神经网络自动求导。2)流程思路本次思路采用CNN实现,使用pytorch。参考LE-NET5模型:代码版本如下: #LENET-5 #nn.Conv2d(1, 6, kernel_size=5, stride=1, p

2021-05-05 12:57:49 943

原创 kaggle——Digit Recognizer MNIST手写数字识别(KNN版)

1) 目标任务网址:kaggle_Digit RecognizerMNIST(“国家标准技术研究院”)是计算机视觉的事实上的“ hello world”数据集。自从1999年发布以来,这个经典的手写图像数据集已成为基准分类算法的基础。随着新的机器学习技术的出现,MNIST仍然是研究人员和学习者的可靠资源。在这场比赛中,您的目标是从数万个手写图像的数据集中正确地识别数字。我们策划了一系列教程风格的内核,涵盖了从回归到神经网络的所有内容。我们鼓励您尝试不同的算法,以第一手学习什么有效,以及如何比较技术。

2021-05-01 10:47:13 562

原创 kaggle——Titanic泰坦尼克之灾

1)目标任务网址:kaggle_泰坦尼克号1912年4月15日,在她的处女航中,被广泛认为的泰坦尼克号与冰山相撞后沉没。不幸的是,船上没有足够的救生艇供所有人使用,导致2224名乘客和机组人员中的1502人死亡。尽管幸存者有一些运气,但似乎有些人比其他人更有可能生存。在这一挑战中,我们要求您建立一个预测模型来回答以下问题:“什么样的人更有可能生存?” 使用旅客数据(即姓名,年龄,性别,社会经济舱等)。2)流程思路1.数据分析与处理(非常重要)2.建立简单模型3.训练并评估4.修改模型5.

2021-05-01 01:09:45 650 1

原创 手撕bp——基于sigmoid的前向传播与反向传播推导

1)目标打算手撕一遍前向传播与反向传播的公式推导以及代码。2)推导本次使用的神经网络模型。手撕推导留个坑,有空补上3)代码import numpy as npimport matplotlib.pyplot as pltimport scipy.io as scioimport scipy.optimize as optdata = scio.loadmat('D:\python\homewrok\data_sets\ex3data1.mat')weights = scio.loa

2021-04-26 20:43:40 710

原创 Logistic回归——拟合多次项

1)目标使用Logistic回归模型来预测一个学生是否有资格入学。评估学生在两门test中的表现来决定录取率,通过以往的成绩和是否录取的学生数据建立模型,训练Logistic回归,对每一个新申请学生,你通过lr判定是否应该予以录取。本次采用了非线性的拟合函数进行拟合分类。2)总结使用矩阵运算的好处:可以多核并行计算,增加计算速度;可扩展性好,在从线性分类拟合到多项式拟合的改动中,只要对代码进行非常小的改变即可完成。3)代码import numpy as npimport matplotlib.

2021-04-24 15:02:43 1175

原创 Logistic回归

1)目标使用Logistic回归模型来预测一个学生是否有资格入学。评估学生在两门test中的表现来决定录取率,通过以往的成绩和是否录取的学生数据建立模型,训练Logistic回归,对每一个新申请学生,你通过lr判定是否应该予以录取。2)总结实现算法前,应该在纸上将各个矩阵的维度整理清楚,防止不知名bug。相比于之前的线性回归,lr由于加入了非线性的部分,梯度下降的速度会非常缓慢,可以采用高级方法,共轭梯度、BFGS等。3)代码import numpy as npimport matplot

2021-04-21 21:23:30 101

原创 多变量线性回归

1)目标使用线性回归,预测房价。自变量有两个,分别为屋子数量和面积。使用这些数据来学习并预测未来某房屋价格。2)总结使用np做矩阵运算时可以时常用assert断言检查矩阵维数是否正确,防止不知名Bug产生。设置向量时不要设置成数组型向量,要写成[[x,x2,x3]]这种形式或者将np.array的两个维度写全,避免向量被建立成数组格式,会遭遇无法转置等愚蠢的情况(血的教训)。import numpy as npa=np.ones(3)b=a.Tprint(a,'\n',b,)输出如下

2021-04-20 20:54:19 134

原创 单变量线性回归

1)题目使用线性回归,预测食品卡车的利润。假设你是一家餐馆的设计者,正在考虑开一个分店。你有来自城市的利润和人口数据。请使用这些数据来预测下一个餐馆开在何处x表示人口数据,y表示利润,共97组。2)总结Python中读取数据主要有两个函数库可以调用。分别是numpy与pandas,numpy的load函数读取数据,也可以用pandas的read函数读取,区别在于numpy读取的数据以array的形式而pandas以dataframe的形式,两者可以利用函数互相转化。选择学习率时若学习率过小会发生

2021-04-17 13:26:13 82 1

基于matlab的自适应插值法(四种不同插值算法集成)

代码中集成了4种基于opencv的插值方法,自己写了一个自适应插值法,对比了效果。背景和原理介绍参考博客:https://blog.csdn.net/weixin_56184890/article/details/118935273?spm=1001.2014.3001.5501 其中1、2已经可以了。3、4慎用 这个是自适应的插值,与传统的插值方法不同,按理说应该会比直接opencv插效果要好,后面有对比。 代码处理是基于一个灰度的处理,如果是RGB图像的话可以调用三次再整合。

2023-08-22

数据集处理函数:按键分数据集 适用于目标识别 YOLO RCNN等

数据集处理函数,程序会展示你文件夹中的图片,之后等待用户按键,根据按键分数据集,按1键分到子文件夹1,按2键分到子文件夹2,按3键分到子文件夹3, 也可用于排除有标签没图片的废弃标签,或者有更多分组只需要简单修改代码即可,原理一致。 有注释,下载即用,将标签和图片放在同一文件夹下即可,注意修改路径 需要的相关库如下: import glob import cv2 import shutil import os

2023-08-21

目标识别 YOLO RCNN等 标签处理函数:为负样本添加空标签

适用于目标识别 YOLO RCNN等算法的数据集处理函数,为负样本添加空标签,也可用于排除有标签没图片的废弃标签,只需要简单修改代码即可,原理一致。 有注释,下载即用,将标签和图片放在同一文件夹下即可,注意修改路径,标签、图片后缀。 需要的相关库如下: import os import glob import tqdm import shutil

2023-08-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除