自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

进击的菜鸟

每天进步一点点

  • 博客(274)
  • 资源 (12)
  • 收藏
  • 关注

原创 c++常用代码(持续更新)

#include <iostream>#include <string>#include <chrono>void Run(){ for (int i = 0; i < 1000000000; ++i) { }}int main(){ auto beforeTime = std::chrono::steady_clock::now(); Run(); auto afterTime = std::chrono::steady_.

2021-06-29 10:52:34 17059

原创 python常用程序代码(持续更新收集)

文件夹遍历和文件遍历# 遍历文件夹和文件,返回文件的路径和对应的文件的名称,同时可以根据自己的应用需要进行更改def get_img_file(file_name): imagelist = [] for parent, dirnames, filenames in os.walk(file_name): for filename in filenames: if filename.lower().endswith(('.bmp', '.dib

2021-02-25 16:12:24 8044 1

原创 本科+研究生七年之痒,我的经历希望能给你启发和坚持

总结本应该在功成名就以后才来书写,但是我相信我的未来不是梦,我相信未来一定有一片属于我的天空。(纯属记录一下学生时代的经历,多年后在回顾,会不会感谢这7年的自己呢?值得期待)本科阶段认清篇 2013年参加高考后(发挥失常),感觉自己无望了,但是最后还是上了末尾的二本。进入大学时代后,在大一时,我和其他同学一样,完全放纵了自己,电影不停的看,剧不停的刷,这样过了一学期,这样的生活感觉很无味,在暑假思考了自己的人生,思考自己以后想干什么,会干什么,会不会毕业就失业。深层次的分析...

2020-06-16 22:36:59 7595 38

原创 视觉大模型--DeformableDETR

原理大家可以参考这篇,我这边主要介绍几个公式和整体源码理解。

2024-04-10 16:22:08 710

原创 视觉大模型--DAB-deter的深入理解

以上就是DAB的整体结构和思路,该模型给我的感觉在于,清晰的解释了pose_query的含义,同时对于位置的回归和融入进行了各种的转换,给我的感觉是,原来query可以这样用,而且使用wh对attention进行约束,他不是直接作用attention,而是通过输入的Q进行,而尺度的计算通过位置query和内容query对位置的回归进行规范化,然后作用embeding,最后和Q进行拼接形成最终的输入,这一套思路可以来上是神来之笔,很清晰,很明了,而且都是可学习的,这里后续就可以做很多操作了。

2024-04-08 20:30:00 419

原创 视觉大模型--deter的深入理解

但对于transformer用于目标检测领域的开创性模型,该模型言简意赅,但是但从论文理解,有很多细节都不清楚,尤其是解码器的query和二分图匹配(Bipartite Matching)和匈牙利算法(Hungarian Algorithm)相关,本文将根据代码详细介绍这一部分。

2024-04-03 20:00:00 1757

原创 视觉大模型学习路径

本文只是从全局角度出发梳理学习过程,现阶段不会针对每一步写文章,工作没什么时间,但是会梳理自己的学习过程和一些好的参考文章。后面有时间再系统梳理每个模型。

2024-03-28 16:36:48 298

原创 transformer--使用transformer构建语言模型

以一个符合语言规律的序列为输入,模型将利用序列间关系等特征,输出一个在所有词汇上的概率分布.这样的模型称为语言模型.

2024-03-09 21:23:27 983

原创 transformer--transformer模型构建和测试

针对数字序列进行学习,学习的最终目标是使输出与输入的序列相同.如输入[1,5,8,9,3],输出也是[1,5,8,9,3].

2024-03-04 19:00:00 1031

原创 transformer--解码器

解码器的作用:根据编码器的结果以及上一次预测的结果,对下一次可能出现的值进行特征表示。使最后一维的向量中的数字缩放到0-1的概率值域内,并满足他们的和为1。通过对上一步的线性变化得到指定维度的输出,也就是转换维度的作用,测试代码放到最后代码。

2024-03-01 12:36:01 706

原创 opencv--使用直方图找谷底进行确定分割阈值

有时这两个峰值会有部分重叠,即左侧峰值的下降部分和右侧峰值的上升部分存在叠加。通常可以把自然界的信号看做高斯信号,即一个峰值对应一个高斯信号,当直方图中的两个高斯信号在某个灰度区域叠加的时候,其叠加区就形成了一个圆滑的谷底,就很难找到一个确切的位置(最优二值化的灰度值)把这两个峰值分开。前景使得某个灰度区间的灰度值的数量急剧增加,就会产生一个峰值,同理背景会使另一个灰度区间的灰度值的数量急剧增加,就产生另外一个峰值,两峰间的谷底对应于物体边缘附近相对较少数目的像素点。直方图原理就不说了,大家自行百度。

2024-02-29 19:30:00 570

原创 transformer--编码器2(前馈全连接层、规范化层、子层链接结构、编码器层、编码器)

如图所示,输入到每个子层以及规范化层的过程中,还使用了残差链接(跳跃连接),因此我们把这一部分结构整体叫做子层连接(代表子层及其链接结构),在每个编码器层中,都有两个子层,这两个子层加上周围的链接结构就形成了两个子层连接结构.

2024-02-29 16:55:28 686

原创 transformer--编码器1(掩码张量、注意力机制、多头注意力机制)

掩代表遮掩,码就是我们张量中的数值,它的尺寸不定,里面一般只有1和0的元素,代表位置被遮掩或者不被遮掩,至于是0位置被遮掩还是1位置被遮掩可以自定义,因此它的作用就是让另外一个张量中的一些数值被遮掩,也可以说被替换,它的表现形式是一个张量.

2024-02-28 18:07:03 1426

原创 transformer--输入(位置编码)

【代码】transformer--输入(位置编码)

2024-02-27 22:09:20 635

原创 pcl--第十二节 2D和3D融合和手眼标定

截止目前为止,我们学习了机器人学,学习了2D和3D视觉算法。我们也学习了2D相机(图像数据的来源)和3D相机(点云数据的来源)工作原理。实际上,我们最终要做的,是一个手眼机器人系统。在这个系统里,相机与机器人构成了两个非常关键的部分,它们之间需要密切配合,因此,它们之间的关系,也就非常重要。确定相机与机器人之间的关系,这是手眼标定要解决的问题。另一方面,在很多场合,为了增强算法的鲁棒性,我们通常同时使用图像数据与点云数据,这又涉及到2D与3D配准的问题。

2023-09-22 23:30:00 727 1

原创 pcl--第十一节 点云外接立方体和点云模板匹配

包围体(包容盒)是一个简单的几何空间,里面包含着复杂形状的物体。为物体添加包围体的目的是快速的进行碰撞检测或者进行精确的碰撞检测之前进行过滤(即当包围体碰撞,才进行精确碰撞检测和处理)。包围体类型包括球体、轴对齐包围盒(AABB)、有向包围盒(OBB)、8-DOP以及凸壳(CONVEX HULL)。如上图所示,还有K-DOP,CONVEX HULL等包容盒,越靠右,包容效果好、越紧密。该类还允许提取云的轴对齐和定向的边界框。黄色立方体为AABB包容盒,白色立方体为OBB包容盒。

2023-09-22 21:15:00 671

原创 pcl--第十节 点云曲面重建

曲面重建技术在逆向工程、数据可视化、机器视觉、虚拟现实、医疗技术等领域中得到了广泛的应用。例如,在汽车、航空等工业领域中,复杂外形产品的设计仍需要根据手工模型,采用逆向工程的手段建立产品的数字化模型,根据测量数据建立人体以及骨骼和器官的计算机模型,在医学、定制生产等方面都有重要意义。除了上述传统的行业,随着新兴的廉价 RGBD 获取设备在数字娱乐行业的病毒式扩展,使得更多人开始使用点云来处理对象并进行工程应用。根据重建曲面和数据点云之间的关系,可将曲面重建分为两大类:插值法和逼近法。

2023-09-22 19:30:00 808

原创 pcl--第九节 点云分割

点云分割是根据空间、几何和纹理等特征对点云进行划分,使得同一划分区域内的点云拥有相似的特征。点云的有效分割往往是许多应用的前提。例如,在逆向工程CAD/CAM 领域,对零件的不同扫描表面进行分割,然后才能更好地进行孔洞修复、曲面重建、特征描述和提取,进而进行基于 3D内容的检索、组合重用等。在激光遥感领域,同样需要对地面、物体首先进行分类处理,然后才能进行后期地物的识别、重建。

2023-09-21 21:45:00 647

原创 pcl--第八节 点云配准数学原理

注意!不要求能够推导、证明算法论文,因为这是理论研究者的重心。这不是我们应用型人才的重心,我们的重心是能够将理论更好的应用于实践。一定要有的放矢,提升自己的核心价值。

2023-09-21 19:45:00 219

原创 pcl--第七节 点云配准

​ 随着计算机辅助设计技术的发展,通过实物模型产生数字模型的逆向工程技术获得了越来越广泛的应用,与此同时,硬件设备的日趋完善也为数字模型操作提供了足够的技术支持。​ 由于三维扫描仪设备受到测量方式和被测物体形状的条件限制,一次扫描往往只能获取到局部的点云信息,进而需要进行多次扫描,然后每次扫描时得到的点云都有独立的坐标系,不可以直接进行拼接。在逆向工程、计算机视觉、文物数字化等领域中,由于点云的不完整、旋转错位、平移错位等,使得要得到完整点云就需要对多个局部点云进行配准。

2023-09-20 21:30:00 746

原创 pcl--第六节 3D特征描述子

特征描述子 Feature Descriptor描述子可以分为以下几种类型:基于不变性的描述子、基于直方图的描述子、二进制描述子PCL主要实现了:NARF特征点描述子、PFH(FPFH)点特征直方图描述子、RoPs 特征、VFH视点特征直方图描述子、GASD全局对齐的空间分布描述子、基于惯性矩和偏心率的描述子。

2023-09-19 23:15:00 355

原创 pcl--第五节 点云表面法线估算

但是,如果比例因子太大(右侧部分),则相邻对象的集合会覆盖来自相邻表面的较大点,则估计的点要素表示会失真,在两个平面边缘处旋转的曲面法线会被涂抹边缘和压制的精细细节。由于数据是2.5维的,即数据只从单一视角获取,其法线也应该仅是一个半球体的扩展高斯图,由于我们没有定下法线的方向,所以这些法线遍布球体。尽管有许多不同的法线估计方法,我们先了解其中最简单也是最常见的一个,确定表面一点法线的问题近似于估计表面的一个相切面法线的问题,因此转换过来以后就变成一个。如前所述,需要根据该点的周围点邻域支持,也称为。

2023-09-19 22:00:00 319

原创 pcl--第五节 特征描述与提取Features

是点云信息处理中的最基础也是最关键的部分,点云的识别、分割、重采样、配准、曲面重建等大部分算法,都十分依赖特征描述与提取的结果。从尺度上来划分,一般分为局部特征描述和全局特征描述。例如局部的法线等几何形状特征的描述,全局的拓扑特征描述,都属于3D点云特征描述与提取范畴。在 PCL 中,目前已有很多基本的特征描述子与提取算法。

2023-09-19 19:30:00 190

原创 pcl--第四节 采样一致性算法RANSAC

RANSAC是“RANdom SAmple Consensus”(随机抽样共识或采样一致性)的缩写,它是一种迭代方法,用于从包含异常值的一组数据中估计数学模型的参数。该算法由Fischler和Bolles于1981年发布。RANSAC算法假定我们要查看的所有数据均由内部值和异常值组成。可以用带有一组特定参数值的模型来解释离群值,而离群值在任何情况下都不适合该模型。其过程可以从数据中估计所选模型的最佳参数。RANSAC是一种随机参数估计算法。

2023-09-15 19:45:00 157

原创 pcl--第三节 关键点

关键点也称为兴趣点,它是 2D 图像或 3D 点云或曲面模型上,可以通过检测标准来获取的具有稳定性、区别性的点集。从技术上来说,关键点的数量比原始点云或图像的数据量少很多,其与局部特征描述子结合组成关键点描述子。常用来构成原始数据的紧凑表示 ,具有代表性与描述性,从而加快后续识别、追踪等对数据的处理速度。固而,关键点提取就成为 2D 与 3D 信息处理中不可或缺的关键技术。提取的过程必须考虑边缘以及物体表面变化信息在内;关键点的位置必须稳定的可以被重复探测,即使换了不同的视角;

2023-09-14 20:30:00 204

原创 pcl--第二节 深度图像RangeImage

目前深度图像的获取方法有激光雷达深度成像法,计算机立体视觉成像,坐标测量机法,莫尔条纹法,结构光法等等,针对深度图像的研究重点主要集中在以下几个方面,深度图像(Depth Images)也被称为距离影像(Range Image),是指将从图像采集器到场景中各点的距离值作为像素值的图像,它直接反应了。,利用它可以很方便的解决3D目标描述中的许多问题,深度图像经过点云变换可以计算为点云数据,有规则及有必要信息的点云数据可以反算为深度图像数据。在PCL 中深度图像与点云最主要的区别在于其。

2023-09-13 19:30:00 185

原创 pcl--第一节 Filters

下图给出了噪声消除的示例。由于测量误差,某些数据集会出现大量阴影点。这使得局部点云 3D 要素的估计变得复杂。其中一些异常值可以通过对每个点的邻域执行统计分析并修剪不符合特定条件的邻域来过滤。PCL 中的稀疏异常值去除实现基于对输入数据集中点到相邻距离分布的计算。对于每个点,将计算从该点到其所有相邻点的平均距离。通过假设生成的分布是具有平均值和标准差的高斯分布,则平均距离超出由全局距离平均值和标准差定义的区间之外的所有点都可以被视为异常值并从数据集中修剪。点云数据密度不规则需要平滑。

2023-09-12 20:45:00 185

原创 使用opencv4.7.0部署yolov5

yolov5原理和部署原理就不说了,想了解的可以看看。

2023-08-17 17:41:18 667

转载 矩阵相乘在GPU上的终极优化:深度解析Maxas汇编器工作原理

本文虽然尽可能详尽地对原文档中的伪代码进行了注释,但这还是相对高层的实现,具体到GPU机器码还有一个重要的课题,即控制码没有在本文中涉及。考虑到本文的目的仅是介绍一些GPU优化的思路和实现方法,对此maxas文档中涉及控制码的部分没有进行解读。总的来说,maxas所用的优化思路还是比较清晰的,按其说法之前已经有文献提出了,其最困难的地方在于nVidia不愿意透露其硬件的实现细节,以至于都需要其作者经过艰苦的反向工程猜测出来的才能达到硬件性能的极限。

2023-06-01 20:00:00 403

转载 c++ 文件系统处理 filesystem库的使用

*1\ filesystem 有三个类 path directory_entry directory_iterator file_stautsfilesystem 以path 为基础,后面所有的操作都是以path开始2\path:方法有:判断是否存在 exists(str) 相当于字符串的操作主要包含了 路径的拼接\绝对路径 相对路径 文件名 文件扩展名3\ file_stauts 的使用// dir 可以是fs::path类型,也可以是string类型。

2023-05-19 15:26:25 1004

转载 最大类间方差法(大津法OTSU)原理

最大类间方差法是1979年由日本学者大津提出的,是一种自适应阈值确定的方法,又叫大津法,简称OTSU,是一种基于全局的二值化算法,它是根据图像的灰度特性,将图像分为前景和背景两个部分。当取最佳阈值时,两部分之间的差别应该是最大的,在OTSU算法中所采用的衡量差别的标准就是较为常见的最大类间方差。前景和背景之间的类间方差如果越大,就说明构成图像的两个部分之间的差别越大,当部分目标被错分为背景或部分背景被错分为目标,都会导致两部分差别变小,当所取阈值的分割使类间方差最大时就意味着错分概率最小[1]。

2023-03-24 21:30:00 850

原创 pt文件转onnx确定不同的输入宽高如何转换?

现实中训练好的模型部署时经常会有这样的需求,就是模型的输入需要改变,不使用训练时的输入大小,如yolo系列的模型训练时一般都是输入的图片是640x640,但是部署时我希望输入到模型的分辨率是1920x1080(调整为1920x1088,必须为32的整数倍),那么如何通过pt文件导出对应的onnx模型文件呢?静态batch如何导出呢?动态batch如何导出呢?

2023-03-15 21:00:00 1145

原创 c/c++子函数内使用malloc或者new申请一块内存供外部使用

在实际应用中,笔者编写了类似的例子,用形参指针去调用malloc函数,使用gcc编译,编译时不会报错,但是运行时会报段错误,产生段错误的因素很多,但本次运行的段错误确实跟形参指针调用malloc函数有关,当然也不是说形参指针不能调用malloc函数去申请动态内存,只是不能使用上述例子中的方式。函数体中只是修改了形参_p的内容,对于实参p没有任何影响。c语言中函数参数传递都是值传递,值传递分为数值传递和指针传递,因此指针传递也是一次赋值拷贝的过程。当指针作为函数的形参时,不要用该指针去申请动态内存。

2023-03-01 18:51:05 546

原创 使用cmake在win10编译yolov5+tensorRT+cuda+cudnn+protobuf代码进行混合编译

从Linux下载下来的工程代码,这里建议直接使用vs系列打开不要用vscode打开,vscode对win下的cmake不友好,主要体现在报错机制无法直接定位,题主的环境是vs2022通过cmake可以快速的进行定位bug,并可以快速解决(vscode 的cmake在Linux下还是比较友好的,但是通常如果在Linux下为什么 不研究makefile呢?这里进行之前需要把protobuf在win10下编译,可以参考。这个问题是win中需要包含。

2023-02-28 14:47:27 1328

原创 使用vs2022编译yolov5+tensorRT+cuda+cudnn代码进行混合编译

首先依赖有cuda、cudnn、tensorrt、protobuf,从Linux的代码直接移植过来这些库是没法使用的,需要下载对应win的下的版本,其中cuda、cudnn和tensorrt直接从官方下载即可,但是protobuf需要自己编译一下(

2023-02-22 09:23:03 1055

转载 语音信号的梅尔频率倒谱系数(MFCC)的原理讲解及python实现

语音信号的梅尔频率倒谱系数(MFCC)的原理讲解及python实现

2023-01-12 18:28:34 6092 2

原创 c++多线程高性能版本

高性能c++ 多线程

2022-06-01 23:12:59 551 1

原创 c++11 --- 智能指针(shared_ptr)

1. 智能指针的初始化// 1. 智能指针的初始化 shared_ptr<myclass> p(new myclass); shared_ptr<myclass> p2 = p; shared_ptr<int> ptr; //未初始化的智能指针,可以通过reset进行初始化 ptr.reset(new int(1)); // 应该优先使用make_shared构造智能指针,更高效 shared_ptr<mycl

2022-05-31 19:45:30 1145

原创 深度学习c++部署高性能优化的技巧

图片预处理的高性能实现int input_batch = 1; int input_channel = 3; int input_height = 224; int input_width = 224; int input_numel = input_batch * input_channel * input_height * input_width; float* input_data_host = nullptr; float* input_data

2022-05-28 14:57:05 559

原创 C++11可变模版参数的妙用

泛化之美--C++11可变模版参数的妙用1概述C++11的新特性--可变模版参数(variadictemplates)是C++11新增的最强大的特性之一,它对参数进行了高度泛化,它能表示0到任意个数、任意类型的参数。相比C++98/03,类模版和函数模版中只能含固定数量的模版参数,可变模版参数无疑是一个巨大的改进。然而由于可变模版参数比较抽象,使用起来需要一定的技巧,所以它也是C++11中最难理解和掌握的特性之一。虽然掌握可变模版参数有一定难度,但是它却是C++11中最有意思的一个特性,本文希望..

2022-05-22 22:16:23 211

OpenCV-contrib modules中文教程(小白学视觉)

完整的,小白学视觉公开的不是完整版

2023-06-06

编译DCNv2网络:error: command 'C:\\Program Files\\NVIDIAGPUComputingToolkit\\CUDA\\v1

编译DCNv2网络:error: command 'C:\\Program Files\\NVIDIAGPUComputingToolkit\\CUDA\\v10.0\\bin\\nvcc.exe'

2020-11-20

Xshell 5 Build 1339 + Xftp 5 Build 1235

Xshell+Xftp 整合版 - 免费的 SSH/FTP/SFTP 客户端 (简体中文) ———————————————— 更新时间:2018/1/8 当前版本:Xshell 5 Build 1339 + Xftp 5 Build 1235 Xshell+Xftp 整合版 - 免费的 SSH/FTP/SFTP 客户端 (简体中文) ———————————————— 更新时间:2018/1/8 当前版本:Xshell 5 Build 1339 + Xftp 5 Build 1235

2020-10-21

FlashFXP5.2.0.zip

放心使用,方便易用,下载即可使用,无需安装,系统为win10系统

2020-10-21

智能控制_模糊控制.pptx

模糊逻辑完整的介绍文档,内容很全。

2020-06-27

halcon学习资料.rar

主要是本人近几年的学习和总结,中间包含了大量的时的感想和内容

2020-02-12

c#联合halcon开发实战教程.txt

该资源是c#联合halcon的实战视频,从相机的SDK开发开始到算法的设计、界面设计和串口通信、网口通信的联合实战内容,视频高清无密码。资源满意请打分呀,老铁 该资源是c#联合halcon的实战视频,从相机的SDK开发开始到算法的设计、界面设计和串口通信、网口通信的联合实战内容,视频高清无密码。

2020-02-12

3D视觉、点云、三维重建.txt

该文件是百度云链接,里面有详细介绍机器视觉3D方面的知识,以及结合halcon进行实战的讲解,如果你有机器视觉方面的基础,完全可以自己实现点云和三维重建技术 该文件是百度云链接,里面有详细介绍机器视觉3D方面的知识,以及结合halcon进行实战的讲解,如果你有机器视觉方面的基础,完全可以自己实现点云和三维重建技术

2020-02-10

机器视觉光源介绍和镜头介绍.rar

这是我认为比较系统介绍光源和镜头的了,内容比较详细,看这些能够解决机器视觉的光源选型问题,但是如果想要深入理解还需要学习光学知识。 这是我认为比较系统介绍光源和镜头的了,内容比较详细,看这些能够解决机器视觉的光源选型问题,但是如果想要深入理解还需要学习光学知识。

2020-02-10

QT+Basler相机SDK开发源码+详细说明文档

这个源码很详细,代码清晰 这个源码很详细,代码清晰 这个源码很详细,代码清晰v 这个源码很详细,代码清晰

2020-02-10

QT视频链接(百度云)+教程文档.pdf

包含视频链接和对应的视频文档,简单易懂,是入门的首选辅助资料 包含视频链接和对应的视频文档,简单易懂,是入门的首选辅助资料包含视频链接和对应的视频文档,简单易懂,是入门的首选辅助资料 包含视频链接和对应的视频文档,简单易懂,是入门的首选辅助资料

2020-02-10

Halcon实战视频教程,超人视觉,初级和高级版视频,无密码高清

Halcon实战视频教程,超人视觉,初级和高级版视频,无密码高清Halcon实战视频教程,超人视觉,初级和高级版视频,无密码高清Halcon实战视频教程,超人视觉,初级和高级版视频,无密码高清Halcon实战视频教程,超人视觉,初级和高级版视频,无密码高清Halcon实战视频教程,超人视觉,初级和高级版视频,无密码高清

2020-02-09

很完整的发明专利申请文件完整版模板.rar

完整的专利模板,里面有详细的书写介绍和讲解,对书写专利的同学很有用,完整的专利模板,里面有详细的书写介绍和讲解,对书写专利的同学很有用,完整的专利模板,里面有详细的书写介绍和讲解,对书写专利的同学很有用,完整的专利模板,里面有详细的书写介绍和讲解,对书写专利的同学很有用

2019-11-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除