自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(133)
  • 收藏
  • 关注

原创 Fastapi参数说明

【代码】Fastapi参数说明。

2024-03-18 11:40:51 441

原创 qwen API调用

【代码】qwen API调用。

2024-03-11 22:20:44 649

原创 python循环读取写入Excel

【代码】python循环读取写入Excel。

2024-03-11 14:37:33 369

原创 yolov5导出onnx转engine推理

使用上述文章中的代码ONNX转engine速度较慢, engine_file_path需要给出具体名称,如:yolov5_my.engine。pt转engine是先转ONNX,然后再到engine。将TensorRT的的lib加入环境变量中。需要提供配置文件和权重文件,不然导出模型不能正常推理。在win11系统环境path添加。

2024-02-22 10:49:11 1084

原创 yolov5三种TensorRT推理过程

4、把生成的yolov5l_best.wts文件导入\tensorrtx-yolov5-v5.0\yolov5\build\Release文件下,使用指 令yolov5.exe -s yolov5l_best.wts yolov5l_best.engine l 通过yolov5.exe生成yolov5l best.engine,参数l根据训练模型来改,可以是s\m\I\x。

2024-02-20 14:59:04 448

原创 基于Python的paddleocr推理环境列表

基于Python的paddleocr推理环境列表,

2024-02-19 17:22:47 469

原创 pip安装paddlepaddle报错ERROR: Could not install packages due to an OSError

这个问题是由于Windows系统路径长度限制导致的。在Windows中,单个文件路径的最大长度有限制(默认为260个字符),这可能会在你尝试安装某些Python包时导致问题,特别是当这些包的路径非常深或包含许多子目录时。

2024-02-19 17:20:38 788

原创 目标检测一般性问题

是衡量二分类模型精度的一种指标,兼顾了分类模型的精确率和召回率。它是精确率和召回率的调和平均数,最大为1,最小为0。但是还要考虑模型的泛化能力,F1-score过高但不能造成过拟合,影响模型的泛化能力。IoU也称作交并比,评价边界框正确性的度量指标,表示detection box(检测框)与ground truth(真实标签)的交集和并集的比值。FP:IoU

2024-02-18 11:20:33 555

原创 人生有感触才能对话苏东波

苏轼诗和词的表面不是他高度的提现,背后折射他对当时处境的态度才是千百年来人们对他的喜爱和追捧。想来我在这个年纪也是什么都说不出来,小时候这个园子还不是免费的,每次路过门口,我最好奇的是门口的两个石狮子嘴里的球是怎么放进去的的。后来园子开放了,来了好几次,想在这个不大的园子里看看有没有新发现,当然,还会背几首苏轼的诗词满足自己爱炫耀的虚荣心。看完纪录片千古风流人物后,这些千古留名的大人物的才华,家室,地位在当时都是普通人望尘莫及的,但是他们的一生中总有各种遗憾,其中那些有着远大抱负的人,大抵都是郁郁不得志。

2024-02-14 21:13:14 337

原创 PP-PicoDet注意版面分析模型的结果导出

使用轻量模型PP-PicoDet检测模型实现版面各种类别的检测。

2024-02-02 15:02:56 409

原创 阿里云a10GPU,centos7,cuda11.2环境配置

【代码】阿里云a10GPU,centos7,cuda11.2环境配置。

2024-02-02 14:26:57 959

原创 centos gcc4.8升级8

【代码】centos gcc4.8升级8。

2024-02-01 14:22:03 667

原创 Failed to build lap ERROR: Could not build wheels for lap, which is required to install pyproject.to

pip安装paddledet,报错。

2024-02-01 14:10:21 575

原创 关于paddleocr的predict_system按高度顺序画图

关于paddleocr的predict_system按高度顺序画图,(coco格式)

2024-01-30 13:45:52 421

原创 PaddleDetection的推理图像发生旋转

读取时发生旋转,修改一下代码。

2024-01-28 17:41:11 709

原创 Citrix找不到ICAWebWrapper.msi所在的文件夹的路径

首先解压Citrix Receiver.exe,然后在里面找到。这个东西,将放入上图中找不到的路径下可以解决这个上述问题。在Citrix Workspace启动虚拟机是出现。

2024-01-10 10:43:23 671

原创 使用python获取URL图像

使用python获取URL图像。

2024-01-09 17:43:11 430

原创 读取程序所在位置

希望在不同目录下调用python程序,不会影响程序中模型的调用。这样无论从哪里调用程序都不会影响程序内部调用外部模型。

2024-01-09 17:38:26 286

原创 关于json.dumps()写入文件时是utf8

json.dumps()中设置ensure_ascii=False,结合open函数中的encoding='utf-8',json.dumps()默认情况下,该函数会自动处理Unicode编码。不要直接在json.dumps()设置encoding='utf-8',

2024-01-09 13:30:20 811

原创 paddleocr文字识别变迁

对于标准的 DML 策略,蒸馏的损失函数仅包括最后输出层监督,然而对于 2 个结构完全相同的模型来说,对 于完全相同的输入,它们的中间特征输出期望也完全相同,因此在最后输出层监督的监督上,可以进一步添 加中间输出的特征图的监督信号,作为损失函数,即 PP-OCRv2 中的 U-DML (Unified-Deep Mutual Learning) 知识蒸馏方法。在L2正则化的帮助下, 网络的权重趋向于选择一个较小的值,最终整个网络中的参数趋向于0,从而缓解模型的过拟合问题,提高 了模型的泛化性能。

2023-12-06 10:49:01 957

原创 paddleocr文本检测改进变迁

知识蒸馏的方法在部署中非常常用,通过使用大模型指导小模型学习的方式,在通常情况下可以使得小模型 在预测耗时不变的情况下,精度得到进一步的提升,从而进一步提升实际部署的体验。标准的蒸馏方法是通过一个大模型作为 Teacher 模型来指导 Student 模型提升效果,而后来又发展出 DML 互 学习蒸馏方法,即通过两个结构相同的模型互相学习,相比于前者,DML 脱离了对大的 Teacher 模型的依赖, 蒸馏训练的流程更加简单,模型产出效率也要更高一些。FPGM与基于范数的裁剪算法的对比如下图所示。

2023-12-04 17:46:36 1187

原创 paddleocr笔记

版面分析任务中,图像首先经过版面分析模型,将图像划分为文本、表格、图像等不同区域,随后对这些区域分别进行识别,如,将表格区域送入表格识别模块进行结构化识别,将文本区域送入OCR引擎进行文字识别,最后使用版面恢复模块将其恢复为与原始图像布局一致的word或者pdf格式的文件;关键信息抽取任务中,首先使用OCR引擎提取文本内容,然后由语义实体识别模块获取图像中的语义实体,最后经关系抽取模块获取语义实体之间的对应关系,从而提取需要的关键信息。从算法改进思路来看,对系统中的3个关键子模块,共进行了8个方面的改进。

2023-11-27 15:50:22 1694

原创 paddleocr的cpp_infer在Liunx下编译部署

【代码】paddleocr的cpp_infer在Liunx下编译部署。

2023-11-22 15:03:20 1021

原创 opencv4笔记

它的成立条件是假设直方图最大波峰在靠近最亮的一侧,然后通过三角形求得最大直线距离,根据最大直线距离对应的直方图灰度等级即为分割阈值。,计算简单,不受图像亮度和对比度的影响,它是按图像的灰度特性,将图像分成背景和前景两部分。,当部分前景错分为背景或部分背景错分为前景都会导致两部分差别变小。适用于光照不均衡以及更加复杂的情况下。,由大津于1979年提出,被认为是。大津法OSTU阈值类型——该方法是使用直方图数据,

2023-11-09 11:33:12 249

原创 对比学习(contrastive Learning)

自监督学习又可以分为对比学习(contrastive learning)和生成学习(generative learning)两条主要的技术路线。比学习的核心思想是将正样本和负样本在特征空间对比,从而学习样本的特征表示,使得样本与正样本的特征表示尽可能接近。正样本和负样本是使用代理任务(pretext task)来定义的. 代理任务定义了样本之间的相似性,给定一个样本,与之相似的样本就是正样本,而不相似的样本就是负样本.。

2023-11-02 10:59:12 196

原创 win yolov5.7 tensorRT部署推理

在debug下报错:错误 LNK1104 无法打开文件“python310_d.lib”环境中没有安装python的debug版本,换成release环境。找到TensorRT-8.6.1.6\python/python/tensorrt-8.6.1-cp39-none-win_amd64.whl。下载tensorrt8.xx版本,适用于Windows的cuda11.x的版本。torch的版本要和CUDA一致,CUDA是11.7,

2023-10-20 10:19:05 116

原创 目标检测应用场景和发展趋势

上下文信息利用:由于视频相较于单张图片多了一个时间维度上的信息,因此如何有效地利用这些时间上下文信息来提高检测性能,是视频检测面临的一个重要问题。运动变化处理:视频中的目标检测需要在静态图像目标检测的基础上对目标因运动产生的各种变化进行处理。目标检测的未来是什么?- 知乎 (zhihu.com)2 与AutoML结合的目标检测。3 领域自适应的目标检测。7 信息融合目标检测。

2023-10-18 14:36:23 977

原创 大模型相关基础(基于李沐)

ChatGPT用到的技术和InstructGPT一样的技术,区别是InstructGPT是在GPT3上微调,ChatGPT是在GPT3.5上微调。InstructGPT论文发表在2022年3月4号,标题是《训练语言模型使得它们能够服从人类的一些指示》。标题解释:语言模型是每次给定一段东西,然后去预测下一个词,是一个自监督学习,是没有标注的。如果你想让语言模型去解释费马小定理,那么你的训练文本中需要出现过相关的内容。训练的文本是几百亿这个数量级,你不知道里面会有什么东西,只能全送进去期待大力出奇迹。

2023-10-18 10:55:04 149

原创 PaddleOCR训练、测试文档

如图1-1,数据集需要提供train_list.txt,和val_list.txt,具体内容如图1-2,修改配置文件位置图1-3。环境使用anconda创建了”paddle”的虚拟环境,该环境适合paddleOCR。图1-2 train_list.txt,和val_list.txt具体内容。图1-3 修改配置文件位置。编译前,需要注意替换。

2023-09-07 15:57:04 727

原创 UOS系统下fastdeploy推理

在Github或者gitee 查阅PaddlePaddle/FastDeploy 的相关文档。

2023-09-07 15:17:38 324

原创 申威芯片UOS中opencv DNN部署推理

【代码】申威芯片UOS中opencv DNN推理。

2023-09-07 15:09:38 642

原创 3种轻量化框架总结

ShuffleNetV1认为在轻量级网络中,过多的使用1x1卷积导致严重损害网络的准确性,将1x1卷积替换为分组卷积,分组卷积就是将输入特征图分成不同的组,每个组由单独的卷积核进行组内做卷积,如图2-13所示,图中分组卷积,表示特征图只和对应的卷积核做卷积。普通卷积的卷积核是直接用在所有的输入通道上,而深度卷积分为两部分进行计算,首先按照通道分别对特征图分别进行卷积,并将输出特征图进行拼接,随后使用逐点卷积进行通道卷积得到特征图,逐点卷积是卷积核为1x1的卷积,通道数和输入特征图一致。对于空间下采样操作,

2023-09-07 13:54:07 643

原创 一、数据集收集思考,以目标检测方法实现缺陷检测为背景

有的属于损坏缺陷需要剔除。但是在标注过程中这些缺陷大小,位置都是随机的,这给标注带来很大的调整。长久以来,我们的标注工作和提供数据人员是分开的,这有一定合理性,工厂的员工大概率不会标注,会标注的又不理解缺陷分类,这给标注的准确性带来很大的挑战,双方理解对方的工作很重要,但是大多数情况下,延续之前软件开发的流程,由双方负责人对接需求,过去这种模式确实很高效,即便调整也是逻辑调整,但是面对数据集驱动开发这种模式是不适宜的,事情经过多轮传递,到最后标注的时候已经不是很清楚了,一旦修改基本等于推导重来,费时费力。

2023-09-01 09:50:30 103

原创 基于paddleocr的版面分析

文本识别:SVTR_LCNet(将基于Transformer的SVTR网络和轻量级CNN网络PP-LCNet 融合的一种轻量级文本识别网络)英文:publaynet数据集的训练集合中包含35万张图像,验证集合中包含1.1万张图像。PubTabNet数据集的训练集合中包含50万张图像,验证集合中包含0.9万张图像。验证集未给出可训练的标注。中文:CDLA据集的训练集合中包含5000张图像,验证集合中包含1000张图像。数据集:ICDAR 2015 数据集包含1000张训练图像和500张测试图像。

2023-08-23 20:27:53 1055

原创 笔记:transformer系列

这是对不同长度的单词维度进行扩展,但是对于图像或者其他类别而言未必是最后一个维度大小不一致,可以参考ViT将nn.embeding换成nn.Linear,还需要修改mask.自注意力机制适合处理长文本,并行度好,在GPU上,CNN和Self-attention性能差不多,在TPU(Tensor Processing Uni)效果更好。且范围在[0,100]之间(试出来的,未必准确),原生的Transformer中。

2023-08-23 19:38:14 563

原创 yolov5读取单通道图像会怎样?

通过上图打印可知输入是固定3通道,那么意味着在读取图像中会对图像进行处理。

2023-05-05 15:54:51 1197 1

原创 yolov5和yolov3参数差异的主要原因是C3使用CSPNet

在C3的实现中,进入Bottleneck之前对输入使用1x1卷积实现通道方向降维,将输入的计算量减少。这也是CSPnet所说的。对比上面两张图,第一张是YOLOv5,第二张是YOLOv3,两者参数量主要的差异在C3和Bottleneck.yolov5和yolov3参数差异的主要原因是C3使用CSPNet。减少计算量的同时实现更丰富的梯度组合.

2023-05-05 14:48:15 329 1

原创 Cmake笔记

【代码】Cmake笔记。

2023-03-30 17:47:18 202

原创 傅里叶变换

卷积的目的就是将一个像素和周围其他像素的关系浓缩成一个点的信息。图像特征:一个像素和周围其他像素的关系。

2022-11-15 11:26:55 71

原创 目标跟踪结果展示和保存图片

【代码】目标跟踪结果展示和保存图片。

2022-09-24 16:10:53 777

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除