人工智能_SYBH-CSDN博客

原创 2024年车辆检测+车距检测+行人检测+车辆识别+车牌识别+车距预测（附yolo v5最新版源码）

运用yolov5进行车距检测，车辆识别，行人识别，车牌检测！

2023-01-12 22:41:44 14705 45

原创计算机二级C语言题库（60套真题+刷题软件）2024年新题第二套

1、在数据库的三级模式中,外模式（用户模式或子模式）_____。A. 只有3个B. 只有2个C. 可以有任意多个D. 只有1个本题考查的知识点是数据库设计基础。外模式也称子模式或用户模式。它是用户的数据视图，也就是用户所见到的数据模式，它由概念模式推导而出。概念模式给出了系统全局的数据描述而外模式则给出每个用户的局部数据描述。一个概念模式可以有若干个外模式，每个用户只关心与它有关的模式，这样不仅可以屏蔽大量无关信息而且有利于数据保护。所以本题答案为C。2、在商场购物时,顾客可以购买不同的商品,而同样的商品也

2022-10-08 23:02:34 26797

原创 AI识别教程 yolov5 （穿越火线，csgo等FPS游戏识别）

该程序不需要用游戏内存数据，也不往服务器发送作弊指令，只是通过计算机视觉来分析游戏画面，定位敌人，把准星移动过去，跟人类玩家操作一模一样，因此反外挂程序无法检测到它。而且更恐怖的是这AI程序全平台通用，把操作送进去，就可以实现“枪枪爆头”。.....................

2022-04-29 19:27:35 37639 68

原创 2024 华中杯数学建模 A 题太阳能路灯光伏板的朝向设计问题思路+matlab代码+python代码

每个比赛的思路都会发布到本专栏，订阅一次永久观看所有比赛！！！本次 “华中杯”只有chatgpt-4的思路和代码，没有论文，内容一般，请不要盲目订阅！！！：太阳在地平线上的位置高度角，是太阳直射线与地平面的夹角。它是根据地球所在位置的纬度、时间和日期计算的。一般用符号θ表示。：太阳在地平线上的水平方向角度。以南方向为基准，向东为正，向西为负。一般用符号α表示。：指直接来自太阳的辐射，没有经过大气层的散射和吸收，是最强的太阳辐射。通常以单位面积上接收到的能量来表示，单位是W/m^2。：包括方位角和水平仰角。

2024-04-19 09:53:40 78

原创 2024 华中杯数学建模 B 题使用行车轨迹估计交通信号灯周期问题思路+matlab代码+python代码

每个比赛的思路都会发布到本专栏，订阅一次永久观看所有比赛！！！本次 “华中杯”只有chatgpt-4的思路和代码，没有论文，内容一般，请不要盲目订阅！！！首先，需要分析车辆在经过信号灯时的停车和通过情况，这可以通过轨迹数据的速度变化来实现。在每个路口，找到车辆停车的频率，然后观察停车时长的分布情况。停车时长的周期性变化可能反映了信号灯的周期。例如，停车时长在一个特定范围内集中，可能代表车辆在等待红灯。根据这些信息，可以尝试估计信号灯的周期。

2024-04-19 09:28:49 191

原创 2024 华中杯数学建模 C 题基于光纤传感器的平面曲线重建算法建思路+matlab代码+python代码

这段 MATLAB 代码首先计算了测试 1 和测试 2 的曲率，然后根据给定的初始点坐标、初始的水平光纤方向和垂直方向，以及光纤在平面内受力后在初始位置的切线与水平方向的夹角，计算了横坐标 x 轴相应位置处的曲率。本次 “华中杯”只有chatgpt-4的思路和代码，没有论文，内容一般，请不要盲目订阅！然后以采样的曲率为基础，构建数学模型，重构平面曲线，并分析重构曲线与原始曲线出现误差的原因。问题二要求根据波长测量数据和问题一中求出的曲率，构建数学模型来重构平面曲线，并分析曲线的特点。

2024-04-19 09:16:29 340

原创 python 隐藏QT窗口边框并且在隐藏后实现窗口拖拽

方法来设置窗口的属性，以及通过重写鼠标事件来实现拖动功能。在这个示例中，我们创建了一个继承自QWidget的CustomWindow类。块中，我们创建了应用程序对象，实例化了CustomWindow类，并显示了窗口。要隐藏Qt窗口的边框并实现窗口拖动，你可以使用Qt的。方法计算鼠标移动的距离，并相应地移动窗口。方法记录了鼠标按下时的位置，而。方法来实现窗口的拖动功能。方法来设置窗口属性，使用。参数来隐藏窗口边框。

2024-04-18 09:50:15 314

原创 2024年 MathorCup 数学建模 B 题甲骨文智能识别中原始拓片单字自动分割与识别研究思路代码论文

第一问思路：首先，读取附件1中给定的三张甲骨文原始拓片图片。：将彩色图像转换为灰度图像，简化后续处理步骤。：使用图像去噪技术（如高斯滤波、中值滤波）去除图像中的噪声，提高后续处理的准确性。：应用边缘检测算法（如Canny边缘检测）突出甲骨文的边缘特征，有助于后续的分割。：根据甲骨文与背景的对比度，可以尝试简单阈值分割或更复杂的分割算法（如基于区域的分割、基于边缘的分割），将甲骨文与背景分离。：从分割后的甲骨文图像中提取特征，可以考虑使用传统的图像特征（如形状、纹理特征）或者使用深度学习模型提取特征。

2024-04-12 10:07:28 2581 2

原创 2024 年“认证杯”数学中国数学建模网络挑战赛第一阶段 D题 AI 绘画带来的挑战思路+代码

从简单的几何角度出发，我们可以检查图像中的几何形状和结构，以找到不符合逻辑的地方。比例检查：检查建筑物中的不同部分的比例是否符合常规的建筑设计。例如，楼层之间的高度比例、窗户的大小与楼层的比例等。角度检查：检查图像中的线条和角度是否符合几何规律。例如，检查建筑物的支撑柱是否垂直、楼梯的倾斜度是否合理等。对称性检查：检查建筑物的对称性，包括水平和垂直方向的对称性。统的美术设计类赛事组织方来说，AI 绘画技术就带来了评奖公平性的挑战，设计的，所以赛事评奖工作变得异常复杂，当参赛作品较多的时候，很难保证。

2024-04-11 21:40:48 502

原创 2024 年“认证杯”数学中国数学建模网络挑战赛第一阶段 D题 AI 绘画带来的挑战思路+代码

从简单的几何角度出发，我们可以检查图像中的几何形状和结构，以找到不符合逻辑的地方。建立数学模型来评估一幅图片是由 AI 绘图软件生成的可能性需要考虑图像的特征、统计信息以及可能的模式。检查建筑物中的不同部分的比例是否符合常规的建筑设计。例如，楼层之间的高度比例、窗户的大小与楼层的比例等。例如，检查建筑物的支撑柱是否垂直、楼梯的倾斜度是否合理等。检查建筑物的对称性，包括水平和垂直方向的对称性。AI 绘画技术可以模仿设计师的风格和技巧，首先，我们可以提取图像的一些基本特征，如颜色分布、线条密度、纹理等。

2024-04-11 21:37:09 237

原创 2024 年“认证杯”数学中国数学建模网络挑战赛 C题云中的海盐思路+代码+论文

海面上空以及低层海云内喷洒雾化的海水可以起到降低海面接收到的日光辐射量的效应。这是因为喷洒海水形成的海盐气溶胶和水滴会增加云层的反照率，即云层更有效地反射太阳光，减少了地表接收到的日光辐射量。总的来说，海水喷洒海盐气溶胶的效应受到多个因素的影响，需要综合考虑这些参数才能准确评估其对海面接收到的日光辐射量的影响程度。海水喷洒量和喷洒范围：海水喷洒量越大，喷洒范围越广，形成的海盐气溶胶和水滴数量就越多，效应就越显著。云层特性：包括云层的厚度、密度、高度等，不同特性的云层对太阳光的反射效果不同。

2024-04-11 21:29:26 894

原创 2024 年“认证杯”数学中国数学建模网络挑战赛 C题云中的海盐

通常情况下，云层的反射率是一个复杂的参数，受到云的类型、厚度、密度等因素的影响。由于建立一个完整的气候模型需要考虑到地球系统的复杂性，包括大气、海洋、陆地等多个方面的相互作用，因此我们将简化这个过程，使用一个现有的气候模型来进行模拟。要定量估计实施海水喷洒工程后海面接收到的日光辐射量的降低，我们需要建立一个数学模型，考虑到海水喷洒后形成的海盐气溶胶和水滴对太阳光的反射作用。在这种模拟中，我们可以将海水喷洒工程对太阳辐射的反射效应作为一个外部输入，并观察其对全球气候的影响，包括全球平均温度的变化。

2024-04-11 21:26:16 526

原创 2024 年“认证杯”数学中国数学建模网络挑战赛 A题保暖纤维的保暖能力思路+代码+论文

环保性（Environmental Friendliness）：评估保暖材料的生产过程对环境的影响，以及材料的可再生性和可回收性。热阻值（Thermal Resistance）：热阻值是指材料单位面积内的热阻力，反映了材料对热传导的阻碍程度。成本效益（Cost-effectiveness）：考虑保暖材料的成本与性能之间的平衡，以及长期的使用成本。3. 在第 2 问的基础上，请根据你定义的指标，根据典型的棉花和羽绒的微。人们以往的经验表明，高品质的羽绒具有非常优秀的保暖性能，所以在极寒。

2024-04-11 21:17:57 1225

原创 2024 年“认证杯”数学中国数学建模网络挑战赛 B题神经外科手术的定位与导航思路+论文+代码

在模拟过程中，会计算脑组织的应力、应变等力学参数，并根据施加的边界条件计算脑组织的变形情况。网格的密度会影响模拟结果的准确性，需要根据实际情况进行调整。边界条件：根据术前测量的颅内压数据，设置施加在脑组织表面的压力载荷。织是柔软的，所以脑组织会产生一定程度的变形、移位，甚至在一定程度上膨。位，需要复杂的设备，术者也需经过特殊的训练，这都使得此类手术尚未完全。注：如果在建模的过程中，术中的颅内压对改善模型精度没有用处，那么这两。这种牵拉和移位的幅度不能太大，而且具有损伤脑组织的风险。

2024-04-11 21:15:49 606

原创 2024 年“认证杯”数学中国数学建模网络挑战赛 B题神经外科手术的定位与导航思路+论文+代码

虽然无法直接测量颅内压，但我们可以假设脑组织具有一定的弹性特性。根据文献或者实验数据，选择合适的弹性模量、泊松比等材料参数。可以参考已有的研究成果或者医学文献来确定这些参数。

2024-04-11 21:14:04 100

原创 2024 年“认证杯”数学中国数学建模网络挑战赛 A题保暖纤维的保暖能力思路+代码+论文

专栏内含有含有认证被思路和代码。class InsulationMaterial: def __init__(self, density, thermal_conductivity, moisture_absorption, durability): self.density = density # 密度 (g/cm^3) self.thermal_conductivity = thermal_conductivity # 热导率 (W/mK) s

2024-04-11 20:33:03 1330

原创在自定义数据集中训练 YoloV9

【代码】在自定义数据集中训练 YoloV9。

2024-04-11 14:07:25 771

原创使用Ultralytics YOLO进行模型训练

训练深度学习模型包括向其输入数据并调整其参数，以便它可以做出准确的预测。Ultralytics YOLOv8中的训练模式旨在充分利用现代硬件功能，有效和高效地训练对象检测模型。本指南旨在涵盖使用YOLOv8的强大功能开始训练自己的模型所需的所有细节。

2024-04-11 13:50:41 932

原创 2024数学建模天府杯 B 题：新质生产力引领下的企业生产与发展策略优化思路

解决方案：建立评估体系，评价不同新技术对企业生产效率、产品质量、成本节约和市场竞争力的影响。解决方案：结合新技术发展趋势和行业竞争环境，制定长期的技术更新和业务发展规划。解决方案：设计风险评估模型和风险管理策略，包括技术、市场、管理等方面的风险。[0.8, 0.7, 0.9, 0.6], # 技术A。[0.7, 0.6, 0.8, 0.5], # 技术B。[0.9, 0.8, 0.7, 0.7] # 技术C。# 假设有三种新技术，分别用A、B、C表示，建立评估指标矩阵。# 找出得分最高的技术。

2024-03-29 09:03:04 433

原创在Pycharm中将.ui文件转换为.py文件，以及pyqt5安装

测试一下是否成功，找一个ui文件，右击找到External Tools 就会看当刚才配置的拓展工具，最后点击PyUIC就会出现对应的.py文件，file->Settings->Project->Python Interpreter 点+号，搜索pyqt5然后点安装。file->Settings->Tools->External Tools，添加，配置如下图所示。program：如何找自己电脑中pyuic5.exe在哪？在pycharm中通过拓展工具将.ui文件转为.py文件。最后点确定，应用就ok了！

2024-03-28 17:18:28 321

原创 YOLOv8入门教程：手把手教学实现实时车辆检测+车牌识别

对于每一帧图像，我们将其预处理为YOLOv8所需的输入格式，并通过YOLOv8网络进行目标检测。然后，我们将检测结果绘制在原始图像上，并实时显示。相较于前代YOLO版本，YOLOv8在检测速度和准确率上取得了显著的提升。本教程为您提供了一个简单的YOLOv8实时目标检测示例。摘要：在本教程中，我们将介绍YOLOv8的基本概念和原理，然后用Python实现一个简单的实时目标检测应用。本教程将使用Python和OpenCV实现一个简单的实时目标检测应用。在上述代码中，我们使用OpenCV库的。

2024-03-26 17:20:29 661

原创 yolov5车辆识别+行人识别+车牌识别+车速检测代码（python）

行人识别yolov5和v7对比yolo车距yolo车距1。

2024-03-26 17:14:06 722

原创穿越火线 Ai实现FPS游戏自动瞄准 yolov5深度学习 fps自瞄

需要了解的东西和可能会遇到的问题1.xy坐标点与当前鼠标的xy坐标点距离计算2.获取窗口句柄，本文使用的是根据窗口名称获取句柄3.推理方式：本文使用的是GPU(为啥呢？4.屏幕宽高获取和敌人坐标获取和计算哪个是最近的敌人并控制鼠标去敌人身上和头上。第三个参数，y轴相对移动的距离：敌人y坐标 - (屏幕高度 - (敌人最大y坐标 - 敌人最小y坐标) / 2)第一个参数，先设定鼠标的行为：使用相对移动，为什么不用绝对移动呢，因为绝对移动在游戏里是无效的。2.获取窗口句柄，本文使用的是根据窗口名称获取句柄。

2024-03-26 17:12:19 442

原创基于YOLOv5深度学习的车牌识别

yolov5车牌识别+车辆识别行人识别yolov5和v7对比。

2024-03-26 17:08:37 903

原创 2024年车辆检测+车距检测+行人检测+车辆识别+车牌识别+车距预测（附yolo v5最新版源码）

TensorFlow是一个开放源代码软件库，用于进行高性能数值计算。借助其灵活的架构，用户可以轻松地将计算工作部署到多种平台（CPU、GPU、TPU）和设备（桌面设备、服务器集群、移动设备、边缘设备等）。TensorFlow 是一个用于研究和生产的开放源代码机器学习库。TensorFlow 提供了各种 API，可供初学者和专家在桌面、移动、网络和云端环境下进行开发。

2024-03-26 17:06:08 792

原创 AI识别教程 yolov5 穿越火线，csgo等FPS游戏识别，角色识别

我们本次只是识别穿越火线中的人物，还没有实现自动瞄准，我只用了一百张图片进行预测，预测效果不是很好，你可以增加些图片进行训练。后期还会更新！！！！！！！！！！！！！！！！！！！

2024-03-26 17:03:30 1240

原创手把手制作温湿度上位机(串口通信) 超详细代码可远程部署

self.queue_recv.put(["当前温度为："+str(int(return_data_hex[6:10], 16) / 10)+"°C"+"\n"+"当前湿度为："+str(int(return_data_hex[10:14], 16) / 10)+"%"+"\n"+self.btn_baud_set.setText(_translate("MainWindow", "修改"))self.btn_send.setText(_translate("MainWindow", "开始/停止"))

2024-03-22 14:21:19 1048

原创上位机开发(一) —— python Qt RS485数码管温湿度通讯串口工具

self.queue_recv.put(["当前温度为："+str(int(return_data_hex[6:10], 16) / 10)+"°C"+"\n"+"当前湿度为："+str(int(return_data_hex[10:14], 16) / 10)+"%"+"\n"+print("当前湿度为：", int(return_data_hex[10:14], 16) / 10)print("当前温度为：", int(return_data_hex[6:10], 16) / 10)

2024-03-22 09:52:29 831

原创 2024年中国高校大数据挑战赛第二场 D题：行业职业技术培训能力评价思路+python代码+论文

数据探索与可视化:开始通过对数据的初步探索，使用统计描述和可视化工具，例如散点图、箱线图、相关性矩阵等，来了解不同技能考核成绩的分布和离校成绩之间的关系。如果使用机器学习模型，解释模型的结果，了解哪些技能对于离校成绩的影响最大，以及它们之间的关系。1. 一般而言，入学的各技能考核成绩与对应的离校考核成绩绩可能存在着或多或少或无的关联性。1. 般而言，入学的各技能考核成绩与对应的离校考核成绩绩可能存在着或多或少或无的关联性。熟的技术工人进入工厂。绩不仅仅是由于培训学校的培训能力导致的，还有学员的素质等其他。

2024-03-09 11:17:47 941

原创 2023年中国高校大数据挑战赛第二场 D题：行业职业技术培训能力评价思路+python代码

2024-03-09 11:16:10 789

原创 2024年中国高校大数据挑战赛 D题：行业职业技术培训能力评价思路+python代码

计算不同技能考核成绩与离校成绩之间的相关系数。correlation_matrix = data[['入学技能1', '入学技能2', '入学技能3', '入学技能4', '入学技能5', '离校成绩']].corr()sns.pairplot(data[['入学技能1', '入学技能2', '入学技能3', '入学技能4', '入学技能5', '离校成绩']])features = ['入学技能1', '入学技能2', '入学技能3', '入学技能4', '入学技能5', '总分', '学校类型']

2024-03-09 11:12:10 91

原创 2023年中国高校大数据挑战赛第二场赛题C：用户对博物馆评论的情感分析思路、python代码

问题 1：针对每位用户的评论，建立情感判别模型，判断评论内容的情感正反方向，输出评论内容的情感方向为正面、中立、负面，并统计每个博物馆历史评论各个方向情感的比例分布情况。符合等等影响情感方向的指标，建立情感得分评价模型，得到每位用户评论的情感得分，并基于得分对五个博物馆进行客观排名。挖出来的，不错“，可得知该评论为正面情感，影响其正面评价的是”容的情感正反方向，输出评论内容的情感方向为正面、中立、负面，好多是最近房地产开发盖新房子时新。问题 1：针对每位用户的评论，建立情感判别模型，判断评论内。

2024-03-09 10:51:09 1172

原创 2024 年中国高校大数据挑战赛第二场 C题：用户对博物馆评论的情感分析思路+python代码

2024-03-09 10:49:31 1002

原创 2024 年中国高校大数据挑战赛 C题：用户对博物馆评论的情感分析思路+python代码

问题 1：针对每位用户的评论，建立情感判别模型，判断评论内容的情感正反方向，输出评论内容的情感方向为正面、中立、负面，并统计每个博物馆历史评论各个方向情感的比例分布情况。data['情感得分'] = data['评论'].apply(lambda x: sia.polarity_scores(x)['compound'])data['实体'], data['事件'] = zip(*data['评论'].apply(extract_entities_and_events))

2024-03-09 10:43:24 115

原创 2024年YOLOv5环境准备、配置文件说明、预测部署、参数介绍、车辆检测、车辆跟踪、属性识别、车牌识别、违章停车识别

车辆检测yolov5车辆识别视频车牌识别视频yolov5 yoloR对比行人车辆识别视频。YOLOv5环境准备、配置文件说明、预测部署、参数介绍、车辆检测、车辆跟踪、属性识别、车牌识别、违章停车识别

2024-03-05 11:36:41 1188 10

原创 YOLOv5环境准备、配置文件说明、预测部署、参数介绍、车辆检测、车辆跟踪、属性识别、车牌识别、违章停车识别

2024-03-05 11:32:35 74

原创 PP-Vehicle违章停车识别模块 YOLOv5/YOLOv9 更新行人识别、车辆检测、车距检测、车牌识别、车辆跟踪、属性识别、违章停车识别

禁停区域违章停车识别在车辆应用场景中有着非常广泛的应用，借助AI的力量可以减轻人力投入，精准快速识别出违停车辆并进一步采取如广播驱离行为。

2024-03-02 16:01:33 660

原创 YOLOv5 PP-Vehicle车牌识别模块更新(行人识别、车辆检测、车距检测、车牌识别、车辆跟踪、属性识别、违章停车识别)

YOLOv5 PP-Vehicle车牌识别模块更新(行人识别、车辆检测、车距检测、车牌识别、车辆跟踪、属性识别、违章停车识别)

2024-03-02 15:19:15 1091

原创 YOLOv9车辆检测+车距检测+车牌识别+车道识别+行人识别

该项目仅使用视觉传感器即可实现 FCWS、LDWS 和 LKAS 功能。使用 YOLOv5 / YOLOv5-lite / YOLOv8 / YOLOv9 和 Ultra-Fast-Lane-Detection-v2。将模型转换为使用 float16 而不是 float32 可以减小模型大小。注：可支持onnx/tensorRT格式模型。但需要匹配相同的型号类型。

2024-03-02 14:28:54 1276

原创毕业设计:基于微信小程序的在线学习平台的设计与实现

设计和实现基于微信小程序的在线学习平台涉及到前端和后端的开发，以及数据库的设计。

2024-02-28 16:44:28 666

Squeezed Edge YOLO：边缘设备上的板载对象检测

由于其在自主导航中的关键作用，对高效车载物体检测的需求正在增加。然而，由于 YOLO 等资源受限的边缘设备上的计算要求很高，因此在此类模型上部署此类检测模型具有挑战性。本文研究了一种名为Squeezed Edge YOLO的压缩目标检测模型。该模型被压缩和优化为千字节的参数，以适应此类边缘设备的板载。为了评估 Squeezed Edge YOLO，使用了两个用例 - 人体和形状检测 - 来展示模型的准确性和性能。此外，该模型还部署在具有 8 个 RISC-V 内核的 GAP8 处理器和具有 4GB 内存的 NVIDIA Jetson Nano 上。实验结果表明，Squeezed Edge YOLO模型尺寸优化了8倍，能效提高了76%，整个过程提高了3.3倍。

2024-04-11

奥地利自动驾驶深度学习视觉模型YOLO和DETR的首次定性观察

本研究探讨了单阶段和两阶段二维目标检测算法的应用，如你只看一次（YOLO）、实时设计模型（RT-DETR）算法在自动物体检测中的应用，以提高奥地利道路上自动驾驶的道路安全性。YOLO算法是一种最先进的实时物体检测系统，以其效率和准确性而闻名。在驾驶环境中，其快速识别和跟踪物体的潜力对于高级驾驶辅助系统（ADAS）和自动驾驶汽车至关重要。该研究的重点是奥地利的道路状况和交通情况带来的独特挑战。该国多样化的景观、不同的天气条件和特定的交通法规需要一种量身定制的方法来进行可靠的物体检测。该研究利用了一个选择性数据集，包括在奥地利道路上拍摄的图像和视频，包括城市、农村和高山环境。

2024-04-11

使用YOLO从SDSS图像中检测到边缘低表面亮度星系候选星系

低表面亮度星系（LSBG）是星系群中较暗的成员，被认为是众多的。然而，由于它们的表面亮度低，寻找广域LSBGs样本是困难的，这反过来又限制了我们充分了解星系的形成和演化以及星系关系的能力。边缘LSBG由于其独特的方向，为研究星系结构和星系成分提供了极好的机会。在这项工作中，我们利用You Only Look Once目标检测算法，通过在斯隆数字巡天（SDSS）中训练281个边缘LSBG来构建边缘LSBG检测模型gri-波段合成图像。该模型在测试集上的召回率为94.64%，纯度为95.38%。我们搜索了 938,046gri来自 SDSS 数据发布 16 的波段图像，发现了 52,293 个候选 LSBG。为了提高候选LSBG的纯度并减少污染，我们采用了深度支持向量数据描述算法来识别候选样品中的异常。最终，我们编制了一个包含 40,759 个边缘 LSBG 候选药物的目录。该样本与训练数据集具有相似的特征，主要由蓝色边缘的 LSBG 候选者组成。该目录可通过此 https URL 在线获取。

2024-04-11

yolo使用TomFormer及早准确检测番茄叶病

番茄叶病对番茄种植者构成了重大挑战，导致作物产量大幅下降。及时准确地识别番茄叶病对于成功实施病害管理策略至关重要。本文介绍了一种基于变压器的模型，称为TomFormer，用于番茄叶病检测。该论文的主要贡献包括以下几点：首先，我们提出了一种检测番茄叶病的新方法，即采用结合视觉转换器和卷积神经网络的融合模型。其次，我们的目标是将我们提出的方法应用于Hello Stretch机器人，以实现番茄叶病的实时诊断。第三，我们通过将我们的方法与 YOLOS、DETR、ViT 和 Swin 等模型进行比较来评估我们的方法，证明其能够实现最先进的结果。为了进行实验，我们使用了三个番茄叶病数据集，即 KUTomaDATA、PlantDoc 和 PlanVillage，其中 KUTomaDATA 是从阿联酋阿布扎比的一个温室收集的。最后，我们对模型的性能进行了全面分析，并彻底讨论了我们方法固有的局限性。TomFormer 在 KUTomaDATA、PlantDoc 和 PlantVillage 数据集上表现良好，平均准确率（mAP）得分分别为 87%、81% 和 83%。mAP的比较结果表明，我们的方法

2024-04-11

具有混合注意力特征金字塔网络的YOLO算法，用于焊点缺陷检测

传统的人工检测焊点缺陷在工业生产中不再适用，因为效率低、评估不一致、成本高、缺乏实时数据。针对工业场景表面贴装技术中焊点缺陷检测精度低、误检率高、计算成本高等问题，提出了一种新的方法。所提出的解决方案是专门为焊点缺陷检测算法设计的混合注意力机制，通过提高精度同时降低计算成本来改善制造过程中的质量控制。混合注意力机制包括一种增强的多头自注意力和协调注意力机制，增加了注意力网络感知上下文信息的能力，并增强了网络特征的利用范围。坐标注意力机制增强了不同通道之间的连接，减少了位置信息丢失。混合注意力机制增强了网络感知远距离位置信息和学习局部特征的能力。改进后的算法模型对焊点缺陷检测具有较好的检测能力，mAP达到91.5%，比“只看一次”第5版算法高4.3%，优于其他对比算法。与其他版本相比，平均平均精度、精度、召回率和每秒帧数指标也有所改进。在满足实时检测要求的同时，可以提高检测精度。

2024-04-11

DiffYOLO：通过YOLO和扩散模型进行抗噪声目标检测

以YOLO系列为代表的目标检测模型得到了广泛的应用，并在高质量的数据集上取得了很好的成绩，但并不是所有的工作条件都是理想的。为了解决在低质量数据集上定位目标的问题，现有方法要么训练新的目标检测网络，要么需要大量低质量数据集进行训练。然而，我们在本文中提出了一个框架，并将其应用于称为 DiffYOLO 的 YOLO 模型。具体来说，我们从去噪扩散概率模型中提取特征图，以增强训练有素的模型，这使我们能够在高质量数据集上微调YOLO，并在低质量数据集上进行测试。结果证明，该框架不仅可以证明在噪声数据集上的性能，还可以证明在高质量测试数据集上的检测结果。我们稍后将补充更多的实验（使用各种数据集和网络架构）。

2024-04-11

YOLOv7无人机实时探测人体

计算机视觉和遥感中最重要的问题之一是物体检测，它可以识别图片中不同事物的特定类别。公共安全的两个关键数据来源是无人驾驶飞行器（UAV）产生的热红外（TIR）遥感多场景照片和视频。由于目标尺度小，场景信息复杂，相对于可观看视频的分辨率较低，并且缺乏公开可用的标记数据集和训练模型，因此其目标检测过程仍然很困难。本研究提出了一种用于图片和视频的UAV TIR目标检测框架。用于收集地面TIR照片和视频的前视红外（FLIR）相机用于创建基于CNN架构的“你只看一次”（YOLO）模型。结果表明，在验证任务中，使用YOLOv7（YOLO版本7）最先进的模型\cite{1}，检测人体的平均精度为IOU（Intersection over Union）= 0.5，为72.5%，而检测速度约为161帧/秒（FPS/秒）。该应用展示了YOLO架构的实用性，该应用根据YOLOv7模型从各种无人机的观察角度评估了无人机TIR视频中人员的交叉检测性能。本工作对使用深度学习模型的TIR图片和视频目标检测进行定性和定量评估得到了有利的支持。

2024-04-11

使用 YOLO 对牛栏编号进行分类

本文介绍了CowStallNumbers数据集，该数据集是从奶牛视频中提取的图像集合，旨在推进奶牛摊位数量检测领域。该数据集包括 1042 张训练图像和 261 张测试图像，摊位数范围为 0 到 60。为了增强数据集，我们对YOLO模型进行了微调，并应用了数据增强技术，包括随机裁剪、中心裁剪和随机旋转。实验结果表明，识别失速数的准确率为95.4%。

2024-04-11

YOLO-Former：YOLO与ViT握手

所提出的YOLO-Former方法将Transformer和YOLOv4的思想无缝集成，创建了一个高精度、高效率的目标检测系统。该方法利用了 YOLOv4 的快速推理速度，并通过集成卷积注意力和 transformer 模块，融合了 transformer 架构的优势。结果验证了所提方法的有效性，在Pascal VOC数据集上的平均精度（mAP）为85.76\%，同时保持了较高的预测速度，帧速率为每秒10.85帧。这项工作的贡献在于展示了这两种最先进技术的创新组合如何导致目标检测领域的进一步改进。

2024-04-11

使用 YOLOv7 和 ESRGAN 改进坑洼检测

坑洼是常见的道路危险，会对车辆造成损坏并给驾驶员带来安全风险。卷积神经网络（CNN）的引入在业界广泛用于基于深度学习方法的目标检测，并在硬件改进和软件实现方面取得了重大进展。在本文中，提出了一种独特的更好算法，以保证使用低分辨率相机或低分辨率图像和视频源，通过超分辨率生成对抗网络（SRGAN）使用超分辨率（SR）进行自动坑洼检测。然后，我们继续使用 You Only Look Once （YOLO）网络（即 YOLOv7 网络）在低质量和高质量行车记录仪图像上建立基线坑洼检测性能。然后，我们说明并检查了在对低质量图像进行放大实施后，在基准之上获得的速度和准确性。

2024-04-11

基于YOLO的动态序列匹配模型，实现高效的无覆盖图像隐写

许多现有的无封面隐写术方法在封面图像和隐藏数据之间建立了映射关系。存在一个问题，即存储在数据库中的图像数量会随着隐写能力的增加而呈指数增长。对高隐写能力的需求使得构建图像数据库具有挑战性。为了提高隐写系统的图像库利用率和抗攻击能力，我们提出了一种基于动态匹配子串的高效无覆盖方案。YOLO用于选择最优对象，并在这些对象和加扰因子之间建立映射字典。借助该字典，每个图像都被有效地分配给特定的加扰因子，该因子用于加扰接收器的序列键。为了在有限的图像库中实现足够的隐写能力，加扰序列的所有子串都具有隐藏数据的潜力。完成秘密信息匹配后，将从数据库中获得理想数量的stego图像。实验结果表明，该技术在数据负载、传输安全性、隐藏能力等方面优于以往大多数工作。在典型的几何攻击下，它平均可以恢复79.85%的秘密信息。此外，只需要大约 200 个随机图像即可满足每个图像 19 位的容量。

2024-04-11

基于深度学习的综合感知与通信系统中的目标-用户关联

在集成传感和通信（ISAC）系统中，将雷达目标与通信用户设备（UE）相匹配可用于多种通信任务，例如主动切换和波束预测。在本文中，我们考虑了一种雷达辅助通信系统，其中基站（BS）配备了具有双重目标的多输入多输出（MIMO）雷达：（i）将车载雷达目标与通信波束空间中的车载设备（VE）相关联，以及（ii）根据雷达数据预测每个VE的波束成形矢量。建议的目标用户（T2U）关联包括两个阶段。首先，从距角图像中检测车辆雷达目标，并估计每个目标的波束成形矢量。然后，将推断出的每目标波束成形矢量与BS上用于通信的波束成形矢量进行匹配，以执行目标到用户（T2U）关联。通过修改“只看一次”（YOLO）模型，在模拟的距离角度雷达图像上进行训练，从而获得联合多目标检测和波束推理。不同城市车辆出行情景下的仿真结果表明，所提T2U方法提供了随BS天线阵列尺寸增加而增加的正确关联概率，突出了波束空间中VE可分离性的相应增加。此外，我们表明，改进后的YOLO架构可以有效地进行波束预测和雷达目标检测，在不同天线阵列尺寸下，后者的平均精度相似。

2024-04-11

使用基于YOLO的学习方法对农业进行实时目标检测和机器人操作

优化普通种植作物的作物收获过程对于农业产业化的目标具有重要意义。如今，机器视觉的利用使农作物的自动识别成为可能，从而提高了收割效率，但挑战仍然存在。本研究提出了一个新框架，该框架结合了卷积神经网络（CNN）的两个独立架构，以便在模拟环境中同时完成作物检测和收获（机器人操作）的任务。模拟环境中的裁剪图像会进行随机旋转、裁剪、亮度和对比度调整，以创建用于数据集生成的增强图像。“你只看一次”算法框架与传统的矩形边界框一起使用，用于作物定位。随后，所提出的方法通过视觉几何组模型利用获取的图像数据，以揭示机器人操作的抓取位置。

2024-04-11

YOLO-World：实时开放词汇对象检测

You Only Look Once （YOLO）系列探测器已成为高效实用的工具。但是，它们对预定义和训练对象类别的依赖限制了它们在开放场景中的适用性。为了解决这一局限性，我们引入了 YOLO-World，这是一种创新方法，通过视觉语言建模和大规模数据集的预训练，增强了 YOLO 的开放词汇检测功能。具体而言，我们提出了一种新的可重新参数化的视觉-语言路径聚合网络（RepVL-PAN）和区域-文本对比损失，以促进视觉和语言信息之间的交互。我们的方法擅长以零射程、高效率检测各种物体。在具有挑战性的 LVIS 数据集上，YOLO-World 在 V100 上以 52.0 FPS 实现了 35.4 AP，在准确性和速度方面都优于许多最先进的方法。此外，经过微调的 YOLO-World 在多个下游任务上取得了出色的性能，包括对象检测和开放词汇实例分割。

2024-04-11

基于YOLO的红外小目标检测范式

在计算机视觉中，检测红外图像中从小到小的目标是一项具有挑战性的任务，尤其是在将这些目标与嘈杂或有纹理的背景区分开来时。与分割神经网络相比，YOLO 等传统目标检测方法难以检测微小目标，导致检测小目标时性能较弱。为了在保持高检测率的同时减少误报的数量，我们引入了反之亦然YOLO检测器训练的决策标准。后者利用了出乎意料的小目标，以区分他们与复杂背景。将这一统计标准添加到YOLOv7-tine中，弥合了用于红外小目标检测和目标检测网络的最先进的分割方法之间的性能差距。它还显著提高了YOLO在少镜头设置下的鲁棒性。

2024-04-11

使用YOLO v7在磁共振成像中检测肾脏

简介本研究探讨了使用最新的 You Only Look Once （YOLO V7）物体检测方法，通过训练和测试医学图像格式上的改进 YOLO V7，来增强医学成像中的肾脏检测。方法研究纳入878例肾细胞癌（RCC）不同亚型患者和206例肾脏正常患者。共检索到1084例患者的5657次MRI扫描。从回顾性维护的数据库中招募了 326 名患者，涉及 1034 个肿瘤，并在他们的肿瘤周围绘制了边界框。在 80% 的注释案例上训练了主要模型，其中 20% 用于测试（主要测试集）。然后使用最佳主要模型来识别其余 861 名患者的肿瘤，并使用该模型在他们的扫描中生成边界框坐标。创建了 10 个基准训练集，其中包含未分段患者的生成坐标。用于预测主要测试集中肾脏的最终模型。我们报告了阳性预测值（PPV）、灵敏度和平均精密度（mAP）。结果初级训练集的平均PPV为0.94 +/- 0.01，灵敏度为0.87 +/- 0.04，mAP为0.91 +/- 0.02。最佳主要模型的 PPV 为 0.97，灵敏度为 0.92，mAP 为 0.95。最终模型的平均 PPV 为 0.95 +/- 0.03

2024-04-11

YOLO-CIANNA：在无线电数据中进行深度学习的星系检测 I. 一种受YOLO启发的新型源检测方法应用于SKAO SDC1

即将到来的平方公里阵列（SKA）将为天文仪器产生的数据量设定一个新标准，这可能会挑战广泛采用的数据分析工具，这些工具无法与数据大小进行充分扩展。本研究旨在通过应用现代深度学习目标检测技术，为海量射电天文数据集开发一种新的源检测和表征方法。这些方法已经证明了它们在复杂的计算机视觉任务中的效率，我们试图确定它们在应用于天文数据时的具体优势和劣势。我们介绍了YOLO-CIANNA，这是一款专为天文数据集设计的高度定制的深度学习目标探测器。本文介绍了该方法，并描述了解决射电天文图像特定挑战所需的所有低级适应。我们使用来自 SKAO SDC1 数据集的模拟 2D 连续体图像演示了这种方法的功能。我们的方法优于特定 SDC1 数据集上所有其他已发表的结果。使用 SDC1 指标，我们将挑战获胜分数提高了 +139\%，将唯一其他挑战后参与的分数提高了 +61\%。我们的目录的检测纯度为 94%，同时检测的来源比以前的最高分结果多 40 至 60%。经过训练的模型还可以强制在后处理中达到 99% 的纯度，并且仍然比其他高分方法多检测 10% 到 30% 的来源。它还能够实时检测，在单个 GPU 上每秒

2024-04-11

YOLO-Ant：通过深度可分离卷积和大核设计实现天线干扰源检测的轻量级探测器

在5G通信时代，消除影响通信的干扰源是一项资源密集型任务。计算机视觉的快速发展使无人机能够执行各种高空探测任务。由于天线干扰源的目标检测领域尚未得到充分探索，因此该行业缺乏针对该特定任务的专用学习样本和检测模型。本文创建了一个天线数据集，以解决重要的天线干扰源检测问题，并作为后续研究的基础。我们介绍了YOLO-Ant，这是一款专为天线干扰源检测而设计的轻量级CNN和变压器混合探测器。具体来说，我们最初为网络深度和宽度制定了轻量级设计，确保后续研究在轻量级框架内进行。然后，提出了一种基于深度可分离卷积和大卷积核的DSLK-Block模块，以增强网络的特征提取能力，有效提高小目标检测能力。为了解决天线检测中复杂的背景和较大的类间差异等挑战，我们构建了DSLKVit-Block，这是一个强大的特征提取模块，结合了DSLK-Block和变压器结构。考虑到其轻量级设计和精度，该方法不仅在天线数据集上实现了最佳性能，而且在公共数据集上也取得了具有竞争力的结果。

2024-04-11

YOLO-TLA：基于YOLOv5的高效轻量级小目标检测模型

目标检测是计算机视觉的一个关键方面，在准确性和鲁棒性方面取得了重大进展。尽管取得了这些进步，但实际应用仍然面临明显的挑战，主要是对小物体的不准确检测或漏检。在本文中，我们提出了基于YOLOv5的高级目标检测模型YOLO-TLA。我们首先在颈部网络金字塔架构中引入了一个额外的小物体检测层，从而生成了更大比例的特征图，以识别小物体的更精细特征。此外，我们将C3CrossCovn模块集成到骨干网中。该模块使用滑动窗口特征提取，有效地最小化了计算需求和参数数量，使模型更加紧凑。此外，我们还将全球关注机制纳入骨干网络。该机制将通道信息与全局信息相结合，以创建加权特征图。此特征图经过定制，可突出显示感兴趣对象的属性，同时有效地忽略不相关的细节。与基线YOLOv5s模型相比，我们新开发的YOLO-TLA模型在MS COCO验证数据集上显示出相当大的改进，在[email protected]中增加了4.6%，在[email protected]：0.95中增加了4%，同时将模型大小紧凑地保持在9.49M参数。进一步将这些改进扩展到 YOLOv5m 模型，增强版的 [email protected] 和 [email protected]：0.95 分别增加了 1.7% 和 1.9

2024-04-11

DEYO：带有 YOLO 的 DETR 用于端到端目标检测

DETR 的训练范式很大程度上取决于在 ImageNet 数据集上预训练它们的骨干。然而，图像分类任务和一对一匹配策略提供的有限监督信号导致 DETR 的颈部预训练不足。此外，训练早期匹配的不稳定性导致DETR的优化目标不一致。为了解决这些问题，我们设计了一种创新的培训方法，称为分步培训。具体来说，在训练的第一阶段，我们采用经典的检测器，用一对多匹配策略进行预训练，以初始化端到端检测器的骨干和颈部。在训练的第二阶段，我们冻结了端到端检测器的骨干和颈部，因此需要从头开始训练解码器。通过分步训练的应用，我们引入了第一个实时端到端目标检测模型，该模型利用纯卷积结构编码器 DETR with YOLO （DEYO）。在不依赖任何补充训练数据的情况下，DEYO在速度和准确性上都超过了所有现有的实时目标检测器。此外，全面的 DEYO 系列可以使用单个 8GB RTX 4060 GPU 完成其对 COCO 数据集的第二阶段训练，从而大大降低了训练支出。源代码和预训练模型可在此 https URL 上找到。

2024-04-11

FusionVision：使用YOLO和快速分割任何东西的RGB-D相机进行3D对象重建和分割的综合方法

在计算机视觉领域，鉴于不同的环境条件和不同的物体外观所产生的固有复杂性，将先进技术集成到 RGB-D 相机输入的处理中是一项重大挑战。因此，本文介绍了FusionVision，这是一个详尽的管道，适用于RGB-D图像中对象的鲁棒3D分割。传统的计算机视觉系统在同时捕获精确的物体边界和在深度图上实现高精度物体检测方面存在局限性，因为它们主要用于RGB相机。为了应对这一挑战，FusionVision采用了一种集成的方法，将最先进的目标检测技术与先进的实例分割方法相结合。这些组件的集成可以对RGB-D数据进行整体（统一分析从颜色\textit{RGB}和深度\textit{D}通道获得的信息）解释，从而有助于提取全面准确的对象信息。所提出的FusionVision流水线采用YOLO来识别RGB图像域内的物体。随后，应用创新的语义分割模型FastSAM来划定对象边界，从而产生精细的分割掩码。这些组件之间的协同作用及其与 3D 场景理解的集成确保了对象检测和分割的紧密融合，从而提高了 3D 对象分割的整体精度。代码和预训练模型在此 https URL 上公开提供。

2024-04-11

YOLO-MED ：生物医学图像的多任务交互网络

目标检测和语义分割是生物医学图像分析中的关键组成部分。当前的单任务网络在检测和分割任务中都表现出可喜的结果。多任务网络因其能够同时处理分割和检测任务，同时加速分割推理而备受关注。然而，最近的多任务网络面临着明显的局限性，例如难以在准确性和推理速度之间取得平衡。此外，他们经常忽略跨尺度特征的集成，这对于生物医学图像分析尤为重要。在这项研究中，我们提出了一种高效的端到端多任务网络，能够同时执行对象检测和语义分割，称为YOLO-Med。我们的模型采用主干和颈部进行多尺度特征提取，并辅以两个特定于任务的解码器。采用跨尺度任务交互模块，促进各任务之间的信息融合。我们的模型在Kvasir-seg数据集和私人生物医学图像数据集上进行评估时，在平衡准确性和速度方面表现出有希望的结果。

2024-04-11

轻量级目标检测：基于YOLOv7与ShuffleNetv2和Vision Transformer集成的研究

随着移动计算技术的快速发展，在移动设备上部署高效的目标检测算法成为计算机视觉的关键研究领域。本研究聚焦于优化 YOLOv7 算法，以提高其在移动平台上的运营效率和速度，同时确保高精度。利用群卷积、ShuffleNetV2 和 Vision Transformer 等先进技术的协同作用，该研究有效地减少了模型的参数计数和内存使用，简化了网络架构，并增强了资源受限设备的实时对象检测能力。实验结果表明，改进后的YOLO模型表现出优异的性能，显著提高了处理速度，同时保持了卓越的检测精度。

2024-04-11

基于注意力机制和FasterNet的改进YOLOv5，用于铁路和航空轨道上的异物检测

近年来，异物闯入铁路和机场跑道的事件频发。这些物体可以包括行人、车辆、动物和碎片。本文介绍了一种改进的YOLOv5架构，该架构结合了FasterNet和注意力机制，以增强铁路和机场跑道上异物的检测。本研究提出了一个新的数据集，AARFOD（航空和铁路异物检测），它结合了两个公共数据集，用于检测航空和铁路系统中的异物。该数据集旨在提高异物目标的识别能力。该大型数据集的实验结果表明，与基线 YOLOv5 模型相比，所提出的模型具有显着的性能改进，从而降低了计算要求。改进后的YOLO模型在精度方面有1.2%的显著提高，召回率有1.0%的提高，[email protected]的有0.6%的显著提高，而[email protected]保持不变。参数降低约25.12%，GFLOP降低约10.63%。在烧蚀实验中发现，FasterNet模块可以显著减少模型的参数数量，而注意力机制的参考可以减缓轻量化带来的性能损失。

2024-04-11

FogGuard：使用感知损失保护YOLO免受雾气的影响

在本文中，我们提出了一种名为FogGuard的新型雾感知物体检测网络，旨在解决雾天气条件带来的挑战。自动驾驶系统严重依赖精确的物体检测算法，但恶劣的天气条件会严重影响深度神经网络（DNN）的可靠性。现有方法分为两大类，1）图像增强，如IA-YOLO 2）基于域适应的方法。基于图像增强的技术试图生成无雾图像。但是，从有雾图像中检索无雾图像比在有雾图像中检测对象要困难得多。另一方面，基于域适应的方法不利用目标域中的标记数据集。这两类方法都试图解决更难的问题。我们的方法建立在微调的基础上我们的框架专门设计用于补偿场景中存在的雾气条件，确保均匀的性能。我们采用YOLOv3作为基线目标检测算法，并引入了一种新颖的师生感知损失算法，用于雾图像中的高精度目标检测。通过对PASCAL VOC和RTTS等常见数据集的广泛评估，我们展示了我们的网络在性能方面的改进。我们证明 FogGuard 在 RTTS 数据集上实现了 69.43\% mAP，而 YOLOv3 为 57.78\%。此外，我们表明，虽然我们的训练方法增加了时间复杂性，但与常规的YOLO网络相比，它在推理过程中不会引入任何额外

2024-04-11

D-YOLO：在恶劣天气条件下进行物体检测的强大框架

包括雾霾、雪和雨在内的恶劣天气条件会导致图像质量下降，这通常会导致基于深度学习的检测网络的性能下降。大多数现有方法试图在执行目标检测之前校正朦胧图像，这增加了网络的复杂性，并可能导致潜在信息丢失。为了更好地整合图像恢复和目标检测任务，我们设计了一个带有注意力特征融合模块的双路由网络，同时考虑了朦胧和去雾特征。我们还提出了一个子网，为检测网络提供无雾霾特征。具体来说，我们的D-YOLO通过最小化清晰特征提取子网和检测网络之间的距离来提高检测网络的性能。在RTTS和FoggyCityscapes数据集上的实验表明，与最先进的方法相比，D-YOLO表现出更好的性能。它是一个强大的检测框架，用于弥合低水平去雾和高级检测之间的差距。

2024-04-11

YOLOv9 用于小儿腕部创伤 X 射线图像中的骨折检测（国外文献）

YOLOv9 是 You Only Look Once （YOLO）系列的最新版本，它的推出使其在各种场景中被广泛采用。本文首次将YOLOv9算法模型应用于骨折检测任务，作为计算机辅助诊断（CAD），帮助放射科医生和外科医生解读X射线图像。具体而言，本文在GRAZPEDWRI-DX数据集上训练了模型，并使用数据增强技术扩展了训练集，以提高模型性能。实验结果表明，与当前最先进的（SOTA）模型的mAP 50-95相比，YOLOv9模型的值从42.16%提高到43.73%，提高了3.7%。实现代码在此 https URL 中公开提供。

2024-04-11

利用 YOLO-World 和 GPT-4V LMM 在无人机图像中进行零射击人员检测和动作识别（国外文献）

在本文中，我们探讨了零射大型多模态模型（LMM）在无人机感知领域的潜力。我们专注于人员检测和动作识别任务，并使用从鸟瞰图捕获的公开数据集评估两个著名的 LMM，即 YOLO-World 和 GPT-4V（ision）。传统的深度学习方法严重依赖大型和高质量的训练数据集。然而，在某些机器人环境中，在合理的时间范围内获取此类数据集可能是资源密集型的或不切实际的。基于提示的大型多模态模型（LMM）的灵活性及其卓越的泛化能力有可能彻底改变这些场景中的机器人应用。我们的研究结果表明，YOLO-World表现出良好的检测性能。GPT-4V 在准确分类动作类别方面遇到了困难，但在过滤掉不需要的区域建议和提供风景的一般描述方面取得了可喜的结果。这项研究代表了利用LMM进行无人机感知的第一步，并为该领域的未来研究奠定了基础。

2024-04-11

基于SEMI-SuperYOLO-NAS的高NA EUVL半导体缺陷检测改进

由于潜在的间距降低，半导体行业正在采用高数值孔径EUVL技术。然而，其低焦深给大批量制造带来了挑战。为了解决这个问题，供应商正在探索更薄的光刻胶和新的底层/硬掩模。这些可能受到 SNR 较差的影响，使缺陷检测复杂化。基于视觉的ML算法为半导体缺陷检测提供了一种很有前途的解决方案。然而，在没有明确训练的情况下，在各种图像分辨率上开发鲁棒的ML模型仍然是纳米级缺陷检测的挑战。本研究的目标是提出一种能够升级图像的尺度不变 ADCD 框架，以解决这个问题。我们提出了一个临时的ADCD框架，即SEMI-SuperYOLO-NAS，它建立在基线YOLO-NAS架构之上。该框架集成了一个 SR 辅助分支，以帮助通过缺陷检测主干学习 HR 特征，特别是用于从 LR 图像中检测纳米级缺陷实例。此外，SR 辅助分支可以从相应的缩小对应物递归生成放大图像，从而实现跨各种图像分辨率的缺陷检测推理，而无需显式训练。此外，我们还研究了改进的数据增强策略，旨在生成多样化和逼真的训练数据集，以提高模型性能。我们使用从两个不同过程获得并使用两种不同成像工具捕获的两个原始 FAB 数据集评估了我们提出的方法。最后，我们在

2024-04-11

RealmDreamer：文本驱动的 3D 场景生成，具有修复和深度扩散功能（国外参考文献）

我们介绍了 RealmDreamer，这是一种从文本描述中生成一般前向 3D 场景的技术。我们的技术优化了 3D 高斯 Splatting 表示，以匹配复杂的文本提示。我们通过利用最先进的文本到图像生成器来初始化这些溅射，将其样本提升为 3D，并计算遮挡体积。然后，我们使用图像条件扩散模型将这种表示优化为跨多个视图的 3D 修复任务。为了学习正确的几何结构，我们通过对内修模型中的样品进行调节，结合了深度扩散模型，从而给出了丰富的几何结构。最后，我们使用来自图像生成器的锐化样本对模型进行微调。值得注意的是，我们的技术不需要视频或多视图数据，可以合成各种不同风格的高质量 3D 场景，由多个对象组成。它的通用性还允许从单个图像进行 3D 合成。

2024-04-11

数据可视化：揭示数据价值的艺术与科学.docx

摘要：数据可视化是将数据转化为图形、图表等可视化形式的过程，旨在帮助人们更直观地理解和分析数据，发现数据中隐藏的规律和趋势。本文将介绍数据可视化的重要性、基本原理、常用技术和实际应用，以及未来发展趋势。正文：数据可视化的重要性数据可视化是将抽象的数据转化为直观的可视化形式，有助于人们更快速、准确地理解和分析数据。数据可视化可以帮助发现数据中的模式、趋势和异常，提供决策支持和洞察力，促进信息传递和沟通。数据可视化的基本原理数据可视化的基本原理包括选择合适的可视化形式、设计清晰的图表布局、优化图形视觉效果等。在进行数据可视化时，需要考虑数据的特点、目标受众和展示环境，选择最合适的可视化技术和工具。数据可视化的常用技术数据可视化的常用技术包括但不限于以下几种：图表库：图表库是一种常用的数据可视化工具，包括各种图表类型如折线图、柱状图、饼图等，如Matplotlib、D3.js、Highcharts等。地图可视化：地图可视化是一种常用的数据可视化技术，用于展示地理信息数据，如地图热力图、地图气泡图等，如Google Maps API、Leaflet等。交互

2024-04-08

探索虚拟与现实的融合之路VR.docx

摘要：虚拟现实（VR）和增强现实（AR）技术正在以惊人的速度改变着我们的生活和工作方式。本文将深入探讨VR/AR开发的基本概念、关键技术、应用场景以及未来发展趋势，帮助读者更好地了解和应用这一前沿技术。正文： VR/AR开发的基本概念虚拟现实（VR）是一种通过计算机技术创建的完全虚拟的环境，用户可以通过头戴式显示器等设备沉浸其中。增强现实（AR）则是一种将虚拟信息叠加在现实世界中的技术，用户可以通过手机、平板电脑等设备查看。VR/AR开发是指利用相关技术和工具，实现虚拟与现实的融合，创造出更加丰富、沉浸式的体验。 VR/AR开发的关键技术 VR/AR开发涉及到多种关键技术，包括但不限于以下几种：图形渲染：图形渲染技术是实现虚拟场景的重要技术之一，包括光照、纹理、阴影等方面的处理。虚拟建模：虚拟建模技术用于创建虚拟场景中的物体、人物和环境，通常包括建模、动画、布局等方面的工作。传感器技术：传感器技术用于获取用户在现实世界中的位置、姿态、动作等信息，从而实现对虚拟场景的交互和控制。增强现实技术：增强现实技术包括场景识别、实时定位、虚拟信息叠加等方面的技术，用于

2024-04-08

嵌入式物联网开发：连接万物，智能互联.docx

摘要：嵌入式物联网（IoT）开发是将嵌入式系统与物联网技术相结合，实现设备之间的智能连接和数据交互。本文将介绍嵌入式物联网开发的基本原理、关键技术和实际应用，以及面临的挑战和未来发展趋势。正文：嵌入式物联网开发的基本原理嵌入式物联网开发是指利用嵌入式系统和物联网技术实现设备之间的连接和通信。嵌入式系统是指在其他系统中嵌入的计算机系统，通常包括处理器、存储器、输入输出接口等组件。物联网技术是指利用互联网技术连接各种设备和物体，实现数据的采集、传输和处理。嵌入式物联网开发的关键技术嵌入式物联网开发涉及到多种关键技术，包括但不限于以下几种：嵌入式系统设计：嵌入式物联网设备通常具有资源有限、功耗低、体积小等特点，需要进行合理的系统设计和优化。通信协议：嵌入式物联网设备之间需要通过各种通信协议进行数据交换，常用的通信协议包括Wi-Fi、蓝牙、LoRa、Zigbee等。数据处理和存储：嵌入式物联网设备需要对采集到的数据进行处理和存储，通常包括数据压缩、加密、存储和传输等。传感器和执行器：嵌入式物联网设备通常需要配备各种传感器和执行器，用于采集环境数据和控制设备操

2024-04-08

网络安全：保护数字世界的壁垒与守护者

随着数字化时代的到来，网络安全问题变得愈发突出，成为了社会、政府、企业 ja以及个人面临的重要挑战。网络安全不仅关乎信息资产的保护，也直接关系到国家安全和社会稳定。本文将深入探讨网络安全的重要性、当前面临的威胁和挑战，以及应对这些挑战的策略和技术。正文：网络安全的重要性网络安全是指保护计算机系统和网络不受未经授权的访问、攻击和破坏的一系列技术和措施。随着信息技术的发展，网络安全的重要性日益凸显。网络安全不仅关系到个人隐私和财产安全，也影响着国家的政治稳定和经济发展。当前面临的威胁和挑战网络安全面临着多种威胁和挑战，主要包括：黑客攻击：黑客利用各种技术手段入侵网络系统，窃取用户信息、企业机密和政府数据，造成严重的安全漏洞和损失。恶意软件：恶意软件包括病毒、木马、僵尸网络等，会对计算机系统和网络造成严重破坏和影响，威胁用户的个人隐私和财产安全。数据泄露：数据泄露可能导致用户个人信息和企业机密信息被泄露，对个人和组织造成严重损失。

2024-04-08

移动应用开发：从概念到实现的完整指南.docx

摘要：移动应用已经成为人们日常生活和工作中不可或缺的一部分，而移动应用开发作为实现这些应用的重要手段，也在不断演变和发展。本文将全面介绍移动应用开发的整个过程，从概念的构思到实现的发布，涵盖了关键技术、工具和流程，旨在帮助开发者更好地理解和应用移动应用开发技术。正文：移动应用开发的概述移动应用开发是指利用各种技术和工具开发针对移动设备（如智能手机和平板电脑）的应用程序。移动应用开发通常分为原生应用开发、混合应用开发和Web应用开发三种方式，每种方式都有其优缺点，适用于不同的场景和需求。移动应用开发的关键技术和工具移动应用开发涉及到多种关键技术和工具，包括但不限于以下几种：原生开发技术：原生应用开发通常使用平台特定的开发语言和框架，如iOS平台使用Swift或Objective-C，Android平台使用Java或Kotlin。常用的开发工具包括Xcode（iOS）和Android Studio（Android）。混合开发技术：混合应用开发可以使用Web技术（如HTML、CSS、JavaScript）开发应用，并通过WebView组件嵌入原生应用中。常用的混合

2024-04-08

爬虫开发：数据采集与应用的利器.docx

摘要：随着互联网信息的爆炸式增长，数据已经成为现代社会最宝贵的资源之一。爬虫开发作为一种数据采集工具，能够帮助用户从互联网上收集各种类型的数据，并进行相应的处理和分析。本文将探讨爬虫开发的基本原理、常见技术和实际应用，旨在帮助读者更好地理解和应用爬虫技术。正文：爬虫开发的基本原理爬虫（Spider）是一种自动化程序，可以模拟人类用户在互联网上浏览和访问网页的行为，从而收集网页上的各种信息。爬虫的基本原理是通过发送HTTP请求，获取网页内容，并对内容进行解析和提取目标信息。爬虫可以根据用户需求自动化地访问多个网页，并将采集到的数据保存到本地或者数据库中。爬虫开发的常见技术爬虫开发涉及到多种技术和工具，包括但不限于以下几种：编程语言：爬虫可以使用多种编程语言开发，包括Python、Java、JavaScript等。其中，Python是一种常用的爬虫开发语言，拥有丰富的第三方库和框架，如Scrapy、BeautifulSoup等。数据库：爬虫开发通常需要将采集到的数据保存到数据库中进行进一步的处理和分析。常用的数据库包括MySQL、MongoDB、SQLite等。

2024-04-08

游戏开发：创意、技术与娱乐融合之道.docx

摘要：游戏开发是一门融合了创意、技术和娱乐的复杂艺术。本文将探讨游戏开发的关键要素，包括游戏设计、技术实现、用户体验以及市场营销等方面。通过深入剖析游戏开发的流程和策略，帮助开发者更好地理解游戏产业，并在竞争激烈的市场中取得成功。正文：游戏开发的基础要素游戏开发的基础要素包括游戏设计、技术实现和用户体验。游戏设计是游戏开发的灵魂，包括游戏规则、关卡设计、角色设定等。技术实现是游戏开发的核心，包括游戏引擎、编程语言、图形引擎等。用户体验是游戏开发的重点，包括游戏操作、界面设计、音效效果等。游戏开发的流程游戏开发的流程通常包括需求分析、设计、开发、测试和发布等阶段。在需求分析阶段，开发团队需要明确游戏的目标、玩法和目标用户群。在设计阶段，开发团队需要绘制游戏画面、制作游戏界面和设计游戏规则。在开发阶段，开发团队需要利用各种技术工具实现游戏功能。在测试阶段，开发团队需要对游戏进行全面测试，确保游戏的稳定性和可玩性。在发布阶段，开发团队需要将游戏推向市场，并进行市场营销和推广。游戏开发的关键策略游戏开发的关键策略包括创新、品质和用户体验。创新是游戏开发的核心竞争力，包

2024-04-08

大数据开发：挑战与机遇.docx

摘要：随着信息时代的到来，大数据已成为当今世界最宝贵的资源之一。大数据开发是指针对海量、多样化、高速度的数据进行收集、存储、处理和分析的过程。本文将探讨大数据开发面临的挑战，以及这些挑战所带来的机遇，包括技术挑战、数据管理挑战、隐私安全挑战等，并提出相应的解决方案和发展趋势。正文：大数据开发的重要性大数据开发是指利用各种技术手段处理和分析海量数据的过程，已经成为信息时代的重要组成部分。通过大数据开发，可以挖掘数据中隐藏的规律和价值，为企业决策、科学研究、商业应用等提供支持。大数据开发面临的挑战尽管大数据开发带来了巨大的机遇，但同时也面临着诸多挑战。其中一些挑战包括：技术挑战：大数据开发涉及到数据采集、存储、处理、分析等多个环节，需要使用各种复杂的技术和工具。同时，大数据技术本身也在不断发展和演进，需要不断学习和更新技术。数据管理挑战：大数据开发涉及到海量、多样化、高速度的数据，如何有效地管理和维护这些数据成为一个挑战。包括数据清洗、数据质量管理、数据备份和恢复等方面。隐私安全挑战：随着数据的不断积累和共享，数据隐私和安全成为了一个越来越重要的问题。大数据

2024-04-08

现代软件测试：挑战与趋势.docx

摘要：随着信息技术的迅速发展，软件已经成为人们日常生活和商业活动中不可或缺的一部分。然而，随之而来的是软件质量和安全性的挑战。软件测试作为确保软件质量的重要手段，也在不断演变和发展。本文将探讨现代软件测试所面临的挑战以及未来的趋势，包括自动化测试、AI驱动的测试、持续集成和持续交付等。正文：软件测试的重要性在软件开发生命周期中，测试是确保软件质量的关键步骤之一。通过测试，可以发现并纠正软件中的缺陷，提高软件的可靠性、安全性和性能。软件测试不仅涉及功能性测试，还包括性能测试、安全测试、用户体验测试等多个方面。一个经过充分测试的软件可以带来更好的用户体验，同时也能够减少由软件缺陷导致的损失。现代软件测试的挑战尽管软件测试的重要性被广泛认可，但现代软件开发环境中依然存在着许多挑战。其中一些挑战包括：快速迭代和交付：现代软件开发采用敏捷开发、DevOps等快速迭代和持续交付的方法，要求测试工作也要跟上节奏。传统的手工测试往往无法满足这种需求，需要引入自动化测试来提高效率。复杂性和多样性：现代软件系统通常具有复杂的架构和多样化的技术栈，例如微服务架构、容器化、云原生等

2024-04-08

探索前端技术：构建现代化网络体验的关键.docx

在当今数字化时代，前端技术的重要性日益突显。随着互联网的普及和移动设备的广泛应用，用户对于网站和应用的体验要求也日益提高。前端开发不再仅仅是呈现信息，而是成为了构建现代化网络体验的关键。本文将探索前端技术的发展趋势和关键要素，以及如何利用这些技术来提升用户体验。前端技术的发展趋势响应式设计：随着移动设备的普及，响应式设计已成为前端开发的标配。通过响应式设计，网站和应用能够在不同设备上自动调整布局和样式，从而提供一致的用户体验。渐进式Web应用（PWA）：PWA 结合了网页和原生应用的优点，具有离线访问、推送通知等特性，能够提供更接近原生应用的体验，是未来前端开发的趋势之一。前端框架的流行：诸如React、Vue.js和Angular等前端框架的出现，使得前端开发变得更加高效和灵活。这些框架提供了组件化开发、虚拟DOM等功能，极大地简化了复杂应用的开发过程。性能优化和加载速度：用户对于网站和应用的加载速度要求越来越高，因此性能优化成为了前端开发的重要方向。通过减少资源大小、使用CDN加速、懒加载等技术，可以提升网站和应用的加载速度，从而提升用户体验。关键要素 HTM

2024-04-08

C++开发实用教程最好的

2024-03-14

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Squeezed Edge YOLO：边缘设备上的板载对象检测

奥地利自动驾驶深度学习视觉模型YOLO和DETR的首次定性观察

使用YOLO从SDSS图像中检测到边缘低表面亮度星系候选星系

yolo使用TomFormer及早准确检测番茄叶病

具有混合注意力特征金字塔网络的YOLO算法，用于焊点缺陷检测

DiffYOLO：通过YOLO和扩散模型进行抗噪声目标检测

YOLOv7无人机实时探测人体

使用 YOLO 对牛栏编号进行分类

YOLO-Former：YOLO与ViT握手

使用 YOLOv7 和 ESRGAN 改进坑洼检测

基于YOLO的动态序列匹配模型，实现高效的无覆盖图像隐写

基于深度学习的综合感知与通信系统中的目标-用户关联

使用基于YOLO的学习方法对农业进行实时目标检测和机器人操作

YOLO-World：实时开放词汇对象检测

基于YOLO的红外小目标检测范式

使用YOLO v7在磁共振成像中检测肾脏

YOLO-CIANNA：在无线电数据中进行深度学习的星系检测 I. 一种受YOLO启发的新型源检测方法应用于SKAO SDC1

YOLO-Ant：通过深度可分离卷积和大核设计实现天线干扰源检测的轻量级探测器

YOLO-TLA：基于YOLOv5的高效轻量级小目标检测模型

DEYO：带有 YOLO 的 DETR 用于端到端目标检测

FusionVision：使用YOLO和快速分割任何东西的RGB-D相机进行3D对象重建和分割的综合方法

YOLO-MED ： 生物医学图像的多任务交互网络

轻量级目标检测：基于YOLOv7与ShuffleNetv2和Vision Transformer集成的研究

基于注意力机制和FasterNet的改进YOLOv5，用于铁路和航空轨道上的异物检测

FogGuard：使用感知损失保护YOLO免受雾气的影响

D-YOLO：在恶劣天气条件下进行物体检测的强大框架

YOLOv9 用于小儿腕部创伤 X 射线图像中的骨折检测（国外文献）

利用 YOLO-World 和 GPT-4V LMM 在无人机图像中进行零射击人员检测和动作识别（国外文献）

基于SEMI-SuperYOLO-NAS的高NA EUVL半导体缺陷检测改进

RealmDreamer：文本驱动的 3D 场景生成，具有修复和深度扩散功能（国外参考文献）

数据可视化：揭示数据价值的艺术与科学.docx

探索虚拟与现实的融合之路VR.docx

嵌入式物联网开发：连接万物，智能互联.docx

网络安全：保护数字世界的壁垒与守护者

移动应用开发：从概念到实现的完整指南.docx

爬虫开发：数据采集与应用的利器.docx

游戏开发：创意、技术与娱乐融合之道.docx

大数据开发：挑战与机遇.docx

现代软件测试：挑战与趋势.docx

探索前端技术：构建现代化网络体验的关键.docx

C++开发实用教程最好的

YOLO-MED ：生物医学图像的多任务交互网络