- 博客(1230)
- 资源 (125)
- 收藏
- 关注
原创 【深度学习】目标检测YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
当前的深度学习方法主要关注如何设计最合适的目标函数,以使模型的预测结果最接近真实情况。同时,必须设计一个适当的架构,以便为预测提供足够的信息。现有方法忽略了一个事实,即当输入数据经过逐层特征提取和空间转换时,会丢失大量信息。本文将深入探讨数据在传输过程中通过深度网络时所面临的重要问题,即信息瓶颈和可逆函数。我们提出了可编程梯度信息(PGI)的概念,以应对深度网络为实现多个目标所需的各种变化。PGI可以为目标任务提供完整的输入信息来计算目标函数,从而获取可靠的梯度信息以更新网络权重。
2024-04-17 10:58:04 939
原创 【深度学习】【机器学习】用神经网络进行入侵检测,NSL-KDD数据集,基于机器学习(深度学习)判断网络入侵,网络攻击,流量异常【3】
之前用NSL-KDD数据集做入侵检测的项目是:【1】【2】有人问我是不是可以改代码,我说可以。
2024-04-16 20:43:36 716
原创 docker 容器指定utf-8编码
请注意,不同的基础镜像可能需要不同的设置。上述 Dockerfile 是以 Debian 或者 Ubuntu 为基础的镜像示例,如果你使用的是别的 Linux 发行版,你可能需要调整命令来适应相应的包管理器和配置方式。在运行 Docker 容器的时候,如果容器内应用需要使用 UTF-8 编码来正常处理中文,你可以通过设置环境变量来指定编码。然后你运行容器时就不需要再指定环境变量了,除非你需要覆盖 Dockerfile 中的设置。记得,每当你修改了 Dockerfile 之后,都需要重新构建镜像。
2024-04-11 15:05:44 461
原创 【深度学习】Fine-Grained Face Swapping via Regional GAN Inversion高保真换脸范式
提出一种新的高保真换脸范式,能够保留期望的微妙几何和纹理细节。从微观面部编辑的角度重新思考换脸任务,基于“编辑用于互换(editing for swapping)”(E4S)的原则,提出了一种基于面部组件形状和纹理的显式解耦方法。遵循E4S原则,实现面部特征的全局和局部互换,以及由用户指定的部分互换。此外,E4S范式通过面部遮罩固有地处理面部遮挡问题。核心是一种新的区域GAN逆映射(RGI)方法,它允许显式解耦形状和纹理,同时允许在StyleGAN的潜在空间中进行面部互换。
2024-04-11 14:40:37 443
原创 【深度学习】人脸表情、人脸属性,真假脸判断,deepfake脸
在DFDC数据集中,"fake的脸"是指通过特定的算法和方法生成的面部交换视频,即使用演员的面部特征替换到其他视频中的角色上。Fake的脸:与“real的脸”相对,指的是通过数字手段创建或修改的人脸。Real的脸:指的是原始的、未经修改的人脸视频或图像。在Deepfake检测的上下文中,这意味着视频中的人脸是真实的,演员自然地进行表情和动作,没有经过任何形式的数字编辑或面部替换。在Deepfake技术及其检测领域中,“real的脸”和“fake的脸”是指视频中的人脸是否经过了某种形式的篡改或合成。
2024-04-11 10:31:00 265
原创 【深度学习】YOLO-World: Real-Time Open-Vocabulary Object Detection,目标检测
YOLO-World是一种实时开放词汇目标检测系统,它通过视觉-语言建模和大规模数据集上的预训练,增强了YOLO(You Only Look Once)系列检测器的开放词汇检测能力。具体来说,该研究提出了一个新的可重新参数化的视-语路径聚合网络(RepVL-PAN)和区域-文本对比损失函数,以促进视觉和语言信息之间的交互。YOLO-World在零样本方式下检测广泛对象类别方面表现出色,并且效率很高。
2024-04-08 15:04:21 1052
原创 【深度学习】yolov5,用显卡,简单代码直接跑,python直接跑
给权重路径:/data/xiedong/eff_train/yolov5-master/yolov5n640/weights/best.pt。本地下载好仓库/data/xiedong/eff_train/yolov5-master。cpu跑就别加这两句。
2024-04-07 18:06:32 160
原创 【深度学习】Progressive Distillation for Fast Sampling of Diffusion Models
这种方法通过迭代地将一个需要较多步骤的模型(称为教师模型)蒸馏成一个需要较少步骤的学生模型,每次迭代都将采样步骤减半,直到达到所需的采样步骤数量。通过渐进式蒸馏,论文将原始需要8192步采样的模型成功蒸馏为只需4步采样就能取得接近的生成质量的新模型,大幅提高了扩散模型的推理效率。这篇论文提出了一种"渐进式蒸馏"(Progressive Distillation)的方法,来大幅降低用于生成对抗网络(GAN)的扩散模型(Diffusion Model)在推理阶段的采样步数,从而提高其推理效率。
2024-04-07 16:54:33 509
原创 【单片机】心率传感器,串口发送,MAX30102心率传感器模块
数值还是稳定的,但太贵了,stm32单片机的话,直接用这篇博客()的代码,一样稳定。
2024-04-06 19:15:00 394
原创 【单片机】CJSH22-CH2O,甲醛传感器,甲醛传感器数据读取处理
逻辑是:1、初始化串口和定时器10ms中断2、循环读取一帧数据到rev_CH2O_bufferdata3、在主函数解析数据rev_CH2O_bufferdata4、最终的pm2.5数值就是CH2O_value使用CH2O_value的数据即可。PPB单位,除以1000就是ppm,再乘以1.34那么单位就是mg/m3。
2024-04-06 18:08:36 283
原创 【单片机】PMS5003,PM2.5传感器数据读取处理
PMS5003是一款基于激光散射原理的数字式通用颗粒物浓度传感器,可连续采集并计算单位体积内空气中不同粒径的悬浮颗粒物个数,即颗粒物浓度分布,进而换算成为质量浓度,并以通用数字接口形式输出。本传感器可入各种与空气中悬浮颗粒物浓度相关的仪器仪表或环境改善设备,为其提供及时准确的浓度数据。
2024-04-06 17:13:42 308
原创 【单片机】74HC4052电路图,单片机端口复用电路
如下图,还是很好理解,PA9、PA10是单片机引脚。当A和B是00,那么就是X-COM和0X短路,Y-COM和0Y短路。当A和B是01,那么就是X-COM和1X短路,Y-COM和1Y短路。以此类推。74HC 工艺可以直接3.3V供电,也可以5V供电,都能正常工作。
2024-04-06 15:01:12 458
原创 【深度学习】海洋生物数据集,图片分类
通过上述步骤,模型逐渐学习从图像数据中提取有用的特征,并准确分类图像。每个epoch的训练和验证过程都旨在评估模型的性能和泛化能力,同时通过反复迭代优化,不断提高模型的准确率。打开网页后,可以点击这里上传图片,然后点击提交,等待片刻,即可看到模型的推理结果。在最下方,也有示例图片,也可以点击某张示例图片后,就点击提交。收集9种以上的海洋生物图片,然后基于深度学习做一个分类模型,训练完成后,分类模型就可以对未知图片进行分类。在之后随便传一张图片,分类模型就可以推理出这张图片上面的是什么海洋生物。
2024-04-06 11:57:13 878
原创 【TB作品】STM32单片机读取MAX30102心率传感器,血氧传感器,稳定数值输出,stm32f103c8t6
【代码】【TB作品】STM32单片机读取MAX30102心率传感器,稳定数值输出,stm32f103c8t6。
2024-04-03 22:52:57 442
原创 【深度学习】sdwebui的token_counter,update_token_counter,如何超出77个token的限制?对提示词加权的底层实现
CLIP的输出是177768的特征,现在基本上一个图像的prompt提示词的token数肯定是很高,会超过77,那超出的时候是如何计算的呢?sdwebui输入的文本token是自动更新计算的,如何做到的呢?
2024-04-03 17:28:11 1294
原创 【深度学习】IP-Adapter-FaceID,IP-Adapter,代码实践
之前介绍了一下论文:https://qq742971636.blog.csdn.net/article/details/137224151测试出图将majicmixRealistic_v7转为diffusers文件:运行这个app.py:效果都有点崩,还需要继续探索。问询、帮助请看:
2024-04-01 15:32:48 1044
原创 【深度学习】IP-Adapter-FaceID,IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion
近年来,大型文本到图像扩散模型的强大能力在创造高保真图像方面取得了令人印象深刻的成果。然而,仅使用文本提示来生成所需图像是非常棘手的,因为这通常涉及复杂的提示工程。文本提示的一个替代方案是图像提示,正如俗话所说:“一幅图胜过千言万语”。尽管现有的直接从预训练模型进行微调的方法有效,但它们需要大量的计算资源,并且与其他基础模型、文本提示和结构控制不兼容。在本文中,我们提出了IP-Adapter,这是一种有效且轻量级的适配器,用于实现预训练文本到图像扩散模型的图像提示能力。
2024-04-01 11:22:35 769
原创 【深度学习】FaceChain: A Playground for Human-centric Artificial Intelligence Generated Content
个性化图像生成领域的最新进展揭示了预训练文本到图像模型从一系列肖像图像中学习身份信息的引人注目能力。然而,现有解决方案在生成真实细节方面存在脆弱性,并且通常受到几个缺陷的困扰,例如:(i) 生成的人脸展示其自身独特的特征,即面部形状和面部特征定位可能不像输入的关键特征,以及 (ii) 合成的人脸可能包含扭曲、模糊或损坏的区域。
2024-03-30 21:28:34 736
原创 【深度学习】【机器学习】用神经网络进行入侵检测,NSL-KDD数据集,基于机器学习(深度学习)判断网络入侵,网络攻击,流量异常
特征编号特征名称特征描述类型范围1duration连接持续时间,从TCP连接建立到结束的时间,或每个UDP数据包的连接时间连续[0, 58329]秒2协议类型,可能值为TCP, UDP, ICMP离散3service目标主机的网络服务类型,共70种可能值离散4flag连接状态,11种可能值,表示连接是否按照协议要求开始或完成离散5src_bytes从源主机到目标主机的数据的字节数连续6dst_bytes从目标主机到源主机的数据的字节数连续7。
2024-03-30 14:28:37 1498 1
原创 【Python】gradio如何给一个例子在网页中,gr.Examples
【代码】【Python】gradio如何给一个例子在网页中,gr.Examples。
2024-03-29 13:59:57 271
原创 怎么更新sd-webui AUTOMATIC1111/stable-diffusion-webui ?
然后再次执行webui.sh,这样会自动重新启动stable-diffusion-webui.更新代码完毕后,删除venv的虚拟环境。
2024-03-29 10:35:19 589
原创 【TB作品】MSP430G2553,超声波倒车雷达PCB,单片机,超声波SR04,键盘,oled
硬件:MSP430G2553、 SR04超声波传感器 、3*4键盘、 无源蜂鸣器、oled显示屏软件1 、实时显示测量得到的距离2、按键设置一个报警门限数值,直接输入数值后确认3、低于报警门限数值就开始报警,而且距离越近蜂鸣器的鸣叫频率越高程序原理图+pcb。
2024-03-28 22:37:27 354
原创 【深度学习】【机器学习】用神经网络进行入侵检测,NSL-KDD数据集,基于机器学习(深度学习)判断网络入侵
【深度学习】用神经网络进行入侵检测,NSL-KDD数据集,用TCP连接特征判断是否是网络入侵NSL-KDD数据集,有dos,u2r,r21,probe等类型的攻击,和普通的正常的流量,即是这样:Normal:正常记录DOS:拒绝服务攻击PROBE:监视和其他探测活动R2L:来自远程机器的非法访问U2R:普通用户对本地超级用户特权的非法访问数据集样子:https://towardsdatascience.com/a-deeper-dive-into-the-nsl-kdd-data-set-15c75
2024-03-27 20:38:22 1746 2
原创 【深度学习】An_Intrusion_Detection_System_Using_a_Deep_Neural_Network_With_Gated_Recurrent_Units
论文:https://ieeexplore.ieee.org/document/8449272摘要:为了提高网络入侵检测系统(IDS)的性能,我们将深度学习理论应用于入侵检测,并开发了一个具有自动特征提取功能的深度网络模型。在本文中,我们考虑了与时间相关的入侵特征,并提出了一种新颖的IDS,它由门控循环单元(GRU)的循环神经网络(RNN)、多层感知器(MLP)和softmax模块组成。在著名的KDD 99和NSL-KDD数据集上的实验表明,该系统具有领先的性能。使用KDD 99时的整体检测率为99.42%
2024-03-26 22:32:31 726
原创 【在FastAPI应用中嵌入Gradio界面的实现方法】如何在有一个Fastapi应用的基础上,新加一个gradio程序
通过将Gradio界面嵌入到FastAPI应用中,我们可以轻松地实现一个交互式的Web应用程序,为用户提供友好的界面来与机器学习模型进行交互。这种组合使用不同库和工具的方法,可以为开发者提供更多的灵活性和创造性,以满足不同场景下的需求。在这个函数中,使用Gradio的Blocks API创建界面元素,如文本框、按钮等,并定义按钮点击事件的处理函数。创建一个简单的路由处理函数,用于主页请求的处理,并返回一个简单的消息,表示主页已成功加载。函数,将Gradio界面挂载到FastAPI应用中,并指定挂载路径。
2024-03-26 16:35:58 543
原创 【深度学习】超分,修复,ResShift: Efficient Diffusion Model for Image Super-resolution by Residual Shifting
基于上述动机,我们提出了一个高效的扩散模型,涉及一个更短的马尔可夫链,用于在HR图像和其对应的LR图像之间过渡。在本文中,我们认为,对于SR来说,合理的扩散模型应该从一个基于LR图像的先验分布开始,使其能够迭代地从其LR对应物中恢复HR图像,而不是从高斯白噪声开始。最近,扩散模型,作为一种新出现的生成模型,在图像生成方面取得了前所未有的成功。为了解决这个问题,作者提出了一种新颖高效的扩散模型用于SR,显著减少了扩散步骤的数量,从而消除了在推理过程中需要后加速的需求及其可能导致的性能恶化问题。
2024-03-24 14:06:37 1049
原创 校园电动车管理系统,需求书
同时,系统能够实时检测电瓶车的充电状态,并在充满电后自动断电,确保充电安全并避免过充。同时,该模块还支持刷卡充电和费用扣除,为用户提供便捷的充电服务,并对消费进行记录。通过该模块,用户能够方便注册系统账户,进行安全登录,并且可以实时管理个人信息,包括身份验证信息和联系方式。此外,用户管理模块还负责账户权限的分配与管理,确保不同用户享有系统内相应的权限,以维护系统的安全性和稳定性。通过WiFi模块,实时监测电瓶车的充电状态、使用情况等信息,系统能够将这些数据实时展示给用户和管理人员。
2024-03-23 09:32:12 1032
原创 【TB作品】430单片机,单片机串口多功能通信,Proteus仿真
这段程序是用C语言编写的针对MSP430F249单片机的程序,实现了LCD1602液晶显示屏和UART串口通信功能。头文件引用和宏定义:引入了一些标准头文件和宏定义,以及一些需要用到的变量类型的定义。LCD相关函数:包括LCD初始化、写入指令、写入数据、设置显示位置、显示字符、显示字符串等函数。串口通信相关函数:包括发送数据、发送字符、接收数据等函数。按键检测函数:检测外部按键的状态。主函数。
2024-03-22 22:39:17 471
原创 【深度学习】基于机器学习的无机钙钛矿材料形成能预测,预测形成能,神经网络,回归问题
通过以上的数据预处理方法,我们可以确保数据集为机器学习模型的训练和测试做好准备。这些步骤有助于提高模型的准确性、减少过拟合的风险,并提高模型的泛化能力。离散数值通常指的是分类数据,这些数据可以是有序的(例如教育水平)或无序的(例如国籍)。数据集的平衡: 在分类问题中,确保每个类别的样本数量大致相等,或者使用加权损失函数来解决类别不平衡问题。当数据集中的特征在不同的范围内变化时,可能会导致模型性能下降,尤其是在使用基于距离的算法时。简单来说,就是一行就是一个样本,要用绿色的9个数值,预测出红色的那1个数值。
2024-03-22 12:49:10 1093 1
原创 【深度学习】表情识别A Dual-Direction Attention Mixed Feature Network for Facial Expression Recognition
代码:https://github.com/simon20010923/DDAMFN/tree/main此算法是当前的第一名:https://paperswithcode.com/paper/a-dual-direction-attention-mixed-feature面部表情在人类交流中起着重要作用,是理解情绪和态度的关键信号。因此,计算机需要获得辨识和解释面部表情的能力。[1–3]已经清楚地阐明了视觉感知、环境映射算法与基于生物识别认证计算机视觉的面部表情识别(FER)之间的关系,因此使用深度学习方法
2024-03-19 14:52:44 1340 6
原创 【深度学习】表情识别Facial Expression Recognition with Adaptive Frame Rate based on Multiple Testing
这篇论文的核心内容是提出了一种基于自适应帧率选择的视频面部表情识别方法,该方法利用多重假设检验校正(Multiple Testing Correction)来提高决策的可信度。论文的主要贡献在于提出了一种新的视频处理框架,该框架能够在保持高准确性的同时显著提高FER的效率。:视频基础的面部表情识别(FER)由于数据集标注的模糊性、同一情绪不同强度的多样性以及不同情境下情绪的不平衡性,是一个具有挑战性的问题。为此,作者提出了一种新的顺序处理方法,该方法可以在短视频片段中自适应地选择帧率,以加快决策过程。
2024-03-19 13:51:20 397
51单片机 示波器 LCD12864 淘宝资料 论文 淘宝爆款
2020-01-19
STM32F103VET6 正点原子 移植 模板 ,模仿正点原子工程
2019-12-17
LCD12864 万年历 单片机 农历 显示 温度DS18B20 DS1302 AT24C02
2019-12-05
STM32F103RCT6 PCB 原理图 打板 原子 mini
2019-11-29
TI tiva tm4C ARM 库函数手册
2019-11-26
android P 9.0 支持HTTP
2019-09-25
PIC16F887 官方文档 用户手册 另加2个仿真例程 LCD1602 矩阵键盘 拨号 计算器 音乐盒
2019-09-19
kaggle 猫狗数据集二分类 系列(1)构建模型进行二分类,保存模型,画出走势图 代码
2019-09-16
avr MEGA16 DS1302 LCD1602 万年历 时钟显示 proeus 仿真 + 程序
2019-09-11
Gitxmind GIt bash 使用 xmind
2021-07-11
SHT3x_Datasheet_digital英文手册.pdf
2021-02-21
51单片机 普中V2 数字时钟 电子时钟 万年历 DS1302 LCD1602 AT24C02
2020-10-26
STM32F103C8T6 单片机 ESP8266 12F接入机智云
2020-09-05
工具软件 MSP430F149下载程序所需要用到的软件
2020-07-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人