自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 资源 (2)
  • 收藏
  • 关注

原创 [论文精读]Masked Autoencoders are scalable Vision Learners

摘要本文证明了掩码自编码器(MAE)是一种可扩展的计算机视觉自监督学习算法。我们的MAE方法很简单:我们盖住输入图像的随机块并重建缺失的像素。它基于两个核心设计。首先,我们开发了一个非对称编码器-解码器架构,其中一个编码器仅对块的可见子集(没有掩码标记)进行操作,以及一个轻量级解码器,该解码器从潜在表示和掩码标记重建原始图像。其次,我们发现如果用比较高的掩盖比例掩盖输入图像,例如75%,这会产生一个重要的和有意义的自我监督任务。这两种设计的结合使我们能够高效地训练大型模型:我们加速了训练(3倍或更多)并提

2024-04-18 14:15:02 385

原创 [书生·浦语大模型实战营]——XTuner 大模型单卡低成本微调

在未经过微调的pretrained LLM中,模型只会尽量去拟合你的输入,也就是说模型并没有意识到你在提问,因此需要微调来修正。1.安装2.挑选配置模板3.一键训练Config的命名规则4.模型对话Float 16模型对话或4bit模型对话加载Adapter模型对话5.工具类模型对话XTuner还支持工具类模型的对话。

2024-01-14 14:05:37 958

原创 [书生·浦语大模型实战营]——基于 InternLM 和 LangChain 搭建你的知识库

llm.predict("你是谁")构建检索问答链,还需要构建一个 Prompt Template,该 Template 其实基于一个带变量的字符串,在检索之后,LangChain 会将检索到的相关文档片段填入到 Template 的变量中,从而实现带知识的 Prompt 构建。from langchain . prompts import PromptTemplate # 我们所构造的 Prompt 模板 template = """使用以下上下文来回答用户的问题。如果你不知道答案,就说你不知道。

2024-01-09 17:30:20 954

原创 [论文阅读]YOLO9000:Better,Faster,Stronger

我们引入了YOLOv2和YOLO9000实时检测系统。其中YOLOv2是最先进的,比其他检测系统在各种检测数据集上都更快。此外,它可以在各种图像尺寸下运行,以提供速度和精度之间的平滑权衡。YOLO9000是一个实时检测框架,通过对检测和分类的共同优化,可以检测9000多种目标类别。我们使用WordTree结合各种来源的数据和我们的联合优化技术在ImageNet和COCO上同时训练。YOLO9000是缩小检测和分类之间数据集大小差距的有力一步。我们的许多技术推广到目标检测之外。

2024-01-07 16:01:02 1332

原创 [书生·浦语大模型实战营]——轻松玩转书生·浦语大模型趣味 Demo

大模型通常指的是机器学习或人工智能领域中参数数量巨大、拥有庞大计算能力和参数规模的模型。这些模型利用大量数据进行训练,并且拥有数十亿甚至数千亿个参数。

2024-01-06 16:38:03 459

原创 [书生·浦语大模型实战营]——书生·浦语大模型全链路开源体系

应用例子:智能客服/个人助手/行业应用实现流程:开源开放体系:价值观对齐这个挺有意思嗷!大语言模型的下游应用中,增量续训和有监督微调是经常会用到的两种方式(1)增量续训使用场景:让基座模型学习到一些新知识,如某个垂类领域知识(垂类领域表示某个行业的某一部分,细分产业)训练数据:文章、数据、代码等(2)有监督微调使用场景:让模型学会理解和遵循各种指令,或者注入少量领域知识训练数据:高质量的对话、问答数据

2024-01-04 00:00:10 555

原创 [Linux操作系统]——tmp目录的作用

在某些系统上,/tmp作为tmpfs文件系统挂载,这意味着它存储在内存或交换空间中,而不是磁盘上。:除了/tmp,其他目录如/var/tmp和用户特定的临时目录(如/home/username/tmp)也用于临时存储,每个都有自己的策略和持久性特征。这意味着在没有适当预防措施的情况下,不应将敏感数据存储在/tmp中,例如使用安全临时文件或设置适当的权限。:由于/tmp可以迅速填满,特别是在磁盘空间有限或有许多用户的系统上,因此系统管理员需要监控和管理/tmp的大小和内容。

2023-12-24 15:12:52 668

原创 [LInux操作系统]——文件操作基本命令:cat

(2)实现文件合并。使用cat可以通过I/O重定向的方法将多个文件的显示内容改道到某个文件中,从而实现文件合并。(1)当不带文件名只运行cat时,进入交互模式,按Ctrl+D/Ctrl+C终止。1.功能:cat(concatenate)命令用来把文件内容显示到屏幕上。该命令会将file1和file2中的内容合并到file3中。

2023-12-24 14:49:06 375

原创 nn.relu和F.rulu的区别

在PyTorch中,nn.X都有对应的函数版本F.X,但是并不是所有的F.X均可以用于forward或其它代码段中,因为当网络模型训练完毕存储model时,forward中的F.X函数中的参数是无法保存的。也就是说,在forward中,使用的F.X函数一般均没有状态参数。nn.ReLU()创建一个nn.Module,这意味着你可以添加到nn.Sequential中。而nn.functional.relu只是对 relu 函数API的调用。一般来说,用模块还是简单的函数调用,取决于你的编码风格。

2023-12-03 14:10:28 526

原创 Ubuntu22无法自动进入lightdm图像界面

Ubuntu22无法自动进入lightdm图像界面,必须手动运行。不接受lightdm作为设置,但是,已设置为正确的值,运行下面的命令。因此,在文本编辑器中打开。

2023-10-01 20:19:08 820

原创 [论文阅读]YOLOV1:You Only Look Once:Unified, Real-Time Object Detection

我们提出了YOLO,一种新的目标检测方法。之前的目标检测工作重新使用分类器来执行检测。相反,我们将目标检测表述为空间分离的边界框和相关类概率的回归问题。单个神经网络在一次评估中直接从完整图像中预测边界框和类别概率。由于整个检测管道是一个单一的网络,因此可以直接对检测性能进行端到端的优化。我们的统一架构非常快。我们的基础的YOLO模型以每秒45帧的速度实时处理图像。该网络的一个更小版本,Fasr YOLO,每秒处理的图片达到惊人的155帧,同时mAP仍然达到其他实时探测器的两倍。

2023-09-23 11:48:33 123

原创 [代码解读] A ConvNet for the 2020s

在b这个类的具体代码中我们可以看到文章中所提到的其他的设计要点,包括:使用3:3:9:3的阶段比、使用核大小为4×4,步长为4的卷积层来实现patchify层。

2023-09-19 20:03:22 138

原创 [论文阅读]A ConvNet for the 2020s

视觉识别的咆哮的20年代开始于ViTs的引入,它很快取代了卷积神经网络,成为最先进的图像分类模型。另一方面,一个原始的ViT在用于一般的比如目标识别和语义分割的计算机视觉任务的时候面临困难。层次Transformer(例如,Swin-Transformer),它重新引入了几个卷积神经网络先验,使Transformer作为通用视觉主干实际上可行,并在各种视觉任务中表现出卓越的性能。然而,这种混合方法的有效性仍然很大程度上归功于Transformer的内在优势,而不是卷积固有的归纳偏差。

2023-09-18 22:27:28 443 1

原创 [论文阅读]Coordinate Attention for Efficient Mobile Network Design

最近关于移动网络设计的研究已经证明了通道注意力(例如, the Squeeze-and-Excitation attention)对于提高模型的性能有显著的效果,但它们通常忽略了位置信息,而位置信息对于生成空间选择性注意图非常重要。在本文中,我们提出了一种新的移动网络注意力机制,将位置信息嵌入到通道注意力中,我们称之为“坐标注意力”。与通过二维全局池化将特征张量转换为单个特征向量的通道注意力不同,坐标注意力通过分别沿着两个空间方向聚合特征,将通道注意分解为两个一维特征编码过程。

2023-09-13 21:34:42 514

原创 [论文阅读]Visual Attention Network原文翻译

虽然一开始是被设计用于自然语言处理任务的,但是自注意力机制在多个计算机视觉领域掀起了风暴。然而,图像的二维特性给自注意力用于计算机视觉带来了三个挑战。(1)将图像视作一维序列忽视了它们的二维结构;(2)二次复杂度对于高分辨率图像来说太昂贵了;(3)它只捕获了空间适应性而忽略了通道适应性。本文我们提出了一种新颖的被叫做大核注意力(Large Kernel Attention,LKA)的线性注意力使得自注意力中的自适应和长期相关性有效的同时避免其缺点。

2023-09-11 20:12:14 393 1

原创 [Micropython]ImportError: no module named ‘upip‘问题

按道理来说upip是默认安装的包,在给设备安装micropython的时候会自动安装,但是报了错。

2023-08-23 16:48:44 539 2

原创 【OpenMMLab AI实战营二期笔记】第十一天 玩转AIGC神器MMagic代码教程

【代码】【OpenMMLab AI实战营二期笔记】第十一天 玩转AIGC神器MMagic代码教程。

2023-06-16 23:08:38 575

原创 【OpenMMLab AI实战营二期笔记】第十天 底层视觉与MMEditing

对抗生成网络是一种基于神经网络的无监督学习模型,可以建模数据的分布,并通过采样生成新数据。效果。

2023-06-15 17:38:30 688

原创 【OpenMMLab AI实战营二期笔记】第九天 MMSegmentation代码课

下载整理好的数据集;可视化探索数据集;准备config配置文件;MMSef训练语义分割模型;可视化训练日志;用训练得到的模型预测;测试集性能评估;

2023-06-14 21:31:22 576

原创 【OpenMMLab AI实战营二期笔记】第八天 语义分割与MMSegmentation

将图像按照物体的类别分割成不同的区域,相当于对每个像素进行分类。无人驾驶汽车人像分割实时替换视频背景智能遥感分辨地表物体的类别,通过右侧分割之后的图像可以看到,红色的部分属于湖泊河流。通过智能遥感能够监测不同季节地表水域的变化,从而辅助农业生产,以及旱灾洪灾的预测等等。医疗影像分析语义分割 vs 实例分割 vs 全景分割先验知识:物体内部颜色相近,物体交界颜色变化存在的问题:(1)先验知识不完全准确;(2)不同物体颜色可能相近,物体内也会包含多种颜色。存在的问题:效率低下,

2023-06-13 18:25:03 505

原创 【OpenMMLab AI实战营二期笔记】第七天 MMDetection代码课

本教程采用 RTMDet 进行演示,在开始自定义配置文件前,先来了解下 RTMDet 算法。其模型架构图如上所示。RTMDet 是一个高性能低延时的检测算法,目前已经实现了目标检测、实例分割和旋转框检测任务。为了获得更高效的模型架构,MMDetection 探索了一种具有骨干和 Neck 兼容容量的架构,由一个基本的构建块构成,其中包含大核深度卷积。MMDetection 进一步在动态标签分配中计算匹配成本时引入软标签,以提高准确性。

2023-06-10 14:27:02 332

原创 【OpenMMLab AI实战营二期笔记】第六天 目标检测和MMDetection

(1)人脸识别(2)智慧城市(3)自动驾驶(4)下游视觉任务:场景文字识别、人体姿态估计框泛指图像上的矩形框,边界横平竖直。边界框通常指紧密包围感兴趣物体的框,检测任务要求为图中出现的每个物体预测一个边界框定义:两矩形框交集面积与并集面积之比,是矩形框重合程度的衡量指标。定义:神经网络中,一个神经元能看到的原图的区域感受野的中心:感受野的步长(=降采样率=特征图尺寸的缩减倍数):感受野一般很大,但不同像素对激活值的贡献是不同的,也就是说激活值对感受野内的像素求导数,大小不同。影响比较大的像素通

2023-06-08 23:28:45 624

原创 【OpenMMLab AI实战营二期笔记】第五天 MMPretrain代码课

从kaggle上找到一个类似的数据集,下载地址:https://www.kaggle.com/datasets/esuarez7/cats_dogs_dataset/download?预训练权重的下载地址:https://download.openmmlab.com/mmclassification/v0/resnet/resnet18_8xb32_in1k_20210831-fbbb1da6.pth。(4)runtime(包括日志配置、权重保存配置、随机性可指定随机种子)以下是完整的配置文件中的内容。

2023-06-07 17:33:07 292

原创 【OpenMMLab AI实战营二期笔记】第四天 深度学习预训练与MMPretrain

MMPretrain是一个全新升级(MMPretrain originates from MMClassification and MMSelfSup )的预训练开源算法框架,旨在提供各种强大的预训练主干网络,并支持了不同的预训练策略。主要功能:(1):包括主干模型、自监督学习算法、多模态学习算法(2):COCO、ImageNet等常见数据集(3):优化器与学习率策略、数据增强策略(4)

2023-06-06 10:55:32 243 1

原创 【OpenMMLab AI实战营二期笔记】第三天 MMPose代码教程

代码教程地址:github.com/TommyZihao/MMPose_Tutorials。

2023-06-03 16:40:06 296

原创 【OpenMMLab AI实战营二期笔记】第二天 人体姿态估计与MMPose

从给定的图像中识别人脸、手部、身体等关键点输入:图像输出:所有关键点的像素坐标。

2023-06-02 22:02:22 188

原创 【OpenMMLab AI实战营二期笔记】第一天 OpenMMLab介绍

行业趋势:由统一的深度学习框架(TensorFlow、Pytorch、PaddlePaddle)向统一的算法框架和生态(OpenMMLab)过渡。OpenMMLab的定位:产学研用四位一体的开源算法体系以下一图以蔽之。

2023-06-01 23:01:06 77

原创 本地部署的CVAT注册使用

在(注意官方说只能使用谷歌浏览器)中输入网址。

2023-04-05 16:06:14 415 2

原创 openmmlab系列可视化训练过程

在openmmlab系列中使用tensorboard可视化训练过程

2023-02-02 23:23:25 236

原创 YOLOV7训练自己的数据集

windows+ anaconda +vscode+YOLOV7训练自己的数据集

2022-07-14 20:01:22 3109 25

原创 机器学习数据集半自动标注制作流程

1.收集数据集,清理数据集2.手动标注部分数据集3.将标注好的数据集用自己的模型训练4.将未标注数据用模型进行预测,输出预测文件5.将预测的数据重新导入标注工具,进行人工调整

2022-07-11 10:00:11 1821

原创 vscode中plt.show()阻塞程序以及实现动态绘图的解决方法

但是只开交互式绘图的话,会有图像框出来,但是一闪而过,不会显示图像,此时要在绘图后加上之后图像就可以正常显示

2022-06-17 18:07:17 1369

原创 torch中view和reshape的区别

在此记录https://www.jb51.net/article/236201.htm

2022-05-26 17:45:14 126

原创 ubuntu中conda无法创建环境

注意看报错信息中有没有关于代理的内容,如果有的话,找到.condarc文件(找不到文件可以自己创建一个,一般就在安装目录下面,是一个隐藏文件),在其中加入代理信息:proxy_servers: http: http://127.0.0.1:端口 https: http://127.0.0.1:端口(自行替换端口号)之后重开一个终端就可以了。...

2022-05-13 10:54:40 489

原创 torch中arange和range的区别

最重要的的区别:torch.arange()x = torch.arange(1.0,5.0)print(x)输出:tensor([1., 2., 3., 4.])torch.range()y = torch.range(1.0,5.0)print(y)输出:tensor([1., 2., 3., 4., 5.])可以看到:torch.arange(start,end)的结果不包括endtorch.range(start,end)的结果包括end...

2022-03-24 10:17:24 218

原创 《操作系统》考研复试问题总结:第一章计算机系统概述

2022-02-20 10:12:59 202

原创 c++中定义变量时的默认初始化问题记录

在定义变量的时候没有指定初值,变量会被默认初始化。是否初始化,初始化成什么值取决于:1.变量类型;2.定义变量的位置。例如:内置类型的变量未被显示初始化的时候,定义在任何函数体外部的变量会被初始化,而在函数体内定义变量将不被初始化代码示例如下:#include <iostream>#include <string>std::string global_str;//将被初始化为空串int global_int;//将被初始化为0int main(){ int

2022-01-02 20:20:18 350

原创 [C++学习问题记录]注释

C++ 注释一般有两种:(1)// - 一般用于单行注释。(2)/* … */ - 一般用于多行注释。注释的嵌套:可以在一种注释内嵌套另一种注释,但是块注释符(/…/)是不可以嵌套使用的。

2021-08-04 22:13:09 135

原创 [C++学习问题记录]预编译文件

[C++学习问题记录]预编译文件1.在#include "pch.h"之前的所有include都会被忽略,可能会导致编译出错。2.如果使用了预编译头技术,就必须在项目中所有的 cpp 中包含预编译头,否则会出错。

2021-07-30 23:10:16 57

原创 解决“All CUDA-capable devices are busy or unavailable”问题的几种可能方法

1.最简单的重装现有的nvidia驱动2.用nvidia-smi查看显卡的工作模式,是不是变为了独占模式,用nvidia-smi -g 0 -c 0恢复默认模式。3.有可能是现有驱动的问题,可以尝试将驱动降级。这种方式适用于,在检查显卡驱动,cuda等都正常工作的时候使用。...

2021-04-20 18:24:17 9632 2

YOLOv7源代码+权重文件

方便各位下载,YOLOv7源代码+权重文件

2022-07-14

机器学习数据集猪头部识别yolo格式

1490左右张已经标注好的猪的头部的图片,yolo格式

2022-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除