自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(201)
  • 收藏
  • 关注

原创 【linux】Netcdf4安装

踩坑记录,看中文社区的文章来配环境简直就是掘shit… 失败了好多次,痛定思痛以后一定要直接去谷歌全流程走过一遍没有问题,希望大家能少踩坑核心就是要把--prefix都装到一个目录下。

2024-04-23 08:55:42 770

原创 随心玩玩(十五)LLM 浅玩一下RWKV模型

(随便cv的,见谅,有空单独写一篇博客看看RWKV的源码吧…)2024 年 1 月 28 日,RWKV 开源基金会宣布开源 RWKV-5-World 7B 模型。RWKV 是一种创新的深度学习网络架构,它将 Transformer 与 RNN 各自的优点相结合,同时实现高度并行化训练与高效推理,时间复杂度为线性复杂度,在长序列推理场景下具有优于 Transformer 的性能潜力。RWKV-v5 架构模型能力指标接近 Llama2,但推理成本降低 2~10 倍,训练成本降低 2~3 倍。

2024-04-21 23:34:09 998

原创 随心玩玩(十四)词法解析器

和大佬交流的时候我完全啊吧啊吧,只能恶补一下这部分知识了。

2024-01-19 21:58:59 884

原创 随心玩玩(十三)Stable Diffusion初窥门径

Stable Diffusion是一种人工智能(AI)模型,可以根据训练数据创建图像。Stable Diffusion使用的是一种称为潜在扩散模型(LDM)的东西。Stable Diffusion用于根据文本提示生成图像,并使用修复和外部绘制的过程改变现有的图像。参考资料1:参考资料2:参考资料3:不想写的太长,更详细的介绍请查看参考资料ControlNet是一种网络结构,通过添加额外控制条件,来控制出图效果。(官网,适合高玩直接上手)(推荐新手照着做)

2024-01-15 21:59:29 2571 2

原创 随心玩玩(十二)通义千问——LLM大模型微调

什么是通义千问?通义千问(Tongyi Qianwen)是由阿里巴巴集团旗下的云端运算服务的科技公司阿里云开发的聊天机器人。它能够与人互动、回答问题及协作创作。这个名字来源于两个方面:“通义”意味着该模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具备了跨领域的知识和语言理解能力。“千问”代表了模型可以回答各种问题,包括常见的、复杂的甚至是少见的问题。什么是LLM?

2024-01-11 21:53:26 2742 1

原创 Slurm随手记

Slurm是一个开源、容错、高度可扩展的集群管理和作业调度系统,适用于大型和小型Linux集群。Slurm的操作不需要对内核进行修改,并且相对独立。作为集群工作负载管理器,Slurm具有三个关键功能。首先,它将对资源(计算节点)的独占和/或非独占访问分配给用户一段时间,以便他们可以执行工作。其次,它提供了一个框架,用于在分配的节点集上启动、执行和监视工作(通常是并行作业)。最后,它通过管理挂起的工作队列来仲裁资源争用。

2023-12-21 22:47:11 1035

原创 下午好~ 我的论文【yolov5】(第四期)

YOLO V4没过多久YOLO V5就出来了。YOLO V5的模型架构是与V4非常相近的。综合而言,在实际测试中,Yolov4的准确性有不错的优势,但Yolov5的多种网络结构使用起来更加灵活,我们可以根据不同的项目需求,取长补短,发挥不同检测网络的优势。Yolox的改进trick中,有很多值得借鉴的地方。

2023-12-21 17:03:20 482

原创 关于Selenium的网页对象单元测试的设计模式

当我们登录成功后,我们就可以跳转到我们需要页面,进行脚本处理。当然了进入了新的页面,别忘了创建新的页面类。在我的例子中就是创建了新的页面类ResourceDetailPage以便完成后续的业务。然后我们新建page.py,在这里我们只处理页面的对象,因此我们创建页面类在此,当然这个页面类需要和HTML元素和驱动进行组合才能形成一个页面。接着我们在locator.py创建定位器类,没什么特别,就是作为一个类似字典的静态类存放元素的位置。接着我们在element.py创建元素的基类,以后的元素类都继承自它。

2023-12-21 15:59:11 1379 1

原创 随心玩玩(十一)Selenium从入门到入土

Selenium是一个用于自动化浏览器操作的开源框架,而Selenium WebDriver则是Selenium的一个组件,它提供了一种编程接口,用于控制浏览器的行为。Selenium WebDriver支持多种浏览器,包括但不限于Chrome、Firefox、Safari和Edge等。Selenium Python绑定提供了一个方便的API来访问Selenium WebDrivers,如Firefox、Ie、Chrome、Remote等。

2023-12-20 16:45:20 1077

原创 下午好~ 我的论文【CV边角料】(第三期)

最后,将加权后的特征与原始特征相乘,得到最终的特征表示。这个模块通过十字交叉注意力的设计,实现了更强的特征表达能力和更高的效率。总的来说,CCNet的优点包括生成更具辨别性的特征以及减少GPU内存的使用。但是其实现过程不是直接通过插值等方式产生这个高分辨率图像,而是通过卷积先得到 r^2个通道的特征图(特征图大小和输入低分辨率图像一致),然后通过周期筛选(periodic shuffing)的方法得到这个高分辨率的图像,其中r为上采样因子(upscaling factor),也就是图像的扩大倍率。

2023-12-16 21:40:23 934

原创 下午好~ 我的论文【yolo1~4】(第二期)

本来是一期的,我看了太多内容了,于是分成三期发吧 TAT (捂脸)

2023-12-16 21:38:53 944

原创 早上好,我的leetcode 【hash】(第二期)

坚持才是最难的事情C++代码还是不方便写,改用python了,TAT。

2023-12-16 21:28:57 1025

原创 下午好~ 我的论文【遥感】(第一期)

下午浑浑噩噩,泡杯茶,读篇论文吧首先说明,时间有限没有那么精力一一回复了,对不起各位了TAT。

2023-12-16 17:21:19 919

原创 早上好,我的leetcode【函数】(第一期)

每天早上到实验室早上昏昏欲睡,那不如写一题吧~

2023-12-16 17:09:31 1022

原创 随心玩玩(十)git

研究生一年多了,一直浑浑噩噩的,在深度学习的泥潭挣扎了好久,终于走出了精神内耗的泥潭…好久没有写博客了,决定重新捡起来…记录一下学习吧~之前写了一篇git的博客,

2023-12-03 19:18:46 1123

原创 Postgresql-12.5 visual studio-2022 windows 添加pg工程并调试

pg内核学习,记录一下。

2023-03-10 21:26:48 1464 1

原创 (pytorch进阶之路)Informer

论文:Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting (AAAI’21 Best Paper)看了一下以前的论文学习学习

2023-02-27 17:32:25 1545

原创 (学习笔记)Specification and Verification 验证与规范

写在前面, ppt鸟语一堆实在看得我头痛…离散数学高级版。

2023-02-12 17:09:18 494

原创 递归分治时间复杂度主定理法

像下面举了一个例子T(n),计算发现f(n)较大,同时还要验证正则条件a(f(n/b))

2023-01-05 17:04:04 1008

原创 RuntimeError: mat1 and mat2 must have the same dtype

一个快速的解决方法可能是替换dtype='float32’的浮点数。np默认返回float64类型。F.linear对精度傻了。不如去stackoverflow上看一眼。

2022-11-12 20:19:16 17109 9

原创 (pytorch进阶之路)CLIP模型 实现图像多模态检索任务

CLIP模型解决了一个多模态问题代码地址:https://github.com/yyz159756/CLIP-VIT-

2022-10-21 16:14:30 6433

原创 (pytorch进阶之路)Attention-based U-net实现

U-net 原理部分之前的博客有些了,这里主要记录一下代码实现U-net往期博客:https://blog.csdn.net/qq_19841133/article/details/126927383基于Attention-based(用的是自注意力机制)的U-net。

2022-10-20 23:58:20 2495 1

原创 (pytorch进阶之路)IDDPM之diffusion实现

DM beat GANs作者改进了DDPM模型,提出了三个改进点,目的是提高在生成图像上的对数似然第一个改进点方差改成了可学习的,预测方差线性加权的权重第二个改进点将噪声方案的线性变化变成了非线性变换。

2022-10-20 23:42:58 7633 7

原创 (随便看看)自监督学习

CVPR-2020 何凯明 动量对比无监督学习Nips-2020 Jean-Bastien Grill 仅正样本对比学习CVPR 2022 何凯明 MAE

2022-10-19 20:19:03 761

原创 (随便看看)进化算法

遗传算法进化策略神经网络进化

2022-10-04 11:26:11 621

原创 Random Forest,AdaBoost(adaptive boosting),GB (Gradient Boost), LightGBM

第三个特点是gradient based one side sampling,假设我们从最开始进行,模型m0执行后得到梯度下降结果gradient1,2,…在Ada中,首先weak learner构建a stump,one root and two leaf,leaf是分化出来的两个bin候选的属性,推理预测每个数据,根据结果动态的调整权重,错误的样本权重增加,相对的正确的样本权重减小,对下一个weak learner,更多的注意力放在了错误预测的样本上,尽量去正确的预测之前模型预测错的样本。

2022-10-01 18:00:25 685

原创 (pytorch进阶之路)DDPM回顾及Autoregressive diffuision model

扩散模型和自回归模型结合做多变量的序列预测的任务,基于过去一段时间的数据去预测未来一段时间的数据,并且是由一种自回归的方式去预测通过DDPM的回顾,我们得到了目标函数将其运用到自回归模型,我们可以用RNN或者Transformer构建时间依赖性的网络xt-1和ct-1输入到RNN中,生成ht-1,使用条件的扩散模型得到xt,ht-1作为模型的条件,现在有一个条件概率模型能够基于ht-1预测当前时刻的所想要的xt,前向过程还是从x0到xN,只不过在逆扩散过程构建噪声网络的时候加入一个ht-1。

2022-09-20 10:07:01 1498

原创 (pytorch进阶之路)U-Net图像分割

在开始u-net用在生物图像分割,细胞电镜图片输入到U-net输出一张细胞组织分割的图像作者提出了U型的架构做图像分割的任务,照片输入到网络,输出对每个像素点的分类,如分类像素点是目标对象还是背景,给不同的分类对象涂上不同的颜色总体模型:输入单通道572×572,输出2通道388×388,2通道是因为做的 像素二分类,572是从388填充而来的,外围做的镜像填充,这样外围的像素点也有上下文信网络的第一阶段首先单通道572×572经过3×3的卷积,得到570×570,输出通道数为64。

2022-09-19 16:02:24 2396 2

原创 (pytorch进阶之路)交叉熵、信息熵、二分类交叉熵、负对数似然、KL散度、余弦相似度

时空维放后面比如C后面依次是H,W,channel,T,把分类维度C放在第二维度,后面的维度多少维都没问题,注意这里的input是未归一化的,也就是没有进行softmax。target可以传入一个整型,一个类别的标签,如果输入是[N,C],则传入[N],如果输入传入的是[N,C,…] ,则target为[N,…做机器学习的时候,用CE和kld其实是一样的,因为IE传入的target分布是一个one-hot分布,熵其实为0,如果是非delta分布计算出的结果也是一个常数,对参数更新没有任何贡献。

2022-09-18 16:21:21 2068

原创 (pytorch进阶之路)DDPM扩散概率模型

扩散概率模型2020年类似VAE GAN是一个生成式模型生成模型一共五类,seq2seq自回归的解码GAN,通过判别器迭代优化生成器Flow,数学严谨可逆过程,设计巧妙的结构VAE,

2022-09-17 16:54:25 3662 1

原创 (pytorch进阶之路)NormalizingFlow标准流

NF和GAN一样是一个生成模型,NF与GAN不同的是,GAN是以模糊的方式对目标数据分布进行建模, 没有直接写出px的表达式,而是将x送入下游的判别器做分类任务,通过对抗的方式让生成器生成比较好的效果而标准流NF可以显式地将目标的表达式px写出来,通过优化对数似然函数达到最大去调整参数,使得模型很好的拟合目标分布标准流模型是一个可逆的模型,也就是训练的时候,是从x到z的变化过程,最大化似然函数,推理时候就反过来使用,以一个随机变量z作为输入,把网络完全逆过来,计算反函数,算出x。

2022-09-16 12:50:31 3235 3

原创 (pytorch进阶之路)cGAN、LSGAN

原来gan有什么问题:判别器的输入无论是真实的样本还是预测样本,输入都只有一个,x或者g(z),我们只是把照片放入判别器中但是我们在MNIST数据集中,有10类数据分别是0~9,仅仅是输入随机的高斯变量z,没有输入任何的其他信息,不能指望生成器能够生成特定数字照片。...

2022-08-11 20:55:30 1042

原创 (pytorch进阶之路)GAN

GAN通过一个对抗过程同时训练两个模型,一个模型是G生成模型,另一个是分类模型D,D用来判别生成样本是来自于真实的样本还是来自于虚构的样本,训练G的过程是为了让D犯错的概率最大,也就是D无法判断是生成的还是真是的样本。预测predictionG和预测predictionData相等时,根据D*公式,判别器输出为1/2,替换C(G)的 D* 变量,输出C(G) = -log 4。对k循环,从噪声z中采样构成噪声样本,从真实的样本中拿出样本x,基于梯度下降公式更新判别器的参数θd。导入MNIST训练集部分。..

2022-08-10 21:52:23 342

原创 (pytorch进阶之路)四种Position Embedding的原理及实现

定义子函数,获得每个window中两两patch之间二维的位置偏差,使用torch.meshgrid函数,根据x轴和y轴范围得到网格每个点的x坐标和y坐标,将其堆叠,获取任何两个点之间的横轴与纵轴坐标的差值,扩维做差即可。假设width等于5,有5个patch,0,1,2,3,4,第一个patch[0]和最后边的patch距离是-4,最 后一个patch和最左边的距离是4,综上距离值域是[-4, 4],个数是2 * 4 + 1,即。这里的table是随机初始化的,在模型中是可学习的。......

2022-08-09 19:33:22 8388 2

原创 (pytorch进阶之路)五种归一化原理和实现

为什么IN能实现风格迁移,输入是[N,L,C],我们对dim=1求均值和标准差,相当于当前这个单一样本在所有时刻不变的东西,我们减去均值再除以标准差,相当于我们把这个单一的时序样本在所有时刻中都有的东西消去了,什么东西是这个样本在所有时刻都有的呢,就是这个样本(图片)的风格,如果是音频,那就是这个人的说话的身份是不变。调用API,传入emb_dim,为了方便验证关闭affine,传入的input的格式是[N,C,L],输出格式也是[N,C,L],我们习惯[N,L,C],我们就转置一下。.........

2022-08-08 23:50:45 2809

原创 (pytorch进阶之路)Masked AutoEncoder论文及实现

这一部分简单介绍一下什么是MAEResnet的一作和MAE的一作都是何恺明大佬,于Facebook AI Research (FAIR)研究MAE作者给的定义是基于部分被观测的量去预测整个原始图像的简单的自编码方法MAE属于自监督学习的一种,像自监督学习NLP领域中还有word embedding,transformer,bert摘要,第一部分是写作意图,第二部分是对模型或者算法的描述,第三部分写在某某任务上取得的效果写作意图:提出用于CV自监督学习模型模型细节:图片分成一个个patch,随机的遮住一些块,

2022-08-06 21:31:04 2416

原创 (pytorch进阶之路)ResNet论文及实现

首先写了写作的背景,指出当前领域面临的问题,第二句话提出了解决方案残差学习框架和目的,后面是细节的展开和比赛取的成绩为了深层网络不差于浅层网络,让后面的层学习恒等变换,我们希望深层比浅层网络多出来的层数学习的函数y=x,也就是这些层没有起到任何的作用,这样深层网络至少和浅层网络一样好。算法用论文的图2表示,论文核心的思想框架x输入象征浅层网络输出,下面视作深层网络,浅层网络输出添加一条路径连接深层网络输出,这样多出来的这些层学习的是y-x,学习的是残差,这样比直接去学y容易学如果浅层网络足够的话。.....

2022-08-02 15:11:11 1113 2

原创 (pytorch进阶之路)ConvNeXt论文及实现

block层,没有4个stage的概念了,不同stage之间也没有下采样了,3+3+9+3一共18个block,block都是dim=384,每个block里面都是3层,第一层是dim=384的depth-wise二维卷积,第二层1×1的dim=384×4的point-wise卷积,第三层是1×1的dim=384的point-wise卷积,输入和最后一层输出进行残差连接,一共进行18次。..................

2022-08-01 15:04:23 3699 1

原创 (pytorch进阶之路)pytorch训练代码编写技巧、DataLoader、爱因斯坦标示

重写init,len,getitem三个函数getitem尽量从内存读(init中的),避免读磁盘若数据太大,可以维持一个固定的内存池,偶尔从磁盘读。

2022-07-24 22:34:43 927

原创 (pytorch进阶之路七)Attention Based Seq2Seq

decoder是解码器,将编码和注意力机制融合,解码器在每一步预测的时候需要对编码器输出状态做一个加权的求和,有forward函数和inference函数,forward函数用于训练,inference用于预测推理阶段。decoder在训练中会传入真实的seq_ids作为输入,但是这个seq_ids是带偏移的,最前面会补一个start_id,最后面会添加一个end_id,推理的时候以start_id作为开始,以end_id作为结束。encoder对语言上下文表征的建模。完整代码见github。......

2022-07-20 00:47:49 445

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除