- 博客(91)
- 收藏
- 关注
原创 【扩散过程示意图】画出diffusion models的扩散过程示意图解决方案
目录1、读入图片t=0时刻的图片2、定义前向过程3、获得添加noise的照片4、关键参数计算和定义6、完整代码和效果展示# forward diffusiondef q_sample(x_start, t, noise=None): if noise is None: noise = torch.randn_like(x_start) sqrt_alphas_cumprod_t = extract(sqrt_alphas_cumprod, t, x_start.shape)
2024-03-04 09:08:51 319
原创 【深度学习模型】扩散模型(Diffusion Model)基本原理及代码讲解
生成式建模的扩散思想实际上已经在2015年(Sohl-Dickstein等人)提出,然而,直到2019年斯坦福大学(Song等人)、2020年Google Brain(Ho等人)才改进了这个方法,从此引发了生成式模型的新潮流。目前,包括OpenAI的GLIDE和DALL-E 2,海德堡大学的Latent Diffusion和Google Brain的ImageGen,都基于diffusion模型,并可以得到高质量的生成效果。本文以下讲解主要基于DDPM,并适当地增加一些目前有效的改进内容。
2024-03-01 15:52:43 639
原创 【VSCODE修改代码行间距】解决方案
在我们编码的过程中,由于显示字体和显示器的不同,会需要调整行间距,在vscode默认的选项中没有看到设定行间距的选项,不过,可以手动修改配置档达到目的。注意,是Json格式的,具体的数值可以自行设定,保存后立即显示修改后的效果)2.打开配置档,手动进行设定。
2024-03-01 01:37:26 678
原创 【Pytorch中batch超参数的选择】对于batch_size解读
例如,在一些序列生成任务中,由于序列长度不同,使用非2的幂次方的batch size可以更好地利用GPU资源,同时避免不必要的内存浪费。因此,在具体应用中,是否选择2的幂次方的batch size取决于具体的情况。可以先尝试较小的batch size,然后逐步增加batch size的大小,直到出现显存不足或其他性能问题。在选择batch size时,还可以使用交叉验证等技术来评估模型的性能,以帮助选择最佳的batch size。如果模型比较复杂,则建议使用较小的batch size,以充分训练模型。
2024-03-01 00:51:39 1568
原创 在 Python 中部署DALL-E API 解决方案
DALL-E 是开发的一种生成式预训练转换器 (GPT) 模型,可以根据文本描述生成图像。它在文本和图像数据集上进行训练,使其能够理解两者之间的关系并生成与给定文本描述相匹配的图像。如何在没有密码的情况下解锁锁定的笔记本电脑该 API 可供开发人员使用,并且可以与各种编程语言(如 JavaScript、Python 等)集成。在本教程中,您将学习如何将 DALL-E 与 Python 结合使用。
2024-02-29 21:44:02 361
转载 【Vscode变量显示不全】代码调试时,列表(变量)内容显示不全的一种解决办法
列表维度是(1080,1920),但只能看到前500行,后面的看不到了。
2024-02-27 17:01:32 105
转载 【ubuntu20.04-记忆命令行历史】windows安装fish工具安装教程
fish工具是Linux下的一个工具,可以记忆敲过的命令行,在你敲了部分命令后,自动在后面提示最接近的命令行,并可以快速补全。
2024-02-27 16:37:23 28
原创 【pip install OSErorr】报错:Missing dependencies for SOCKS support】解决方案
【代码】【pip install OSErorr】报错:Missing dependencies for SOCKS support】解决方案。
2024-02-24 13:51:54 295
原创 【在python中import包】解决方案:使用脚本中sys.path.append(到当前路径的str),将包的父目录添加到sys目录中
④如果无法通过sys.path中的路径搜索到XX包,即说明自己的程序中引用的XX包,与自己程序脚本所在目录不在同一个路径。②所以我们在运行自己写的程序时,首先加载导入的XX包,加载的时候python解释器会去sys.path默认搜索路径去搜索。⑤然后我们就需要将XX包的搜索路径添加到自己程序脚本的默认搜索路径中,重新运行自己的程序脚本,先搜索XX包在家载XX包。把路径添加到系统的环境变量,或把该路径的文件夹放进已经添加到系统环境变量的路径内。③如果通过sys.path中的路径可以搜索到XX包,然后加载。
2024-02-22 17:09:52 804
转载 【开源文档格式转换器Pandoc】使用教程
Pandoc是由John MacFarlane开发的[标记语言]转换工具,可实现不同标记语言间的格式转换,堪称该领域中的“[瑞士军刀]。大白话就是将文档从一种格式转换为另外一种格式。因支持转换的格式众多,也被大伙称为【万能转换神器】Pandoc的基本使用还是比较容易上手的,如需系统的学习参照官方文档。
2024-02-21 23:37:36 45
原创 【python中的zip函数介绍和用法】使用教程
功能:zip 函数是可以接收多个,然后把每个可迭代对象中的第i个元素组合在一起,形成一个新的迭代器,类型为元组。参数:*iterables,任意个的 可迭代对象返回值:返回一个元组的迭代器a=[123b=[567c=zip(a,b)print(c)
2024-02-21 16:54:22 374
原创 【python中type函数的用法】
目录描述语法使用示例1. Python内置对象类型2. 自定义对象类型注意事项1. 使用==判断类型是否相等2. 子类和父类属于不同的类型type函数是Python的内置函数,返回参数的类型。 名称说明备注object任意类型的对象不可省略的参数 返回值:返回object对象的类(即对象的类型)class Aa(): pass b = Aa()print(type(b)) 输出结果是: class Animal(): pass class Human(Animal): pass
2024-02-20 17:00:42 428
原创 【torch.from_numpy函数的用法和逻辑】
中的一个函数,用于将 NumPy 数组转换为 PyTorch 的 Tensor。这个函数主要用于共享底层数据内存,而不进行数据的复制。# 使用 torch.from_numpy 将 NumPy 数组转换为 PyTorch Tensor。# 使用 torch.from_numpy 将 NumPy 数组转换为 PyTorch Tensor。如果输入是一个 Python 列表,需要先将列表转换为 NumPy 数组,然后再使用。这个函数在处理大型数据集时很有用,因为它避免了不必要的数据复制,提高了效率。
2024-02-20 16:58:46 463
原创 【conda环境 安装 tensorflow2.2】 解决方案
##conda create -n xxx python=3.6 xxx为虚拟环境名。conda create -n xxx python=3.7 xxx为虚拟环境名。###conda create -n xxx python=3.5 xxx为。4.激活新建的环境:activate tensorflow。点击第二个(existing enviroment)安装:在cmd输入 conda --version。点击第二个(conda environment)5.使用Anaconda查看路径名。
2024-02-19 23:59:51 583
原创 【Ubuntu20.04安装Times New Roman】解决方案
在ubuntu上使用WPS时,发现没有论文中常用的Times New Roman字体,通过运行如下命令行即可安装。
2024-02-15 20:34:37 398
原创 【pip安装加速】pip 更换清华源
windows下,直接在user目录中创建一个pip目录,如:C:\Users\xx\pip,新建文件pip.ini,内容如下。加上以上代码就可以从镜像源安装numpy库。
2024-01-31 21:10:54 793
转载 【Git本地init与push到远程仓库】
注意:我们第一次push的时候,加上-u参数,Git就会把本地的master分支和远程的master分支进行关联起来,我们以后的push操作就不再需要加上-u参数了。git默认会把工作区和暂存区的改动都恢复到工作区,并且会删除当前进度。(先进入项目文件夹)通过命令 gitinit 把这个目录变成git可以管理的仓库。如果从在git服务器所在主机上的其他账户获取git服务器上面文件,则直接用。#恢复最新的进度到工作区和暂存区。# 进行功能开发,在阶段性完成之后,将代码合并回本地的dev分支。
2024-01-30 16:12:30 24
原创 【git 本地管理版本及与github合并】 Init Push Pull操作解决方案
git add . # 将本地文件全部添加到暂存区# git add作用是将代码提交到暂存区# git add .:将已经跟踪的进行了修改的文件以及新增加的文件提交到暂存区# git add -u .:将跟踪的修改或删除的文件提交# git add -a .:包括了前两项# git add -i .:作用范围同-ugit commit -m 'message' # 将更新后的被追踪代码提交到本地branch中,相当于修改了本地仓库的状态1。
2024-01-30 16:09:43 987
转载 【生成模型评估指标-FID】FID指标的公式、定义以及pytorch实现方法
FID(Fréchet Inception Distance)是一种用于评估生成模型和真实数据分布之间差异的指标。它是由Martin Heusel等人在2017年提出的,是目前广泛使用的评估指标之一。FID是通过计算两个分布之间的Fréchet距离来衡量生成模型和真实数据分布之间的差异。Fréchet距离是一种度量两个分布之间距离的方法,它考虑到了两个分布的均值和协方差矩阵,可以更好地描述两个分布之间的差异。
2024-01-28 21:17:00 1174
原创 【Terminal显示输出】将ubuntu20.04系统终端的显示输出到log中解决方案
之后在终端输入的命令,和终端的所有输出信息都会保存到screen.log中。需要注意的是,输出文件在当前文件夹。
2024-01-27 18:44:10 381
转载 【BCI IV 2a数据增强】 数据集的数据增强
用于模型的训练之中。现在已经偏移了10 Hz,正如可以在。创建一个要训练的模型。具体内容在第三部分进行展示。在本章节中,我会展示如何使用。,现在是时候学习如何使用它们来。在前面的章节中,我们介绍了。可以传递给它,并将依次应用于。定义一个Transform。对数据进行提取窗口操作,同。既然我们知道了如何实例化。
2024-01-27 16:32:41 53
转载 【EEG数据集介绍】
0 引言1 项目简单介绍1.1 运动想象1.2 情绪识别1.3 误差相关电位 (ErrP)1.4 视觉诱发电位 (VEP)1.5 事件相关电位 [ERP]1.6 慢皮质电位 (SCP)1.7 静息状态1.8 音乐和脑电图1.9 眨眼/运动1.10 杂项1.11 临床脑电图2 其余未分类的数据集3 用于搜索数据集的资源网站4 总结这个Github项目是专门整理的高 Stars 项目,目前看起来整理的数据集还是挺多的,有兴趣的小伙伴可以持续关注。下面按照不同的EEG任务分别开始介绍项目内容。到此,使用。
2024-01-27 16:27:22 42
转载 【GAN】生成式对抗网络和扩散模型分析总结
由伊恩·古德费洛(Ian J.Goodfellow)等人于2014年发表在Conference on Neural Information Processing Systems (NeurIPS)上。NeurIPS是和计算神经科学领域的顶级国际学术会议之一。
2024-01-27 02:39:51 84
转载 【Diffusion Models】扩散模型中的Noise Scheduler
在扩散模型的训练过程中,pipeline首先产生一个与输入图片同尺寸的噪声图,在每个时间步(timestep),将噪声图传给model来预测噪声残差(noise residual),然后scheduler根据预测出的噪声残差来得到一张噪声较少的图像,如此反复,直到达到预设的最大时间步,就得到了一张高质量的生成图像。带有随机噪声的生成steps中间结果,Euler a,可以看到,图像的采样过程并没有收敛,如下图所示。没有随机噪声的生成steps中间结果,Euler,可以看到,图像的采样过程收敛,如下图所示。
2024-01-25 12:02:50 167
转载 【Braindecode】基于深度学习的EEG解码:在BCIC IV 2a数据集上进行试验
首先,介绍下如何配置项目所需的环境。项目所需环境配置Pytorch的配置。项目里面所用的诸多深度学习模型均基于Pytorch框架,因此需要安装Pytorch框架,具体安装需根据自己电脑显卡及cuda版本来进行;moabb的配置。的配置。到这里,项目的环境就配置完成了!!!
2024-01-25 10:23:22 87
转载 【Python中计算两张图像的相似度】计算两幅图像的相似度(PSNR、SSIM、MSE、余弦相似度、MD5、直方图、互信息、Hash)& 代码实现
亮度变化小的区域是低频成分,它描述大范围的信息。由于并未考虑到人眼的视觉特性(人眼对空间频率较低的对比差异敏感度较高,人眼对亮度对比差异的敏感度较色度高,人眼对一个 区域的感知结果会受到其周围邻近区域的影响等),因而经常出现评价结果与人的主观感觉不一致的情况。分为多块时,在实际应用中,可以利用滑动窗将图像分块,令分块总数为N,考虑到窗口形状对分块的影响,采用高斯加权计算每一窗口的均值、方差以及协方差,然后计算对应块的结构相似度SSIM,最后将平均值作为两图像的结构相似性度量,即平均结构相似性SSIM。
2024-01-22 17:12:47 223
转载 【计算FLOPs】GFLOPs、FLOPS和FLOPs的区别和联系(含代码示例)
TFLOPS(teraFLOPS):等于每秒一万亿(= 1 0 12 10^{12} 1012)次的浮点运算,(1太拉)PFLOPS(petaFLOPS):等于每秒一千万亿(= 1 0 15 10^{15} 1015)次的浮点运算。ZFLOPS(zettaFLOPS):等于每秒十万京(= 1 0 21 10^{21} 1021)次的浮点运算。EFLOPS(exaFLOPS):等于每秒一百京(= 1 0 18 10^{18} 1018)次的浮点运算。经过测试,基本上两个可以对齐的,任意选择一个就好。
2024-01-19 17:55:51 506
转载 【2024年CCF会议投稿时间】2024计算机领域顶级会议投稿截止时间/会议时间汇总
2023年即将过去了,计算机专业的同学们又结束了一年的会议投稿,2024年即将到了,总结一下计算机领域顶会的投稿时间等情况。如有错误,请各位(已有顶会/即将投顶会/观望中)的同学们及时提出!按CCF等级和进行排列,会议名+2024只是表示部分会议24年可参考的投稿时间,非24年举办。
2024-01-19 17:42:08 1737
转载 【计算机视觉】使用 python-notebook 展示如何下载和运行 CLIP models,计算图片和文本相似度,实现 zero-shot 图片分类
例如,通过将一张图片和一个描述该图片内容的文本查询进行编码,可以计算它们在向量空间中的距离,并找到与之相似的图片或文本。此外,CLIP还能够理解和生成自然语言描述的图像,以及生成图像描述的文本,具备了一定的语义理解和生成能力。在训练过程中,CLIP通过最大化相似图像和文本的相似性,并最小化不相似图像和文本的相似性来调整模型参数。开发的一个深度学习模型,用于处理图像和文本之间的联合表示。它的目标是将图像和文本嵌入到一个共享的向量空间中,使得相似的图像和文本在这个空间中距离较近,而不相似的图像和文本距离较远。
2024-01-19 16:48:33 317
原创 【.py文件分段运行】Python运行加速解决方案:在vscode中分段运行(无需安装插件)
a = 10print(a)b = 20print(b)这样按三个键是不是太反人类了?是的!这是自带的快捷键,Pycharm还提供了自定义快捷键,我一般会设置为shitf+enter,自定义快捷键步骤:文件(files)—设置(setings)—键盘映射(keymap)—执行python控制台的选定内容(英文自己查一下,我记不得了哈哈哈)—右键选择添加移除快捷键等。当然其他的快捷键你想怎么设置就怎么设置。
2024-01-19 16:39:06 454
原创 【Ubuntu 20.04 Firefox卡住】解决方案:查看和删除进程
在使用终端pip install clip.git时Firefox无法响应,需要调用ubuntu里面的“任务管理器”关闭进程。命令加上PID参数来结束指定的进程。接下来,我们需要确定要结束/删除的进程的PID。从上面的输出中选取相应的PID值。注意,由于涉及到系统进程,因此可能需要使用超级用户(root)权限来执行。该命令会显示所有包含"firefox"关键字的进程信息。如果要强制结束进程而不等待其完成任务,则可以添加。
2024-01-19 16:19:34 436
转载 【Stable Diffusion WebUI Linux系统部署】踩坑系列教程
知乎的这篇部署文档,本意是看上了自己创建conda的虚拟环境可以更好的对python环境进行管理,但是按照这个从头到尾试验了一遍,最终一直是有个报错搞不定大概是Assert Error问题,搜了好多教程也没有解决无奈只能放弃了,不过看到好多人按照这个教程部署成功了,如果有时间的话可以自己试一试。因为有AIGC方面的需要,所以研究了一下大火的stable diffusion,我自己之前没有部署这个的经验,所以基本是从0开始研究,在网上搜了各种教程一步一步的终于在。
2024-01-17 17:52:02 315
原创 【git clone时git报错:port 22】解决方案 ssh:connect to host github.com port 22: Connection timed out
如题,git使用中突然报错通过查阅各种资料,得知原因可能是由于电脑的防火墙或者其他网络原因导致方式 端口22被封锁。
2024-01-17 12:34:00 1318
转载 【Stable diffusion源码解读一:gradio使用方法】
目录收起1、Gradio的基本用法Gradio是什么Gradio的使用方法webui的界面实现AUTOMATIC1111的webui是近期很流行的stable-diffusion应用,它集合stable-diffusion各项常用功能,还通过扩展的形式支持controlnet、lora等技术。下图是stable-diffusion-webui的界面,可见功能强大。by 罗培羽。
2024-01-17 11:06:03 118
转载 【cuda 安装】(windows)图解+指定版本cuda
有的教程讲的很复杂,起始很简单,nvidia官方已经给了全家桶了,直接一个包装完,不用考虑其中的N个组件。
2024-01-17 10:27:52 157
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人