- 博客(133)
- 收藏
- 关注
原创 TensorRT介绍
TensorRT文章目录TensorRT训练和推理的区别TensorRTTensorRT 优化和性能TensorRT 工作原理Python APIImporting TensorRT Into PythonCreating A Network Definition In PythonBuilding An Engine In PythonSerializing A Model In PythonPerforming Inference In PythonexamplesWorking With Mixed
2021-03-03 21:27:29 40724 2
原创 长短期记忆网络(Long Short-Term Memory,LSTM)及其变体双向LSTM和GRU
LSTM(Long Short-Term Memory)长短期记忆网络,是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。LSTM是解决循环神经网络RNN结构中存在的“梯度消失”问题而提出的,是一种特殊的循环神经网络。
2018-07-05 16:52:07 54258 5
原创 卷积神经网络常见架构AlexNet、ZFNet、VGGNet、GoogleNet和ResNet模型
目前的常见的卷积网络结构有AlexNet、ZF Net、VGGNet、Inception、ResNet等等,接下来我们对这些架构一一详解。
2018-06-22 16:19:10 49389 12
原创 Pytorch错误:AssertionError: If capturable=False, state_steps should not be CUDA tensors
pytorch 1.12.0的bug
2023-10-09 14:42:09 709
原创 【文生图系列】Denoising Diffusion Probabilistic Models论文解读
此篇文章详细介绍了DDPM的原理,包含公式推导过程。
2023-08-18 16:59:42 225
原创 【文生图系列】如何在Stable Diffusion Webui中使用ControlNet
本文介绍了ControlNet的基本原理,以及ControlNet在Stable Diffusion Webui中的插件安装和使用方式。
2023-07-24 16:18:17 878
原创 【文生图系列】stable diffusion webui 汉化(双语)教程
此篇博文记录了stable diffusion webui的汉化步骤。
2023-07-18 17:10:08 1701
原创 【文生图系列】Stable Diffusion Webui安装部署过程中bug汇总(Linux系统)
部署stable diffusion webui过程中碰见的bug汇总
2023-07-17 16:26:00 1119
原创 【文生图系列】文生图大模型合集与效果对比
本篇博文粗略了介绍了OpenAI的DALL E系列,百度的ERNIE-ViLG系列,google的Imagen,MidJourney,Stable Diffusion,智源研究院的AltDiffusion,英伟达的eDiff-I和阿里的通义文生图大模型,并进行了效果对比。
2023-07-06 23:06:52 9490
原创 【已解决】cc1plus: fatal error: cuda_runtime.h: No such file or directory
本博客记录了xformers安装过程中cuda_runtime.h文件找不到的解决方案。
2023-07-05 17:48:59 2370
原创 conda虚拟环境中安装的cuda和服务器上安装的cuda的异同
nvidia-smi官方提供的CUDA Toolkit是一个完整的工具安装包。Anaconda 在安装 Pytorch 等会使用到 CUDA 的框架时,会自动为用户安装 cudatoolkit,其主要包含应用程序在使用 CUDA 相关的功能时所依赖的动态链接库,不会安装驱动程序。只要系统上存在与当前的 cudatoolkit 所兼容的 Nvidia 驱动,则已经编译好的 CUDA 相关的程序就可以直接运行,而不需要安装完整的 Nvidia 官方提供的 CUDA Toolkit .
2023-06-28 16:43:47 1771 3
原创 【YOLO系列】YOLOX(含代码解析)
YOLOX是来自旷视团队的团队提出了,它再YOLO v3的基础上进行改进,是anchor free类模型。它使用decoupled head替代coupled head,提高head的表达能力。它使用multi positives的技巧,减少高质量预测框的损失。它使用SimOTA在不增加训练时间的前提下进行样本匹配。它使用Mosaic和Mixup进行更强形式的数据增强。多种技巧,让YOLOX模型具有高精度。
2023-06-26 17:15:58 1349
原创 【linux】解决Git错误Permission denied(publickey)
解决git 克隆项目时,出现Permission denied(publickey)错误。
2023-06-18 18:48:29 1446
原创 【文生图系列】基础篇-变分推理(数学推导)
此篇博文主要介绍什么是变分推理(Variational Inference , VI),以及它的数学推导公式。变分推理,是机器学习中一种流行的方式,使用优化的技术估计复杂概率密度。变分推理的工作原理:**首先选择一系列概率密度函数,然后采用KL散度作为优化度量找到最接近于概率密度的函数**。引入evidence lower bound的方法更容易计算近似概率。
2023-06-18 16:19:44 1260 3
原创 【文生图系列】基础篇-马尔可夫链
马尔可夫链是一个数学系统,它根据某些特定的概率规则从一个状态转换到另一个状态。马尔科夫的定义特征是:无论过程如何到达当前的状态,未来的状态都是固定的。也就是说,转换到任何特定状态的概率都取决于当前的状态和过去的时间。
2023-06-13 21:09:11 1248
原创 【文生图系列】Stable Diffusion原理篇
Stable Diffusion不是一个整体模型,它由几个组件和模型组成。首先是`文本理解组件`(text-understanding component ),将文本信息转换成数字表示,以捕捉文本中的想法。其次是`图像生成器`(image generator),图像生成器包括两步,图像信息创建者( Image information creator)和图像解码器(Image Decoder)。
2023-06-11 16:19:08 2089
原创 【YOLO系列】YOLO v5(网络结构图+代码)
YOLO v5提供了五个不同大小的预训练模型,分别是YOLOv5n、YOLOv5s、YOLOv5m、YOLOv5l和YOLOv5x。这五个模型的网络架构一样,不同的是每层通道数和宽度不一样。
2023-06-09 17:31:35 5732 1
原创 【文生图系列】 Stable Diffusion v2复现教程
本教程是Stable Diffusion v2的复现过程,基础环境承接Stable Diffusion v1,过程中也遇到好多bug,最后都一一解决了。
2023-06-06 18:20:21 3183 4
原创 【文生图系列】 Stable Diffusion v1复现教程
stable diffusion是一个潜在的文本到图像的扩散模型,能够在给定任何文本输入的情况下生成照片逼真的图像。本篇博文主要讲述如何复现官方的stable diffusion v1项目。
2023-06-05 16:36:57 4518 7
原创 【YOLO系列】YOLO v4(网络结构图+代码)
V4在V3的基础上整合了大量提升精度的trick,实现了FPS和精度的平衡。Yolo v4虽没有理论上的创新,单还是受到许许多多的工程师的欢迎。
2023-06-04 17:57:43 1346
原创 TensorRT8.2 使用Python API进行推理
此篇文章是代码分享,TensorRT的基本知识点请见我的博文TensorRT介绍,里面讲述了TensorRT的工作原理和python API的介绍。
2023-05-29 18:02:28 503 2
原创 【YOLO系列】YOLO v3(网络结构图+代码)
在YOLO的发展史中,v1到v3算法思想逐渐完备,后续的系列也都以v3为基石,在v3的基础上进行改进,所以很有必要单独出一篇详细讲解v3的博文。本篇博文结合网络结构简图和代码,讲解YOLOv3的具体实现。
2023-05-16 10:10:43 2071 1
原创 【YOLO 系列】YOLO v4-v5先验知识
YOLO v4和v5版本在v3版本的基础上,组合了多种先进算法提升精度。为了能快速理解YOLO v4和v5,我们需要了解各种改进方法。此篇博文从输入端、主干网络、Neck和输出等四个方面简要介绍v4和v5中用到的改进方法。
2023-05-08 17:23:06 880
原创 ChatGPT背后的技术:人类反馈强化学习RLHF
人类反馈强化学习RLHF是一种强化学习的技术,其中人类专家提供了额外的反馈,以帮助智能系统更快地学习。在传统地强化学习中,智能系统收到奖励或惩罚作为反馈,以根据行动地结果调整其策略。而在RLHF中,人类专家的反馈可以提供更具体的信息,例如哪些策略是良好的,哪些是不好的,以及如何改进。这有助于提高智能系统的学习速度和准确性,并且使其能够在复杂的环境下操作。
2023-05-01 19:17:48 1780
原创 CLIP 论文解读
CLIP算法的核心是利用自然语言包含的监督信号来训练视觉模型。相比于其他的训练方法,从自然语言中学习具有以下两个优势。首先,相比于标准的有标签图像分类数据集,这种方法无需标注,就很容易扩展数据集;其次,图像和文字配对训练,学习到的特征不单单是一个视觉特征,而是多模态的特征,有助于zero-shot的迁移学习。
2023-04-18 16:57:01 1753
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人