- 博客(175)
- 资源 (2)
- 收藏
- 关注
原创 LLM | GPT-NEOX论文详解
GPT-NEOX使用旋转位置编码。模型权重使用float16表示。最大序列长度为2048。论文题目:2022.04.14_GPT-NeoX-20B: An Open-Source Autoregressive Language Model。
2024-03-06 13:39:48 1279
原创 问题解决 | RuntimeError: CUDA error: invalid device ordinalCUDA kernel errors
RuntimeError(运行时错误): CUDA 错误:设备序号无效CUDA 内核错误可能会在其他 API 调用中异步报告,因此下面的堆栈跟踪可能不正确。为便于调试,可考虑通过 CUDA_LAUNCH_BLOCKING=1。使用 `TORCH_USE_CUDA_DSA` 进行编译,以启用设备端断言。
2024-03-04 13:41:36 1011
原创 CV | 医学影像上的图像分割模型调研【更新于20240304】
mamba相关的图像分割:VM-Unet,ManbaUnet,BRAUUnet,EGE。
2024-03-04 13:02:04 1063
原创 环境配置 |Jupyter lab/Jupyter Notebook 安装与设置
ipynb使用Jupyterlab/Jupyter Notebook 来编写程序时的文件,在使用时,可以现转换为标准的.py的python文件。
2024-02-29 07:35:57 1193
原创 CV | SAM在医学影像上的模型调研【20240223更新版】
本文主要是SAM(Segment Anything)在医学影像上的数据集,模型及评估方法调研【持续更新】~
2024-02-07 12:14:16 1161
原创 实用篇 | postman在AI模型中输入speech,text,image使用详解
postman在AI模型中输入speech,text,image使用详解
2024-01-30 15:48:35 1246 2
原创 LLM | 一些开源的AI代码生成模型调研及总结【20240130更新】
本文主要介绍主流代码生成模型,总结了基于代码生成的开源大语言模型,按照时间顺序排列。
2024-01-30 09:35:20 1259
原创 RL | 强化学习算法DDPG的理论理解及代码
深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)是一种强化学习算法,主要用于解决连续动作空间的问题。
2024-01-24 16:16:25 982
原创 生成模型 | 2024年新年新论文:audio2photoreal[正在更新中]
本博客主要包含了20240103新出的论文From Audio to Photoreal Embodiment: Synthesizing Humans in Conversations论文解释及项目实现~
2024-01-09 14:49:45 1027
原创 模型量化 | Pytorch的模型量化基础
量化简介量化是指执行计算和存储的技术 位宽低于浮点精度的张量。量化模型 在张量上执行部分或全部操作,精度降低,而不是 全精度(浮点)值。这允许更紧凑的模型表示和 在许多硬件平台上使用高性能矢量化操作。与典型的 FP32 模型相比,PyTorch 支持 INT8 量化,模型大小减少 4 倍内存带宽减少 4 倍INT8 计算的硬件支持通常为 2 到 4 个 与 FP32 计算相比,速度快几倍量化主要是一种技术 加速推理,量化仅支持前向传递 运营商。PyTorch 支持多种量化深度学习模型的方法。
2023-12-27 09:45:22 1181
原创 Linux | 解决问题Ubuntu重启无法进入系统以及网络无法连接【图文详解】
问题解决 | Ubuntu重启无法进入系统记以及网络无法联网问题~
2023-12-26 17:38:50 2394
原创 Docker | 将自己的docker镜像推送到docker hub[图文详情]
本文主要在Docker Hub上上传自己的镜像,可以按照以下图文步骤进行操作~
2023-12-20 15:12:27 1637
原创 生成模型 | 三维重建(3D reconstruction)调研及总结【20231219更新版】
本文是关于三维重建的论文调研,主要集中于基于图片到3d的模型~
2023-12-19 13:47:02 1158
原创 TTS | 2019~2023年最新增强/生成情绪的语音合成调研(20231211更新版)
本博客主要是增强/生成情绪的语音合成调研,论文按照时间顺序排列,
2023-12-11 14:16:32 1422
原创 实用篇 | 3D建模中Blender软件的下载及使用[图文详情]
本文基于数字人系列的3D建模工具Blender软件的安装及使用,还介绍了图片生成3D模型的AI工具~
2023-12-10 14:15:41 1941
原创 生成模型 | 数字人类的三维重建(3D reconstruction)调研及总结【20240222更新版】
本文主要集中于图片到三维重建的算法模型的调研,其中包含人体重建,人脸重建等,博客主要集中于数字人建模的基本方法论文以及算法发展类~ 不定时更新~
2023-12-10 12:08:15 1390
原创 TTS | NaturalSpeech2语音合成论文详解及项目实现
本文主要讲解了微软在2023年4月发表的NaturalSpeech2语音合成论文及项目相关~
2023-12-08 09:58:47 1638 1
原创 赶超GPT-4性能,谷歌最新多模态Gemini发布
Google Gemini 是 Google 正在推出的一套新的生成式 AI 服务,专门针对有兴趣扩展其 AI 服务的企业。它是由 Google DeepMind 项目创建的一系列多模态 AI 模型(我们将在下面详细介绍)。在一份技术报告中,Gemini 表示它超越了现存最强大的基础模型 GPT-4,并表明它不仅在文本生成方面领先,而且在多模态识别和处理方面也处于领先地位。
2023-12-07 12:58:02 923
原创 实用篇 | 利用Flask+Postman为深度学习模型进行快速测试(超详细)
利用Flask+Postman为深度学习模型进行快速测试,以及算法中的一些实例,以后会更新一些新的模板~~
2023-12-04 15:48:31 476
原创 LLM | 一文了解大语言模型中的参数高效微调(PEFT)
PEFT(参数高效微调)通过有针对性的系数调整来减少大型语言模型的计算和内存需求。LoRA(低秩采用)选择重要系数,而量化通过将高精度系数转换为较低精度的形式来减少内存使用,这两者在 PEFT 中都至关重要。使用 PEFT 微调 LLM 涉及结构化数据准备、库设置、模型选择、PEFT 配置、量化选择以及对训练和验证损失的监控,以平衡效率和模型性能。
2023-12-04 09:21:19 1869
原创 LLM | 一文搞懂Langchain的概念,相关组件,以及大模型微调~
本文主要介绍了Langchain的概念,相关组件,以及大模型微调代码实现等~
2023-12-03 14:27:05 1522 1
原创 实用篇 | Base64详解及代码示例
Base64是一种二进制到文本的编码系统,它使用一组 64 个不同的 ASCII 字符将二进制数据传输为基于文本的格式。它通常用于对二进制数据进行编码,例如图像或音频文件。一般来说,编码是指将数据从一种格式转换为另一种格式的过程。Base64 编码是通过使用一组 64 个不同的 ASCII 字符表示二进制数据来实现的。当需要在本机不支持二进制数据的系统之间交换数据时,此编码特别有用。
2023-12-01 14:07:35 1829
原创 实用篇 | 关于Gradio快速构建人工智能模型实现界面,你想知道的都在这里
本文描述了gradio的各函数使用,以及关于图像,自然语言护理基于音频相关的所有实例模版~
2023-12-01 12:23:33 1852
原创 Linux | Ubuntu设置 netstat(网络状态)
netstat命令用于显示与IP、TCP、UDP和ICMP协议相关的统计数据,一般用于检验本机各端口的网络连接情况。netstat是在内核中访问网络及相关信息的程序,它能提供TCP连接,TCP和UDP监听,进程内存管理的相关报告。
2023-11-29 11:11:41 1902
原创 LLM | A Technical Report for Polyglot-Ko: Open-Source Large-Scale Korean Language Models论文详解
尽管 mBERT、BLOOM、XGLM 等多语言语言模型已经发布,但使用非英语语言的研究人员仍在追求单语模型。这是因为公开的模型的训练数据偏向于英语,在非英语语言任务上表现不佳。使用韩国数据进行预训练的 Polyglot-ko 模型,在通过各种预处理方法处理了 TUNiB 收集的 1.2TB 韩国数据后进行了预训练。只是一份报告,所以并没有什么创新点。训练环境建议:4台RTX3090(4090/A5000)
2023-11-28 08:23:07 876
语音特征提取详解PPT
2023-04-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人