winnerahao-CSDN博客

原创腾讯音频+图片=肖像生成 AniPortrait 论文核心

腾讯开源项目AniPortait！音频+图片+肖像视频

2024-04-01 17:33:32 351

原创 EMO论文解读阿里最新头像视频生成

阿里EMO视频生成

2024-03-01 21:01:31 1199

原创 SDXL-Lightning：字节SDXL加速方案，一步生成1024高清大图，击败SDXL-Turbo，LCM-LoRa

对于渐进式蒸馏的基本方式，是计算teacher-student之间的MSE损失，teacher是使用多个step达到的结果，作为蒸馏的模型，蒸馏到更少步数的students中，一旦学生模型收敛，它就被用作教师模型，并重复蒸馏过程。建立对抗性判别器，计算来自teacher在输入xt和条件c下产生的x(t-ns)的概率，使用非饱和的对抗损失，交替训练判别器和学生模型，鼓励students模型的预测结果x’(t-ns)更接近于teacher模型的预测结果x(t-ns)。使用 MSE时，它表现出模糊的结果。

2024-02-27 10:43:12 1158

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

二度

原创腾讯音频+图片=肖像生成 AniPortrait 论文核心

原创 EMO论文解读阿里最新头像视频生成

原创 SDXL-Lightning：字节SDXL加速方案，一步生成1024高清大图，击败SDXL-Turbo，LCM-LoRa

原创关于FLOPS/FLOPs/MACs/MAdds的计算

原创 DIT: Scalable Diffusion Models with Transformers--Sora/SD3相关DIT技术论文阅读

原创多模态音乐生成M2UGen论文解读

空空如也

空空如也

原创 腾讯音频+图片=肖像生成 AniPortrait 论文核心

原创 EMO论文解读 阿里最新头像视频生成

原创 SDXL-Lightning：字节SDXL加速方案，一步生成1024高清大图，击败SDXL-Turbo，LCM-LoRa

原创 关于FLOPS/FLOPs/MACs/MAdds的计算

原创 DIT: Scalable Diffusion Models with Transformers--Sora/SD3相关DIT技术论文阅读

原创 多模态音乐生成M2UGen论文解读

空空如也

空空如也

原创腾讯音频+图片=肖像生成 AniPortrait 论文核心

原创 EMO论文解读阿里最新头像视频生成

原创关于FLOPS/FLOPs/MACs/MAdds的计算

原创多模态音乐生成M2UGen论文解读