该学还得学-CSDN博客

原创 DR-GAN: Distribution Regularization for Text-to-Image Generation 笔记

这篇 paper 提出了一个新的文本生成图像模型-分布正则化生成网络（DR-GAN）。在 DR-GAN 中，包含了两个新的模块：语义解开模块（SDM）和分布正则化模块（DNM）。SDM 包含空间自注意机制和一个新的语义解开损失（SDL），SDL 能帮助生成器在图片生成阶段提取关键的语义信息。DNM 使用变分自动编码（VAE）对图像潜在分布正则化和去噪，则还能帮助生成器更好的区分生成图像和真实图像。DNM 也采用了分布生成损失（DAL）去指导生成器通过正则化去对齐潜在空间中真实图像的分布。

2023-04-13 19:29:25 300

原创 CPGAN Content-Parsing Generative Adversarial Networks for Text-to-ImageSynthesis

CPGAN: Content-Parsing Generative Adversarial Networks for Text-to-Image Synthesis作者：Jiadong Liang，Wenjie Pei，Feng Lu 时间：2019年期刊：CVPR为什么提出CPGAN：1.以往方法的不足之处以往的方法再GANs网络的基础上虽然已经取得了实质性的进展，但一个潜在的限制是，这些方法试图再生成过程中直接对文本到图像的映射进行建模，这对于这种跨模态翻译来说相当困难。比如AttnGAN

2022-05-11 19:33:06 667

原创 Improving Training of Text-to-image Model Using Mode-seeking Function

Improving Training of Text-to-image Model Using Mode-seeking Function作者：Naitik Bhise、Zhenfei Zhang、Tien D. Bui 时间：2020年期刊：CVPR论文主旨：GAN网络一直以来被用来理解文本和图像之间的语义关系。然而，图像生成中的模式崩溃（也叫做模式坍缩 mode collapsing）会导致一些首选输出模式。该文的目的是通过一个专门的模式寻找损失函数来改进网络的训练，以避免这个问题。模式崩

2022-04-30 17:13:57 371

原创 SegAttnGAN Text to Image Generation with Segmentation Attention

SegAttnGAN: Text to Image Generation with Segmentation Attention作者：Yuchuan Gou，Qiancheng Wu，Minghao Li，Bo Gong，Mei Han 时间：2020期刊/会议：CVPR为什么提出SegAttnGAN：文本生成图像任务的许多模型使用GAN可以保持图像-文本一致性，但是它们除了特定的关键字限制对象的形状外，对生成的图像的布局几乎没有控制。以往的模型通常会生成具有变形形状的物体或具有不显示布局的图像

2022-04-22 17:22:06 3118

原创 Image-to-Image Translation with Text Guidance

Image-to-Image Translation with Text Guidance作者：Bowen Li、Xiaojuan Qi、Philip H. S. Torr、Thomas Lukasiewicz 时间：2020会议/期刊：CVPR为什么提出该文（RefinedGAN）：该文和以下的工作有联系：Image-to-image translation：该领域的工作和作品只专注于从像素标记的语义图像生成逼真的图像，而不能确定合成图像的视觉属性。Text-to-image gener

2022-04-15 15:29:24 3254

原创 ManiGAN Text-Guided Image Manipulation

ManiGAN: Text-Guided Image Manipulation作者：Bowen Li、Xiaojuan Qi、Thomas Lukasiewicz、Philip H. S. Torr 时间：2020期刊：CVPR提出该网络的目标任务：论文的目标是在语义上编辑图像的部分，以匹配描述所需属性（比如，纹理、颜色和背景）的给定文本，同时保留与文本无关的其他内容。目前来说，现最先进的文本引导图像处理方法只能产生低质量的图像（下图第一行），效果不理想（下图第二行），甚至不能有效地处理复杂场景

2022-04-09 20:22:15 3421

原创 CookGAN Causality based Text-to-Image Synthesis

CookGAN: Causality based Text-to-Image Synthesis作者：Bin Zhu、Chong-Wah Ngo会议：2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)为什么要提出CookGAN：这篇论文从一个新的角度，即图像生成中的因果链，来解决文本到图像的合成问题。因果关系是烹饪中常见的现象。菜肴的外观取决于烹饪动作和配料。CookGAN模拟了因果链中的视觉效果，保

2022-03-31 13:36:33 3790 1

原创 Controllable Text-to-Image Generation

Controllable Text-to-Image Generation作者：Bowen Li，Xiaojuan Qi，Thomas Lukasiewicz，Philip H. S. Torr 时间：2019会议/期刊：NeurIPS为什么提出ControlGAN：由于GAN在生成真实感图像方面的成功，文本到图像的生成在实现条件生成网络（Conditional GAN）的基础上取得了显著的进展。然而，目前的生成网络一般是不可控的，这意味着如果用户改变句子中的某些词，合成的图像就会与原始文本生成

2022-03-26 20:44:31 5205

原创 Semantics Disentangling for Text-to-Image Generation

Semantics Disentangling for Text-to-Image Generation作者：Guojun Yin，Bin Liu，Lu Sheng，Nenghai Yu，Xiaogang Wang，Jing Shao 时间：2019会议：CVPR为什么提出SD-GAN：对于T2I来说，以往文本-图像生成工作主要关注于通过从粗到细的叠加生成器结构或注意引导生成程序来提高生成图像的视觉质量和分辨率，但是这些方法忽略了一个重要的现象，即人类对同一幅图像的描述在表达上具有高度的主观性和

2022-03-23 21:59:42 771

原创 DM-GAN

DM-GAN: Dynamic Memory Generative Adversarial Networks for Text-to-Image Synthesis作者：Minfeng Zhu，Pingbo Pan，Wei Chen，Yi Yang 时间：2019会议/期刊：19年被CVPR（IEEE Conference on Computer Vision and Pattern Recognition）会议收录以往的方法存在什么问题：该文提出在以往的方法中，很大程度上依赖初始图像的质量（这里

2022-03-17 14:24:45 5458

原创 MirrorGA

MirrorGAN: Learning Text-to-image Generation by Redescription作者：Tingting Qiao，Jing Zhang，Duanqing Xu1，and Dacheng Tao 时间：2019期刊/会议：ICPR收录摘要：文中指出根据给定的文本描述生成图像有两个目标：视觉真实感和语义一致性。在利用GAN生成高质量、视觉逼真的图像方面已经取得了很大的进展，但要保证文本描述和视觉内容之间的语义一致性仍然非常具有挑战性。作者提出了一种新的全局局

2022-03-17 14:17:29 2617

原创 StackGAN 学习笔记

StackGAN学习笔记

2022-03-10 14:01:19 2089

原创 StackGAN++ 学习笔记

StackGAN++

2022-03-10 13:59:04 2528

原创 Generative Adversarial Text to Image Synthesis 学习笔记

Generative Adversarial Text to Image Synthesis

2022-03-10 13:56:41 2617

原创 AttnGAN学习笔记

AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks

2022-03-09 23:17:12 758

原创批量收集照片并按规则命名

前言最近学校下发工作需要收集班上同学的截图文件并按自己名字命名图片，然后收集好后打包发给学校。总觉得这样下发通知让大家截图后命名再上传至群相册十分麻烦，便想找其他解决方法，使得大家都很便利解决方法1 收集图片qq带的腾讯文档里可以创建带有收集图片的表，设置好后发给同学们进行填写最后收集后的结果可以生成excel表以往的腾讯文档只能导出表格，现在的腾讯文档可以导出文件和附件（附件也就是我们收集的图片），但是附件的命名是按填表的时间来命名的，不符合我们的需求，所以这里我还是选择导出excel文件(

2021-12-08 23:57:01 16050 9

原创小程序图片底部留白问题

图片底部留白问题问题最近在写小程序的时候，发现图片的下方总是会留有空白，这是因为图片的默认样式是inline样式，而这个属性的vertical-align的默认值是baseline。所以就会出现上图的情况（图片底部出现一个小留白区域）。解决方法1.把img变成块状元素，所以是否需要留白，可以用过padding来设置2.因为是img的vertical-align默认属性导致出现留白问题，所以直接修改vertical-align属性值为middle即可。总结但是自己使用的时候，发现上述

2021-12-03 14:35:24 1968

qq_44381060的博客