自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 问答 (26)
  • 收藏
  • 关注

原创 关于tensorboard无法打开

tensorboard出错

2022-11-16 16:06:32 577 1

原创 深度学习遇到内存溢出的情况

深度学习笔记

2022-08-27 21:02:40 1107

原创 Ubuntu 下多版本cuda的切换

ubuntu下多版本cuda

2022-06-07 20:45:35 172

原创 Ubuntu GCC切换

查看对应的版本gcc -vg++ -v进入到/usr/bin中进行处理cd /usr/binsudo rm -r gcc g++新建软连接sudo ln -s /usr/bin/gcc-指定版本 gccsudo ln -s /usr/bin/g++-指定版本g++完成

2022-05-30 22:21:51 278

原创 Conditional Structure Generation throughGraph Variational Generative Adversarial Nets 论文阅读

目标基于语义条件生成图(1)基于条件生成尽可能相似的图。(2)有条件的生成新的图。解决的问题(1)基于语义有条件的生成图(2)如何处理图在生成过程中的顺序的问题解决问题的方法(1)提出了一个图变分自编码对抗生成网络。本质是Graph+VAE+GAN的结构和方法。(2)通过对共轭潜在分布的变分推断,将结点编码分解为排列不变的图编码。共轭:共轭(conjugate)是贝叶斯方法中很常见的一个词,结合贝叶斯定理,我们可以将“共轭”理解为后验和先验是同一种分布。参考文

2022-04-21 10:42:53 1237

原创 nn.Embedding的使用

nn.Embedding经常用到的参数是nn.Embedding(num_embeddings, embedding_dim)其中,num_embeddings代表字典中一共有多少个词语, embedding_dim代表你想要为每个词创建一个多少维的向量,这样在使用的时候,会为每一个特定的词语赋予一共向量。示例import torchfrom torch import nnembedding = nn.Embedding(5, 4) # 假定字典中只有5个词,词向量维度为4word

2022-04-13 15:31:14 3288

原创 DYNAMIC GRAPH REPRESENTATION LEARNING VIAGRAPH TRANSFORMER NETWORKS 阅读笔记

Traget图学习的理论研究。Motivation在现实生活中,很多事物之间是有相互联系的,根据这种联系可以建立一个图结构。但是现实生活中的图结构往往不是固定的,是随着时间的变化而动态改变的,因此,需要设计一个动态的图的方法。Problem动态图的学习会面对两个问题,(1)对图信息非常敏感。(2)缺乏泛化能力。Solved(1)为了解决图信息的敏感问题,提出了一个基于动态图的transformer,依靠临时空间编码来捕获图的拓扑。(2)为了提升泛化能力,设计了一种互补的自监督

2022-02-18 10:35:03 413

原创 LPMNet: Latent Part Modification and Generation for 3D Point Clouds 阅读笔记

Target基于点云的三维形状的生成。Motivation基于部件的三维生成已经是一种非常常见的生成方法,这源自于,我们世界中的复杂物体都可以看作是由一些基本部件组合而成,但是之前的方法中,需要对每个部件进行感知,设计的网络非常复杂,这需要对物体进行分割等人工操作,而本篇文章提出了一种端到端的方法,利用一个单一的网络,对部件进行分块学习。Problem如何利用一个单一的网络,对物体进行分部件学习?同时还可以在特征空间中进行组合操作。Solve(1)加入segmentation m

2022-02-15 17:42:36 336

原创 Rethinking Graph Transformers with Spectral Attention 阅读笔记

NIPS 2021困难:难以定义正确的位置图网络(GNN)产生过度平滑的原因:图网络的消息传递框架使用了前面两个主要函数 Aggregate 和 Update,它们从邻居那里收集特征向量并将它们与节点自己的特征结合起来更新它们的表示。此操作的工作方式使交互节点(在此过程中)具有非常相似的表示。...

2022-02-14 21:49:34 951

原创 A Generalization of Transformer Networks to Graphs 论文阅读笔记

Task使用transformer去处理图结构数据。Motivation图数据拥有两个特性:(1)稀疏性。(2) 结点间有拓扑关系。这两个特性对于图来说非常重要,但是在利用transformer去处理图数据时,由于在任意两个结点之间建立了联系,因此可以说忽略了图的稀疏性和拓扑关系这两个特性,因此作者想设计一种基于图的transformer,在保留图的特性的时候,依旧能够利用transformer去处理。Method整个网络的结果如上图所示,其中图左边描述的是不加入边信息的transfor

2022-01-28 22:47:49 1661

原创 Unconditional Scene Graph Generation 阅读笔记

Task无条件的场景图生成。之前的场景图生成的研究中,是基于条件生成的场景图,而本篇工作是根据一个随机的输入,产生一个完整的场景图。问题(1) 图的object的数量的多少是不一致的。(2) object之间的关系的种类是不平衡的。(3) object之间的关系是有向的。解决方法(1) 前人的工作大多是给一个假设,即设定object的数量是一致的,而本篇工作采用的是自回归的方法,利用自回归来解决数量不一致的问题。(2) object与object之间的关系和种类,作者利用了G

2022-01-17 17:46:20 849

转载 在pytorch中nn.Linear 和 nn.Embedding 的区别

转载一篇文章模型的第一层:详解torch.nn.Embedding和torch.nn.Linear_音程的博客-CSDN博客_embeding linear

2022-01-14 14:25:47 667

原创 EditVAE论文阅读笔记

Unsupervised Part-Aware Controllable 3D Point Cloud Shape Generation 是2021年10月放在arxiv上的一篇论文Task基于组件的形状的生成,使用无监督的方式Key Idea利用VAE作为学习框架,在隐空间中进行分解,以无监督的方式学习形状的各个组件之间的关系,达到结构感知的学习结果方法输入一个点云的形状,首先经过一个后验(Encoder),然后经过重参数化采样,得到一个全局的隐空间,经过一个线性映射,得到不同

2022-01-10 17:54:00 1336

原创 Modeling Levels of Structural Detail in 3D Part Hierarchies阅读笔记

TASK基于组件的三维模型的生成Idea之前StructureNet(StructureNet读书笔记 - 知乎)将基于组件的建模推到了一个巅峰,但是也有一个缺陷,即在生成的过程中,如果想根据已经生成的部件去继续生成的时候,会遇到问题,之前已经生成的部件会被改变。这篇论文中,作者在生成的阶段,利用条件生成的方式,让StructureNet能够基于已经生成的部件去生成完整的部件。challenge(1)如果不从头开始重新生成整个层次结构,并且不能保证重新生成的结构的其余部分将完全忠

2021-12-30 17:23:34 380

原创 Do Transformers Really Perform Bad for Graph Representation 阅读笔记

Task利用transformer进行图预测,即给出一个图,预测出其类别,其中图由来表示,代表结点,代表边。在阅读这篇论文之前,回顾一下经典的GNN和Transformer。GNN一般的图神经网络通常通过聚合邻接结点的特征更新结点表达,称为AGGREGATE-COMBINE。公式如下所示:其中,l代表的是图卷积的层数,h代表的是结点在每一层的特征。一般聚合操作包括mean, max, sum。TransformerTransformer通过计算节点相似度对节点表示进行更新。 ..

2021-12-27 23:02:57 982 5

原创 A Deep Generative Network for Computer-Aided Design Models 阅读笔记

这一小段节选自这篇论文的introduction,是比较少见的在计算机科研论文中,使用了一定的修辞手法去表达的论文,因此记录一下:-)Task以序列化的方式,生成CAD三维模型。问题在做CAD模型的生成的时候,有一系列的步骤,每个步骤都有相应的参数控制,但是这些控制的参数有些是离散的值,有些是连续的值,这就给基于传统深度学习的几何建模方法带来了挑战。一般的深度学习建模方法不再适应。解决的方法(1)对CAD的建模command做了编码(2)利用transformer做...

2021-12-27 17:11:05 610

原创 Learning Deformable Kernels in 3D GraphConvolution Networks for Point Cloud Analysis 阅读笔记

Task定义一种在三维形状中,新的点云运算方法。问题(1) 三维点云是一种无序,无结构的三维形状表达方式,因此不能提供一种统一的运算方式。(2)之前的一些方法,在对三维点云进行一些操作,例如放缩和平移的时候,就会影响计算的效果。解决方法(1)利用一个可变形的3D核去学习3D点云的信息。(2)提出了一个基于图的最大池化的方法去处理不同的尺度信息。方法作者自定义了图卷积的感受野,即对于一个三维形状中的每一个点,作者固定了其周围的最近邻的M个点作为其感受野。此外,作..

2021-12-23 16:34:47 2504 1

原创 ViTGAN: Training GANs with Vision Transformers阅读笔记

Task图像的生成Key idea利用transformer作为基本的计算单元,替代传统的CNN,同时基于GAN的基础架构,去完成图像的生成任务。面对的问题:(1) GAN的正则化方法与注意力机制的交互很差,导致训练中稳定性不足(2)在鉴别器训练的后期,对抗训练经常受到高方差梯度(或尖峰梯度)的阻碍。高方差梯度会在训练的时候导致震荡,非常影响训练的效果。解决的方法:(1) 在判别器中,研究者重新审视了自注意力的 Lipschitz 性质,在此基础上他们设计了一种加强了..

2021-12-21 16:55:42 1074

原创 GAN 网络训练中,G_loss上升,D_loss下降

最近重写拾起了GAN网络,做layout的生成工作,但是在训练的过程中又出现了G和Dloss不按照正常的情况下降和上升:网上查找的原因是:种情况是判别器太强了,压制了生成器。查询资料后总结的方法1 提升G的学习率,降低D的学习率。2 G训练多次,D训练一次。3 使用一些更先进的GAN训练目标函数。参考资料:训练GAN时,遇到G_loss不断上升最后平稳,D_loss不断下降最后趋于0,这种情况应该如何调整? - 知乎...

2021-12-19 15:37:07 12653 6

原创 A Hierarchical Approach for Unified and Controllable Multi-Category Object Generation 阅读理解

Task基于语义信息的图像生成Key idea利用粗到细的生成方式,先生成bouning-box的layout,再生成pixel-level,最后再给每一个bounding-box增添上颜色。现有的工作的问题(1)现有的方法一般只生成一类图像,例如鸟的图像,脸的图像等。(2)现有的方法需要生成背景作为上下文的引导偏执。(3)现有的方法的生成结果不能很好的用于下游任务。方法Pipeline如前文所描述的一样,文章的方法分成了几个阶段,首先,LabelMap–V.

2021-12-17 23:05:55 261

原创 三维处理中的高频信息与低频信息

关于图像的高频信息与低频信息的理解:图像的高频信息和低频信息代表的含义(以奇异值分解实现图像压缩为例附实验说明)_Sual的博客-CSDN博客_图像高频和低频对应图像的什么信息在处理三维特征的时候,也有高频和低频的一些说法,比如这篇论文中提到了相关工作:Fourier Feature Networks未完待续参考文献:[1]图像的高频信息和低频信息代表的含义(以奇异值分解实现图像压缩为例附实验说明)_Sual的博客-CSDN博客_图像高频和低频对应图像的什么信息[2]Mat.

2021-12-16 21:39:50 824

原创 Positional Encoding as Spatial Inductive Bias in GANs论文阅读理解

Task高质量的生成图像。就基于图像的卷积生成器 而言,多层的卷积的组合能够提供一个空间上的引导偏执,能够从特征图的边缘向内部传递。作者发现,这种现象在目前的很多方法例如SinGAN,StyleGAN,DCGAN,PGGAN等方法上都有体现。而现有的方法在边缘区域能够展示高度的结构化,但是在中心区域并不能展示出高度的结构化,因此会给生成的效果带来影响,尤其是对于有空间结构关系的图片,如上图所示。作者提出,在卷积的过程中,补零填充会隐式地对空间位置进行编码。基于次,作者自己设计了一种空间引导偏

2021-12-16 19:46:11 590

原创 Contact-based Reasoning for Generating 3D Shapes from Parts 论文阅读理解

BackgroundThere is increasing demand for high-quality 3D object models across multiple fields: gaming and virtual reality; advertising and e-commerce; synthetic training data for computer vision and robotics; and more. The traditional practice of ma...

2021-12-14 22:49:14 3778

原创 Rethinking positional encoding 阅读笔记

首先,我们来回顾一下经典的transformer下的PE。PE:我们知道,transformer模型的attention机制并没有包含位置信息,即一句话中词语在不同的位置时在transformer中是没有区别的,这当然是不符合实际的。为了解决这个问题,transformer添加了额外的向量PE来解决这个问题。这个向量能够决定当前词的位置,或者说在一个句子中不同的词之间的距离。理想的情况下位置编码的设计应该满足:它应该为每个字输出唯一的编码不同长度的句子之间,任何两个字之间的差值应该保持一致它

2021-12-09 17:34:38 1633

原创 Spline Positional Encoding for Learning 3D Implicit Signed Distance Fields 阅读笔记

用MLP去近似一个隐式函数会遇到的问题:(1) 基于坐标点的MLP和ReLU函数并不能够很好的重建出平面的细节内容。(2)一些改进的方法尝试引入傅里叶变换,将坐标变换到高纬的傅里叶空间,但是这一类的方法并不能很好的重建出一个平面。解决的方法:作者提出了Spline Positional Encoding,利用这种方法去做坐标的编码,从而能够去恢复出一个良好的形状平面。PE:能够以一种均匀的位置表示关系告诉神经网络,某个元素所处的位置。具体的方法:SDF(符号距离函数)对于给定

2021-12-07 16:43:11 643

原创 Octree Transformer读书笔记

任务用自回归的方式来生成三维形状(3D Shape)。问题(1)怎么压缩数据(在分辨率较高的时候会造成内存开销过大)(2)如何以自回归的方式生成结果方法整个过程分为三个阶段,(1)输入一个八叉树序列。(2)将其压缩为一个短的序列。(3)训练一个标准的transformer解码器。当完成训练以后,可以利用transformer生成一个序列向量,并且解压解码。序列化的八叉树首先对一个体素化的shape,用一个包围盒(bounding cube)将其围住,并对其进行细分,每一次都划

2021-12-06 23:02:13 2580

原创 anaconda的使用

问题Linux下安装anaconda3后anaconda命令能用,但conda不能用解决方法进入anaconda目录下,激活cd /anacondasource ./bin/activate这样conda命令行就可用了常用命令conda create -n your_env_name python=x.xyour_env_name文件可以在andaconda安装目录envs文件下找到 conda list查看安装了哪些包 conda env list或conda in..

2021-12-06 15:13:36 1018

原创 CanvasVAE: Learning to Generate Vector Graphic Documents 阅读笔记

任务

2021-12-02 21:40:52 252

原创 Adversarial Generation of Continuous Images 阅读笔记

任务在对图像的表示中,最经典的方式是利用矩阵对图片进行表达,但是这种表达方式将图片进行离散化了。而在真实的世界中,我们认为是连续的,或者近似连续的。于是,作者提出使用一个连续的函数来表示图像,再结合目前的神经网络,提出一个方案,即利用神经网络来逼近这个连续的函数。这种方案被称为INR(Implicit Neural Representation),表达的公式如下:对于图像来说,INR将二维坐标映射到RGB的一个值。上图是一个对比图,坐标为常规的卷积网络做图像生成的方法,右边为使用IN..

2021-12-01 14:35:38 2466

原创 Constrained Graphic Layout Generation via Latent Optimization 论文阅读笔记

任务基于布局的元素的标签和限制条件,生成高质量合理的布局(Layout)。这个问题其实前人已经有不少的工作处理过了,但是,之前的工作都是直接生成布局,但是在生成布局的时候,有可能出现各种的遮挡,重叠等情况,因此作者在设计新的神经网络解决布局的生成问题之后,利用最优化的思想,设计了目标函数和限制条件,优化最终的生成效果。方法整个的方法分为两个Part,如上图的pipeline所示分别是LayoutGan++和Constrained Layout Generation via Late...

2021-11-30 17:29:30 1893

原创 矩阵的-1/2次方

用numpy计算矩阵,求矩阵的-1/2次方1)安装numpy2) 代码。import osimport sysimport numpy as npfrom numpy import linalg as la# v 为特征值 Q 为特征向量 v,Q = la.eig(D)V = np.diag(v**(-0.5))T = Q * V * Q**-1#T为所求结果参考文献:https://www.codeleading.com/article/40217..

2021-02-02 20:37:07 3983

原创 Pytorch 学习笔记

Pytorch 中的model.train() 和 model.eval() 。这两者的主要区别在于BatchNorm 和 Dropout两层。一般情况,model.train()是在训练的时候用到,model.eval()是在测试的时候用到。

2021-01-27 17:11:41 69

原创 3D Point Cloud Generative Adversarial Network Based on Tree Structured Graph Convolutions

论文的主要内容:作者提出的问题:在本篇论文之前(本篇论文发表于2019年的ICCV)工作中很少有利用无监督的学习方式处理点云的生成。之前的工作比较直接,通常是对点云坐标的直接运算,然而这些方法虽然能产生不错的效果,但是计算复杂度高,而且生成的物体的种类有限制。基于此,作者提出了一个方法,称之为Tree-GAN,即建立一种Tree的数据结构,并结合GANs博弈思想,生成高质量的点云模型。contribution:1) 提出tree-gan的新的方法,用于无监督学习中生成3D 点云的三维

2020-12-03 21:06:12 789

原创 python 中删除非空的文件夹

import shutilshutil.rmtree(path)

2020-11-30 21:13:58 284

原创 StructureNet

StructureNet: Hierarchical Graph Networks for 3D Shape Generation分层的图卷积网络,发表在2019年的siggraph asia上,论文的创新性比较强,可以说是一个标杆性质的工作(PS:又大大加大了shape genenration的工作难度o(╥﹏╥)o)。抱怨归抱怨,还是来细细解析研读一下本篇论文,毕竟是比较经典的工作。本菜鸡的工作方向也是shape generation,这个领域内的工作大致都是,为了避免geometry 本.

2020-11-15 15:56:44 556

原创 RPM-Net: Recurrent Prediction of Motion and Parts from Point Cloud

RPM-Net的文章发表在2019年的Trans on Graphics 上面,同时收录在siggraph asia 2019上面.作者提出的问题:当给出很少的静态物体的时候如何去预测part的运动。因此本文主要解决的就是给定少量的物体,或者物体的一部分,可以预测出它们的变化。 以...

2020-11-14 22:49:09 359

原创 对于G2LGAN中使用visualizaton引用 PyQt4.QtGui出错

在ubuntu中想使用pyqt,follow了G2LGAN中的方法,还是不行,最后网上查到了方法,这里记录一下:sudo apt-get install python-qt4使用这个命令可以解决问题,需要注意的是还要参考我们的整体的环境,例如python的版本等...

2020-11-14 21:45:23 83

原创 Local Implicit Grid Representations for 3D Scenes

这篇论文是取自CVPR2020 ,属于使用隐式函数去做应用,将在object上做生成扩展到大规模的场景中。作者首先提出问题:之前提出的一系列用于深度几何学习的表述方式,例如:体素,点云,网格或者是隐式函数。都学习的是一个很小的种类,并没有很强的泛化能力,并且大都不能去处理复杂的场景信息。作者在本篇论文中,就将提出一个三维形状的表述方式,用于去处理大规模的三维场景信息。key idea:无论多么复杂的三维场景,或者是某一种类的三维物体,它们在局部上任然具有相同的特征。作者的核心思想就是利用这种局部相似

2020-11-12 21:35:19 645

原创 Combining Implicit Function Learning and Parametric Models for 3D Human Reconstruction

ECCV 2020的内容,属于几何深度学习,同时隶属于当下火热的方法隐式函数,下文是本篇论文的读书笔记。文献一开始提出了隐式函数在进行生成的时候的缺点:(1)生成的物体表面是静态的(2)模型的表面不能进行编辑作者提出的方法结合了隐式函数对模型细节的表达能力+对模型参数化的表达从而去重建人体的三维模型。(让surface与相应的语义对应)本篇paper的核心目标:In this paper, we focus on the reconstruction of human models f.

2020-11-11 20:01:18 1034 2

原创 初识RNN网络

发现最近的论文处理三维数据的时候可以结合卷积和RNN去做,所以去简单学习了RNN网络:传统的DNN模型: 1)层数比较多 2)模型难以统一 3)不具备共享特征的能力DNN的层数可能超过100层,但是DRNNs一般没有这么多层,三层的RNNs已经可以具备很好的效果了,单层的RNNs也可以有不错的效果一般的RNN模型: 相互间有依赖关系,即每个元素受到其周围附件的元素影响较大...

2020-07-29 10:46:18 105

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除