huitailangyz-CSDN博客

原创在RTX 3090上安装Pytorch-1.6

近来因为复现别人的工作需要，必须使用1.6版本的Pytorch，但是Pytorch官方说明1.6版本最高只支持CUDA10.2，而实验室最近服务器升级了RTX 3090，至少要求CUDA11，因此两者无法兼容。经过一通折腾，最后采用在服务器上安装nvidia-docker来解决这一需求。初始时服务器的配置如下：操作系统：Ubuntu 20.04 Nvidia-driver：495.46 CUDA：11.5 cudnn：8.3.2安装nvidia-dockerInstallation

2022-04-20 22:33:37 3355

原创服务器GPU升级记录

最近服务器GPU进行了升级，从1080Ti终于升级到了3090，但是随之而来的问题就是以前配置的运行环境全都乱了，以前的代码也都跑不了= = 因此折腾了整整一个礼拜彻底升级了服务器，把一路上遇到的坑在此记录一下总结操作系统：Ubuntu 16.04 升级至 Ubuntu 20.04 CUDA：11.5 Nvidia-driver：495.46 CuDNN：8.3.2 Tensorflow：1.15（nvidia版） Pytorch：1.10说明：一开始其实很不想升级操作系统，因此很害怕

2022-03-21 15:41:32 1690

原创 python中各种文件类型的读写

本文汇总了在python中各种类型文件的读取和写入，包含文本、图像、表格、log文件、pickle文件、npy文件、npz文件等。文本类型：txt文件图像类型：使用skimage、PIL、opencv、imageio/scipy、plt库表格类型：xlsx文件、csv文件其他类型：log文件、pickle文件、npy文件、npz文件文本类型txt文件text_name = 'test.txt'# 文件写入lines = ['aaa\n', 'bbb\n', 'ccc...

2021-08-21 18:31:32 2455

原创 python多进程/多线程处理文件模版

多进程版本import clickimport globimport osimport numpy as npimport multiprocessingimport timedef run_process(index, from_path, to_path, queue_lock, writer_lock, files, results): # 记录该进程处理文件数 count = 0 while files: # 取文件 que

2021-03-30 17:00:36 338 1

原创【论文阅读】Attention Is All You Need

【2017NIPS】论文：https://arxiv.org/pdf/1706.03762v5.pdf代码：https://github.com/tensorflow/tensor2tensor本文提出了新的网络结构Transformer，仅仅依靠注意力机制而不再使用循环和卷积结构训练可以采用并行化，从而大大缩短训练时间介绍现有的循环模型每个时间步依次计算，这种序列化的方法大大阻碍了训练的并行尽管有工作采用一些技巧提高了计算效率，但是这种序列化的本质问题仍然存在...

2021-02-06 22:26:59 496

原创【论文阅读】A Survey on Contrastive Self-supervised Learning

论文地址：https://arxiv.org/abs/2011.00362介绍有监督的方法的问题：1、需要昂贵的标记数据2、泛化性能差3、遭受对抗攻击大量的方法开始寻找不需要大量昂贵的标记的方法，通过自监督来学习特征表示随着2014年GAN被提出，有许多基于GAN的自监督的生成模型，但是GAN也存在问题：1、模型参数比较振荡，很难收敛2、判别器通常比生成器训练得更好，使得生成器很难生成逼真的样本对比学习是一种判别方法，旨在将相似样本靠近，将不同的样本之间距..

2021-01-31 22:12:21 2244

原创对比学习&Transformer论文清单

终终终终于放假了= =寒假可以看点自己感兴趣的论文了，今年大火的对比学习和一些Transformer相关的论文一直存着没看列个论文清单，有空的话慢慢看过去Contrastive Learning综述 A Survey on Contrastive Self-supervised Learning【20.11】具体方法 A Simple Framework for Contrastive Learning of Visual Representations(SimCLR)【ICML2020

2021-01-30 23:18:27 1562

原创常用git命令

绘制不同branch之间的关系图git log --oneline --graph --decorate --all重组中间的commit信息git rebase -i commit-id(需要修改的前一次)合并另一个分支中的某个文件或文件夹（将B中的内容合并到A中）// 首先切换到分支Agit checkout A// 合并git checkout B public/** view/index.html暂时保存工作区和暂存区的内容git stash [save “XXXX”]全部恢复

2020-08-29 11:29:29 148

原创【论文阅读】Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motiv

【2016NIPS】任务：层次强化学习本文提出了层次强化学习，顶层使用价值函数让策略模型学习到内在目标，底层则决定具体的动作，从而来满足顶层提出的给定目标内在目标可以提供更多的探索，从而缓解稀疏反馈的问题，目标定义在entity和相互之间关系的空间中，可以限制探索空间，提高学习效率模型整体结构由两阶段的层次化结构组成顶层meta-controller输入为状态sts_tst，输出为目标gtg_tgt下层controller的输入为gtg_tgt和sts_tst，输出为动作ata_t

2020-08-15 19:42:26 896 3

原创【论文阅读】Interpreting the Latent Space of GANs for Semantic Face Editing

【2020CVPR】Shen, Yujun, Jinjin Gu, Xiaoou Tang, and Bolei Zhou. “Interpreting the latent space of gans for semantic face editing.” In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pp. 9243-9252. 2020.https://github.com

2020-08-13 00:08:10 2592 3

原创【论文阅读】Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild

【2020CVPR】best papar awardWu, Shangzhe, Christian Rupprecht, and Andrea Vedaldi. “Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild.” In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognit

2020-08-05 23:04:06 2046

原创【论文阅读】Reinforcement Learning with Competitive Ensembles of Information-Constrained Primitives

【2020ICLR】Goyal, Anirudh, Shagun Sodhani, Jonathan Binas, Xue Bin Peng, Sergey Levine, and Yoshua Bengio. “Reinforcement learning with competitive ensembles of information-constrained primitives.” arXiv preprint arXiv:1906.10667 (2019).任务：强化学习的迁移学习本文提出的

2020-07-31 20:54:47 385

原创【论文阅读】Discovering Reinforcement Learning Algorithms

【2020.7 arxiv】Oh, Junhyuk, Matteo Hessel, Wojciech M. Czarnecki, Zhongwen Xu, Hado van Hasselt, Satinder Singh, and David Silver. “Discovering Reinforcement Learning Algorithms.” arXiv preprint arXiv:2007.08794 (2020).任务：使用meta-learning方法学习通用的强化学习算法解决自动

2020-07-31 20:47:12 399

原创对抗样本攻击方法总结

本文总结了近年提出的各种对抗样本的攻击方法。对抗样本的攻击主要分为无特定目标攻击（即只要求分类器对对抗样本错误分类，而不特定要求错误分类到哪一类）和特定目标攻击（即要求分类器将对抗样本错误分类到特定类别）。本文先介绍无特定目标攻击的目标函数，然后介绍FGSM、BIM、StepLL、MI-FGSM、DIM、TIM、SI-NI方法。攻击目标函数arg⁡max⁡xadvJ(xadv,y) s.t. ∥xadv−xreal ∥∞≤ϵ\begin{aligned}&\un

2020-07-16 00:08:24 5007 2

原创【Leetcode】Two Star Programming

Leetcode 203Two Star Programming方法使用双重指针对链表中的一些节点进行删除代码：struct ListNode { int val; struct ListNode *next;};struct ListNode* removeElements(struct ListNode* head, int val){ struct ListNode **temp = &head; while (*temp){ if

2020-07-12 20:38:53 128

原创【Leetcode】Floyd Cycle Detection

Leetcode 202Floyd Cycle Detection算法检测链表中是否有环，以及求环的长度、环的起点在链表中的位置检测是否有环从链表起点出发，使用快慢两个指针，快指针每次走两步，慢指针每次走一步，如果两个指针相遇，则说明链表有环，如果快指针到达链表尾而两者仍为相遇，则说明无环求环的长度当检测到有环（即快慢指针相遇后），让快指针留在原地，慢指针再走一圈（每次一步），再次相遇时经过的步数即为长度求环的起点在链表中的位置当检测到有环（即快慢指针相遇后），让快指针留在原地，将慢指针移到链

2020-07-12 20:32:47 180

原创【论文阅读】Query-efficient Meta Attack to Deep Neural Networks

【2020ICLR】Du, Jiawei, Hu Zhang, Joey Tianyi Zhou, Yi Yang, and Jiashi Feng. "Query-efficient Meta Attack to Deep Neural Networks."arXiv preprint arXiv:1906.02398(2019).任务：基于meta-learning的灰盒攻击本文研究的内容是基于meta-learning的灰盒攻击，使用一个autoencoder网络结构来估计...

2020-06-16 21:28:51 1084 2

原创对抗样本方向（Adversarial Examples）2018-2020年最新论文调研

调研范围2018NIPS、2019NIPS、2018ECCV、2019ICCV、2019CVPR、2020CVPR、2019ICML、2019ICLR、2020ICLR2018NIPSContamination Attacks and Mitigation in Multi-Party Machine Learning（防御）作者：Jamie Hayes(Univeristy College London) Olga Ohrimenko(Microsoft Research)摘要：Machine

2020-06-15 15:33:37 17933 1

原创 vscode通过跳板机连接远程服务器

使用背景一般实验室等环境的服务器是设置在内网环境中的，无法直接使用笔记本在公共环境下直接连接。但是由于种种原因，会出现在这样的场景下需要连接服务器的需求，而通过跳板机是一种常见的办法。一般通过ssh先后连接跳板机再跳转至服务器的方法，在编程时仅能通过vim等工具使用命令行环境，十分不方便。本文在vscode的环境下，通过跳板机连接到远程服务器，从而实现在服务器编写程序时，与在本地vscode编程环境一样便捷的效果。准备工具vscode (自行安装，不赘述)ssh (windows自带的可能版本

2020-05-27 22:19:41 8506

原创【论文阅读】Hierarchical Attention for Part-Aware Face Detection

【2019IJCV】Wu, Shuzhe, Meina Kan, Shiguang Shan, and Xilin Chen. “Hierarchical Attention for Part-Aware Face Detection.” International Journal of Computer Vision 127, no. 6-7 (2019): 560-578.任务：人脸检测...

2020-05-06 21:47:45 599

原创深度学习中各种不同Normalization的对比及代码实现

本文介绍深度学习中常用的四种Normalization方法，Batch Normalization、Layer Normalization、Instance Normalization和Group Normalization。主要结合代码分析其计算过程总结对于输入大小为NxCxHxW的特征BN对所有样本的每个通道进行归一化 [均值形状为C]LN对每个样本进行归一化 [均值形状为N]IN...

2020-05-01 23:45:54 3673 1

原创【论文阅读】Cross-domain Correspondence Learning for Exemplar-based Image Translation

【2020CVPR】代码地址：https://panzhang0212.github.io/CoCosNet/Zhang, Pan, Bo Zhang, Dong Chen, Lu Yuan, and Fang Wen. “Cross-domain Correspondence Learning for Exemplar-based Image Translation.” arXiv prep...

2020-05-01 23:16:06 2567

原创【论文阅读】StarGAN v2：Diverse Image Synthesis for Multiple Domains

【2019.12 arxiv】代码地址：https://github.com/clovaai/stargan-v2Choi, Yunjey, Youngjung Uh, Jaejun Yoo, and Jung-Woo Ha. “StarGAN v2: Diverse Image Synthesis for Multiple Domains.” arXiv preprint arXiv:191...

2020-04-30 00:05:22 2811 1

原创【论文阅读】Analyzing and Improving the Image Quality of StyleGAN

【2019 arxiv】Karras, Tero, Samuli Laine, Miika Aittala, Janne Hellsten, Jaakko Lehtinen, and Timo Aila. “Analyzing and improving the image quality of stylegan.” arXiv preprint arXiv:1912.04958 (2019)....

2020-04-19 14:55:21 1264

原创【论文阅读】Show, Recall, and Tell: Image Captioning with Recall Mechanism

【2020AAAI】Wang, Li, Zechen Bai, Yonghua Zhang, and Hongtao Lu. “Show, Recall, and Tell: Image Captioning with Recall Mechanism.” arXiv preprint arXiv:2001.05876 (2020).任务：image caption问题：以前的方法在生成ca...

2020-04-17 19:39:53 843

原创 Latex中的各种文件及编译流程（附windows环境的完整编译脚本）

Latex中的各种文件及编译流程（附windows环境的完整编译脚本）Latex中的各种文件textex文件是最常见的latex文件，也是平时编写文章的文件clscls文件是latex的格式文件，规定了tex源文件的排版格局，称为类文件（class）一般使用\documentclass{}导入stysty文件是宏包文件（package）一般使用\usepackage{...

2019-08-16 21:15:29 18571

原创 tensorflow中的batch_norm以及tf.control_dependencies和tf.GraphKeys.UPDATE_OPS的探究

笔者近来在tensorflow中使用batch_norm时，由于事先不熟悉其内部的原理，因此将其错误使用，从而出现了结果与预想不一致的结果。事后对其进行了一定的调查与研究，在此进行一些总结。一、错误使用及结果笔者最先使用时只是了解到了在tensorflow中tf.layers.batch_normalization这个函数，就在函数中直接将其使用，该函数中有一个参数为training，在训练阶...

2018-12-15 17:31:32 22811 24

原创 VS中创建属性页，并且继承使用

在VS开发工程时，经常会要使用到诸如opencv此类需要手动配置的库，而在每个工程创建时都手动配置一遍实在过于繁琐，因此可以采用创建一个属性页，每次使用时只需要添加该属性页即可。在VS中有两个可以配置属性页的地方，一个在【属性管理器】，此处配置的内容为全局属性，即每次使用VS工程都会继承。另一个为每个项目的独立属性页，在【解决方案资源管理器】选择项目右键选择【属性】打开，修改后只会影响当前工程...

2018-11-23 17:04:57 2035

翻译【论文阅读】Learning Deconvolution Network for Semantic Segmentation

论文地址：https://arxiv.org/abs/1505.04366v1 目录【概要】一、介绍二、相关工作三、系统结构3.1 结构3.2 用于分割的反卷积网络3.3 系统概述四、训练4.1 批标准化（Batch Normalization）4.2 两步训练五、推断5.1 汇总实例级别的分割映射5.2 与FCN进行集成六、实验...

2018-08-20 16:02:54 1843

原创 VS2017下安装opencv-3.4.2（含opencv_contrib包）及自己修改源码后重新编译

准备文件opencv-3.4.2 从github下载opencv_contrib-3.4.2 从github下载cmake-gui软件VS2017初始目录/XXX 目录不要有中文.../opencv-3.4.2 源码.../opencv_contrib-3.4.2 源码.../build ...

2018-08-14 10:53:27 2162 2

翻译【论文阅读】Learning to Extract Semantic Structure from Documents Using Multimodal Fully Convolutional Ne

【概要】我们展示了一种端到端的、多模式的FCN网络来从文档图像中抽取语义结构。我们把文档语义结构抽取看做是一个像素级别的分割任务，并且提出了一种不仅仅像传统的页面分割任务那样基于他们的视觉外观，而且基于潜在的文本内容的统一模型。进一步的，我们提出了一个有效合成文档生成过程，用来为我们的网络生成预训练数据。一旦网络在大量合成文档上训练过以后，我们在未标注的真实文档上用半监督的方法精确调整...

2018-08-13 10:21:29 3327 6

原创 python opencv中无法读写中文路径图片的解决办法

读取图片：img = cv2.imdecode(np.fromfile(img_path, dtype=np.uint8), 1)其中img_path为读取图片路径，可以包含中文保存图片：cv2.imencode('.jpg', src)[1].tofile(save_path)其中save_path为保存图片路径，可以包含中文，’.jpg’为保存文件格式...

2018-08-09 18:45:38 2722 1

翻译【论文阅读】PageNet:Page Boundary Extraction in Historical Handwritten Documents

论文地址：https://arxiv.org/abs/1709.01618 【概要】当将一个文档电子化成一张图像，常见的方法是包括一个周围的边界区域来视觉上显示整个文档在图像中的位置。但是，在自动化处理前，这个边界需要被移除。在我们的工作中，我们展示一个基于深度学习的系统PageNet，它可以确定在图像中的主要页面区域，以便从文本和非文本边界噪声中分割出内容。在 PageNet中，一个...

2018-07-27 21:52:20 844

原创 python pytesseract psm 选项参数

Page segmentation modes: 0 Orientation and script detection (OSD) only. 1 Automatic page segmentation with OSD. 2 Automatic page segmentation, but no OSD, or OCR. 3 Fully automati...

2018-05-21 11:39:06 15065 4

huitailangyz的博客