自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

白雪少年

两袖一甩,清风明月

  • 博客(54)
  • 资源 (1)
  • 收藏
  • 关注

原创 音乐生成论文简要概括

MIDI文件定义参考雅马哈XG标准的MIDI协议:MIDI程序的设计目标就是要将所要演奏的音乐或音乐曲目,按其进行的节奏、速度、技术措施等要求,转换成MIDI控制语言,以便在这些MIDI指令的控制之下,各种音源在适当的时间点上,以指定的音色、时值、强度等、演奏出需要的音响。近年来语音生成领域其他学者的工作的部分概括2016年的wavenet的语音转录:https://arxiv.org/ab...

2021-04-04 22:15:50 843

原创 No module named 'torchvision.ops'的解决办法

问题:cuda的版本是cuda 10.0,在使用torchvision=0.2.2,torch版本为1.4.0时候报错:No module named 'torchvision.ops'网上说是torchvision的版本过低,应该将其至少更新到0.3.0。于是将torchvision更新到torchvision,但此时又出现了新的错误:ImportError: libcudart.so....

2020-04-27 19:45:05 21049 3

原创 Python获取list中最大或最小的n个数及其索引

求取list中的最大或者最小的几个数字可以使用以下方法方法一:使用深拷贝的方法,copy要求索引的list,每次求最大或者最小值及其索引,之后再置相应位置的值为0。代码如下:import copy m = [34,94,35,78,45,67,23,90,1,0]t = copy.deepcopy(m)# 求m个最大的数值及其索引max_number = []max_index =...

2019-10-10 09:36:04 16498 3

原创 查看pb文件中的graph

方法1读取pb文件, 然后将graph保存到log文件中,然后使用tensorboard就能打开import tensorflow as tffrom tensorflow.python.platform import gfilepath = './'model = 'tnn.pb'graph = tf.get_default_graph()graph_def = graph.as_graph_def()graph_def.ParseFromString(gfile.FastGFile(p

2021-10-30 15:26:49 961

转载 音乐相关数据集介绍

这篇文章是之后系列文章的汇总集中目录。 首先做个小宣传。因为很多想做这一块的同行本科生们不是很清楚国内外的院校列表。有一位前辈在GitHub上整理了大部分的院校列表出来,我也对这个列表做了一点贡献。点击查看 Python官网整理的Python库有这些:链接基础组件Python-MIDI项目官网:https://github.com/vishnubob/pyth...

2021-04-04 21:58:12 6355 1

原创 声音特性介绍——声谱图、音色、音调

一、声谱图介绍声谱图(spectrogram),也称为幅度谱或者幅值谱,一般指的是短时傅里叶变换后得到的不含相位信息的时频图,对于梅尔谱变换而言则称为功率谱。声谱图的横轴为时间,纵轴为频率,表示的是不同频率的信号的振幅随着时间的变化关系。因此,可以使用声谱图表示波形中各种频率下信号随时间变化的信号强度或“响度。虽然声谱图不包含相位信息,但通常认为声音的信息主要蕴藏在短时幅度谱中**[1]**;另一方面,不同乐器演奏的音频文件经短时傅里叶变换得到的幅度谱经过Griffin-Lim变化后都可以重建出原始的波形

2021-04-01 21:17:41 6634

原创 ApdrawingGAN论文阅读

ApdrawingGAN: Generating artistic portrait drawings fromface photos with hierarchical GANs. In CVPR,2019.代码论文摘要由于艺术肖像画是一种高度抽象化的风格表示,由于艺术家的绘画与图像特征无法完全对应,本文提出了一种新的基于距离变换的损失来度量肖像画和真实图片之间的相似度,以生成质量更佳的肖像画。此外,本文还构建了一个艺术风格数据集。1. 介绍艺术肖像画的特点:(1)风格是高度抽象化的,包含

2021-01-30 18:02:34 496

原创 StyleFlow论文阅读

StyleFlow: Attribute-conditioned Exploration of StyleGAN-Generated Images using Conditional Continuous Normalizing Flows论文地址代码链接一、摘要目前图像生成和编辑技术正趋于成熟,通过引入属性约束来控制生成过程并保留输出图像的质量是本文的研究重点。由于GAN隐空间(latent space)的解耦特性,导致在某个属性上图像编辑往往带来了不想要的其他属性的改变。本文通过对隐空间的约束进

2021-01-21 12:42:10 1631 5

原创 NFA转换为DFA--python实现

1.任务将无Epsilon的NFA转换为DFA。对于有Epsilon的NFA可以先将其转换为无Epsilon的NFA,具体做法可以参考博客:将Epsilon-NFA转换为NFA–python实现2.主要思路首先计算初始状态的Epsilon闭包,然后根据状态转换表更新,计算能到达的状态的Epsilon闭包,直到最终无新的状态产生。具体的思路参考[1]中的下图:3.代码实现"""Construct and output an equivalent DFA. The input is gu

2020-11-18 20:06:14 2623

原创 将Epsilon-NFA转换为NFA--python实现

1.任务要求从具有epsilon的不确定有限状态自动机(NFA)得到一个无Epsilon 的NFA。2.思路Epsilon-NFA到NFA的目标主要是产生一个没有Epsilon边的,跟原状态图等价的新状态图。过程不复杂,首先从起始状态开始,寻找所有Epsilons边到达的对象的集合,然后复制这个集合的所有状态包含的非Epsilon状态。其实状态做完之后,寻找所有能够产生非Epsilon边的状态然后重复这个过程,最后NFA就出来了。其本质就是使用无Epsilon的状态转换函数中的条件去替换有Epsil

2020-11-18 16:26:54 1349

原创 线性同余方程求解

一、问题描述解方程 13x=6(mod 34) (1)对该方程求解的步骤为先求特解,再乘以系数得到通解:步骤1:13x+34y=1,得到x的所有取值使得等式右端的值为1。步骤2:对上述方程的左右两端同时乘以6,然后系数13和34不变,用新的x代替原始的x,即得到方程(1)的通解。二、特解的求取贝祖定理: 即如果a、b是整数,那么一定存在整数x、y使得ax+by=gcd(a,b)。换句话说

2020-09-17 21:43:47 4101

原创 linux服务器被挖矿的解决办法

一、前言本周发现服务器很卡,明明什么实验也没跑(GPU是空的),然后重启后使用top指令后发现在自己账号下有个进程占用了所有的的cpu资源。然后使用top指令突然发现自己账号下有个进程将cpu的资源用完了,尝试使用kill命令终止该进程后发现几秒钟又重启,至此发现该进程是恶意进程,网上搜索后发现是一个挖矿的程序。直到问题,那就好办了。二、解决办法想法:由于直接kill定时任务的程序不行,那么应当先将定时任务删除。然后再去找到被修改的文件,要么删除,要么修改。1. 阻断挖矿程序链接外网服务。查看/e

2020-09-07 20:14:19 8759

原创 进度条模块tqdm的使用

用法1:代码:from tqdm import tqdmimport timefor i in tqdm(range(100)): time.sleep(0.01)结果:用法2代码:from tqdm import trangeepoch = 10n_batches = 10000with tqdm(total=n_batches, desc='Train epoch %d' % epoch) as train_enum: for batch_num in rang

2020-08-26 20:57:00 1102

原创 Leetcode 032 最长有效括号python实现

Leetcode 032 最长有效括号一、题目描述题目描述:给定一个只包含 ‘(’ 和 ‘)’ 的字符串,找出最长的包含有效括号的子串的长度。示例1:输入: “)()())”输出: 4解释: 最长有效括号子串为 “()()”实例2:输入: “())()”输出: 2解释: 最长有效括号子串为 “()”二、解法1.动态规划思路 :将"(“对应位置的值置为0,遇见右括号才进行更新情况1:当s[i]=”)" and s[i-1]="(",即s形如“…()”的时候:dp[i] = dp[

2020-07-23 15:39:02 251

原创 GPU导入模型非常缓慢的解决办法

问题描述最近在一台服务器上训练模型,奈何卡有点少,为了更有销效率的调参,将网络和环境都迁移到一台8卡的服务器上,本以为会开启疯狂调参模式,没想到问题来了。GPU每秒加载4-5M的模型数据,我的模型和数据集一共差不多是8500M左右,这谁顶得住呀。想办法经过我的各种科学思考(网上乱查),都没找到解决办法。于是我慌了,换了一个在该服务器上的环境试了下,发下1秒读取8000M,稳得不行。观察两个环境得差异发现新服务器得cuda是cuda10.0,原来服务器得cuda是cuda8.0,所以导致了我将cuda

2020-07-07 18:27:33 5696 3

原创 python实现全组合与全排列

python全组合与全排列一、全排列1.题目描述输入一个字符串,按字典序打印出该字符串中字符的所有排列。例如输入字符串abc,则打印出由字符a,b,c所能排列出来的所有字符串abc,acb,bac,bca,cab和cba。2.做题思路递归+回溯第一步确定第一个位置的字符,第一个位置与后边的所有字符进行交换(包括该字符本身)。如下图:A与A,B,C进行交换第二步对除了第一个位置的后边所有位置的字符进行相同处理;结束条件:a)剩下一个字符;b)没有剩余字符。两种选择都可以获得正确答案。简

2020-07-07 16:00:48 5016

原创 starGAN v2 论文阅读

StarGAN v2文章目录StarGAN v2摘要一.介绍二.StarGANv21.网络结构2.loss设置三.实验结果展示四.总结Reference摘要优秀的图像-图像转换模型需要学习不同视觉域之间的映射,要同时满足以下属性:1)生成图像的多样性和 2)在多个域上的可扩展性。因此提出了star-GAN v2和动物数据集AFHQ一.介绍域:可以分组为视觉上独特的类别的不同组图片风格:每组图片中的每张图片都有独特的外观,这称之为风格。比如,可以根据性别将人分为男性和女性两个域,而人物的装扮,

2020-06-19 15:46:59 4112 1

转载 VAE与GAN的区别和联系

转载链接1.互怼的艺术:从零直达 WGAN-GP2.变分自编码器VAE:原来是这么一回事 | 附开源代码正文1 前言 GAN,全称 Generative Adversarial Nets,中文名是生成对抗式网络。对于 GAN 来说,最通俗的解释就是“造假者-鉴别者”的解释,如艺术画的伪造者和鉴别者。一开始伪造者和鉴别者的水平都不高,但是鉴别者还是比较容易鉴别出伪造者伪造出来的艺术画。但...

2020-04-08 23:52:29 6096 1

转载 互相关(cross-correlation)在Python中的持续实现

前言最近需要计算两个时序序列之间的相关性即NCC(Normalized Cross Correlation),于是了解了np.correlate函数的计算原理和计算方式。以下内容为转载转载链接\color{#FF3030}{转载链接}转载链接互相关(cross-correlation)及其在Python中的实现在这里我想探讨一下“互相关”中的一些概念。正如卷积有线性卷积(linear c...

2020-04-08 18:29:22 4736

原创 图像匹配算法NCC(Normalized Cross Correlation)的python实现

背景相关系数其实就是皮尔森系数,一般是在概率中判断两个随机变量的相关性,其公式为:其中,Cov(X,Y)表示的是随机变量X,Y的协方差。D(X)与D(Y)则分别表示随机变量X,Y的方差。皮尔森系数的值域为[-1,1],系数越接近1表明这两个随机变量越相关,越接近-1表明这两个随机变量越不相关。讲到这里,突然想起概率中讲的一句话:独立一定不相关,不相关不一定独立\color{#FF3030}{...

2020-03-18 08:44:23 6834 2

原创 midi格式的音频数据显示为图片形式

一般来说,音频数据的保存格式又wav,mp3,midi等。当需要对音频数据比对时,显示为图片是一种比较直观的表示方式。解决办法:主要是利用pretty_midi模块读入midi文件内容,使用接下来我们将矩阵转换成piano-roll,使用以下方法:Reference如何看懂一份MIDI文件...

2020-03-13 23:39:49 1375 2

原创 'scipy.misc' has no attribute 'imsave'解决办法

背景调用scipy.misc模块中imsave保存图片遇到的问题。原因其实是1.20版本之前的scipy模块中有imread 和imsave的方法,但在1.20版本后换成了其他的函数。如imsave换成了imageio.imwrite。imsave` is deprecated in SciPy 1.0.0, and will be removed in 1.2.0.Use ``ima...

2020-03-13 00:36:58 11775

原创 C语言变量

1.局部变量和全局变量全局变量是定义在函数外部,通常是在程序的顶部。全局变量在整个程序生命周期内都是有效的,在任意的函数内部能访问全局变量。全局变量可以被任何函数访问。也就是说,全局变量在声明后整个程序中都是可用的。注意:在程序中,局部变量和全局变量的名称可以相同(指向的地址是相同的),但是在函数内,如果两个名字相同,会使用局部变量值,全局变量不会被使用。...

2020-03-12 09:14:11 205

原创 音频处理时的mu law与反mu law变换

一、问题当神经网络训练或者音频数据传输时需要把16位的音频数据转降低至8位,更加广泛的说是把抽样信号的幅度离散化,即量化。二、方法1.均匀量化对编码范围内小信号或大信号都采用等量化级进行量化 ,因此小信号的“信号与量化噪声比”小 ,而大信号的“信号与量化噪声比”大 ,这对小信号来说是不利的。为了提高小信号的信噪比 ,可以将量化级再细分些 ,这时大信号的信噪比也同样提高 ,但这样做的结果使数...

2020-03-11 17:33:21 3426 2

原创 论文《Symbolic Music Genre Transfer with CycleGAN》阅读笔记

一、背景这篇论文主要是实现不同类型的音乐转换,文中主要使用了爵士、古典、流行音乐的转换,并且一个模型只能实现从一个域到另一个域的转换,网络结构作者仿照了Cycle-GAN,但引入了新的loss使得生成的音乐质量更佳。二、数据形式文中使用的音乐数据为MIDI文件,并按照文中的数据预处理方式,主要是舍弃具有音轨或声音较多的MIDI文件(如交响乐等),然后舍弃鼓的音轨,之后将所有的音轨上的音节合并...

2020-03-07 22:56:48 791 2

原创 安装librosa出现ERROR: Cannot uninstall 'llvmlite'的解决办法

一、激活环境,使用pip install package即可安装指定的包到当前的虚拟环境二、使用which pip查询到当前pip的所在位置,即可将package 安装到当前pip所在的环境,但更推荐使用一****/hone/user/anaconda3/bin/pip install packageBUT:我在安装librosa的时候出现如下错误。ERROR: Cannot unins...

2020-02-14 14:16:20 7197 1

原创 linux的软链接(符号链接)和硬链接怎么删除

一、关于什么是软链接和硬链接可以参考下列博客1.https://www.cnblogs.com/Jollyxue/p/10889562.html2.https://blog.csdn.net/gao_zhennan/article/details/791272323.https://blog.csdn.net/mahao1107/article/details/468519694.http...

2020-02-13 21:11:22 3878

原创 Git学习:(四)标签和一些tips

一、标签1. 标签的添加在git中添加标签默认是对当前分支的最新的一次提交添加标签,指令为:git tag tag_name。如果想对之前的某次提交添加标签,则使用:git tag tag_name commit_id,可对特定的提交id打上标签。若需要对标签注释,则使用:git tag -a tag_name -m “note” commit_id查看已有的标签,使用:git tag,...

2019-11-02 12:00:39 181

原创 Git学习:(三)分支管理

通过分支管理能够保证不同用户提交的代码尽可能少的发生冲突,提高团队协作的效率。一、分支的创建与合并1.创建并切换到new分支。创建和切换git checkout -b new# git checkout命令加上-b表明创建并切换到分支 new,相当于下面两条指令的功能:git branch newgit checkout newgit checkout 分支名字,可实现不同分支的...

2019-11-01 10:33:52 115

原创 Git学习:(二)远程仓库的管理

为了将本地仓库备份到Github上的远程仓库,实现文件备份和多机协同工作的功能则需要了解远程仓库的管理。一、生成SSH KeySSH 为 Secure Shell 的缩写,由 IETF 的网络小组(Network Working Group)所制定。利用 SSH 协议可以有效防止远程管理过程中的信息泄露问题。简单说,SSH是一种网络协议,用于计算机之间的加密登录。其次,SSH key...

2019-10-28 16:34:59 233

原创 Git学习:(一)Git管理常用指令

Git是目前世界上最先进和最流行的分布式版本控制系统,没有之一。一、Git的安装1.linux上安装git。Debian或Ubuntu Linuxsudo apt-get install git老版本的系统采用sudo apt-get install git-core2 Windows上安装,下载安装包安装即可,安装完成有git bash则安装成功。无论是linux还是...

2019-10-26 12:44:29 137

原创 python实现xml文件与对应图片统一重命名

在训练faster-rcnn做目标检测的时候,将数据集中的xml文件与对应图片统一重命名为VOC2007的数据格式可以避免对源代码的大量修改。代码如下:import numpy as npimport globimport osimport xml.etree.ElementTree as ETimport xml.dom.minidom'''第一步,将xml文件和图片重新命名...

2019-10-24 20:32:11 3249 8

转载 多路查找树

多路查找树(muitl-way search tree),其每一个节点的孩子数可以多于两个,且每一个节点处可以存储多个元素。主要有4中特殊形式。一、2-3树定义:其中的每一个节点都具有两个孩子(称为2节点)或者三个孩子(称为3节点)。 并且2-3树中所有的叶子都在同一层上。一个2节点包含一个元素和两个孩子(或者没有孩子)。一个3节点包含一小一大两个元素和三个孩子(或者没有孩子)。 ...

2019-10-24 11:04:13 377

转载 平衡二叉树

本文转载自:https://blog.csdn.net/isunbin/article/details/81707606 一、AVL树简介AVL树的名字来源于它的发明作者G.M. Adelson-Velsky 和 E.M. Landis。AVL树是最先发明的自平衡二叉查找树(Self-Balancing Binary Search Tree,简称平衡二叉树)。平衡二叉树...

2019-10-23 17:31:36 535

原创 归并排序递归实现

代码#include <stdio.h>#include <stdlib.h>#define MAX_SIZE 10//实现归并,并将最后的数据放入到list1中void merging(int *list1,int list1_size,int *list2, int list2_size){ int i,j,k,n,temp[MAX_SIZE...

2019-10-23 10:15:07 233

原创 图的邻接表

由于边数较少时,采用邻接矩阵存储图会浪费大量的空间。因此考虑把数组与链表结合在一次来存储,并提出了邻接表的概念。关于无向图的邻接矩阵存储可参考我的上一篇博客。邻接表的处理方式:1.图中顶点用一个一维数组存储,当然,顶点也可用单链表存储,不过数组可以更加方便地读取顶点信息。2.图中每个顶点Vi的所有邻接点构成一个线性表,由于邻接点的个数不确定,所以选择用单链表来存储。无向图邻接表结构如下图...

2019-10-19 16:42:30 775

原创 图的邻接矩阵

邻接矩阵就是使用一个一维数组来存储图的顶点,使用一个二维数组来存储边。对于无向图来说,存储边信息的二维数组(方阵)是一个对称矩阵;而对于有向图来说,存储边信息的二维数组是一个方阵。根据二维数组中的坐标可以知道这两个顶点是否连接以及边的权值。无向图,某个顶点Vi的度,就是此顶点在第i行(列)的边数之和;对于有向图则需要考虑顶点入度和出度。无向图的邻接矩阵代码实现:#include <s...

2019-10-19 13:03:16 1060

原创 堆排序的代码实现

利用大顶堆(小顶堆)的根节点记录最大数值(最小数值)的特性,可以对数值进行排序现以大顶堆的基本思想为例:1、将int 数组arr[1,…,n]构造为大顶堆,实现函数为heapadjust();2、可得大顶堆的根节点,即arr[1]的数值为最大数值,然后将该值与arr[n]互换。3、对数组arr[1,…,n-1]构造为大顶堆并将arr[1]与arr[n-1]互换,直到n-1为2停止互换,堆排...

2019-10-18 11:24:29 1209

转载 python实现快排

Python 快速排序本文转载自:https://www.runoob.com/python3/python-quicksort.html快速排序使用分治法(Divide and conquer)策略来把一个序列(list)分为较小和较大的2个子序列,然后递归地排序两个子序列。步骤为:挑选基准值:从数列中挑出一个元素,称为"基准"(pivot);分割:重新排序数列,所有比基准值小的...

2019-10-15 09:56:06 184

转载 树,森林和二叉树之间的转换

本文转载自大佬的博客:https://www.cnblogs.com/zhuyf87/archive/2012/11/04/2753950.html树、森林和二叉树的转换 树转换为二叉树(1)加线。在所有兄弟结点之间加一条连线。(2)去线。树中的每个结点,只保留它与第一个孩子结点的连线,删除它与其它孩子结点之间的连线。(3)层次调整。以树的根节点为轴心,将整棵树顺时针旋转一定角度...

2019-10-11 21:32:06 169

synergy-v1.8.8-stable-linux & windows

synergy-v1.8.8-stable-linux & windows

2022-01-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除