4 ferb2015

学生身份

我要认证

北京邮电大学 wechat:dengdengkakaxi

等级
TA的排名 6w+

语音信号处理——线性预测编码LPC

语音信号处理二:干净语音的特征提取:今天的信号与系统,DSP知识点参考 Spoken Language Processing 第5, 6 章LPC方程的Durbin算法推导:语音信号数字处理(杨行峻,迟惠生)第四章,数字语音处理(Rabiner)第九章作业是自己实现语音信号的LPC预测算法:输入一段语音信号,选定不同阶数p,在最小二乘准则下,用自相关法估计预测系数aia_iai​,对比重建语...

2019-06-20 22:32:51

Origin 多x多y放一张图/改图边框/旋转文本/多曲线叠加在一张图等问题解决方法

Origin生成图,copy到word后,发现图的外边框太大,怎么改Origin生成图,copy到word后,发现图的外边框太大(就是坐标轴区域边缘的空白部分太大)怎么将图边缘的空白部分变小?在copy page之前,做如下操作:Tools—>option---->page选项卡---->copy page setting—>margin项,选择Tight—>...

2019-05-16 22:12:43

修复【Chrome/firefox火狐等浏览器被2345/hao123篡改的主页】【删除浏览器打开默认桔梗导航】【桌面无故多出的Microsoft Edge图标】

步骤:用everything搜“2345”,把可疑的文件删掉,诸如2345explorer开头的文件。(这个是删完没问题后的)选中浏览器 右键chrome/firefox等 → 属性 → 目标 :把.exe后面的后缀的可疑主页删掉。(该方法治标不治本但可以清一下)(往后拉,有可疑的主页)打开浏览器chrome/firefox等的文件所在位置,返回桌面,删除桌面chrome/fire...

2019-05-04 23:52:54

keras 基础小记

model.addmodel = Sequential()model.add(Dense(output_dim=1, input_dim=1))每次model.add就是添加一层,不用写入权重这些参数。W, b = model.layers[0].get_weights()是第一层的参数。特征标准化不同特征所占比重不同,把特征们的所占比重都设置为差不多,都在(0,1)之间keras...

2019-04-29 12:06:11

YOLOv3 笔记

shortcut层。shortcut层是跳过连接主要看《yolov3_presentation.pdf》框住目标,需4个点(回归问题,预测点坐标)分类问题:判断类别 person/dog/cat…YOLOv3 vs YOLOv2:小目标判别更准确,识别速度慢一些,能识别到person,甚至person里的tie领带。训练数据集:COCO网络结构residual block:回忆R...

2019-04-29 12:05:32

CNN基础小记

CNN利用空间关系减少需要学习的参数数目以提高一般前向BP算法的训练性能。卷积神经网络是一个多层的神经网络,每层由多个二维平面组成,而每个平面由多个独立神经元组成。卷积网络的核心思想是将:局部感受野、权值共享(或者权值复制)以及时间或空间亚采样这三种结构思想结合起来获得了某种程度的位移、尺度、形变不变性。我们训练一个神经网络,就是要训练得出这些卷积核,而这些卷积核就相当于我们学单层感知器的时...

2019-04-29 12:04:22

语音识别面试题

基于CTC的声学模型 和 其他声学模型的 loss function区别参考 https://zhuanlan.zhihu.com/p/33464788语音识别有时候输入长度远大于输出长度,这是因为语音信号的非平稳性决定的,我们只能做短时傅里叶变换,这就造成了一个句子会有很多帧,即很多时刻。而标签(输出词序列)中的一个词往往对应了好几帧。最后输出的长度会远小于输入的长度。CTC就是为了解决这个...

2019-04-29 11:59:52

机器学习数据挖掘面试

欠拟合:模型太简单了,特征是否过少过拟合:增加样本量,减少特征数,降低模型复杂度等L1正则化其实就是讲权值的绝对值和加入损失函数,使得权值中0值比重增大,因此得到的权值较为稀疏。L2正则化则是将权重的平方和加入损失函数,使得权值分布更加平均,所以权值较为平滑。ROC曲线的AUC值是比较重要的内容,要能知道具体ROC曲线是怎么画出来的。回归的话比如MSE,RMSE或和业务相关的加权计算公式等。...

2019-04-29 11:58:20

计算机图形学 c#面试

渲染 管线https://blog.csdn.net/jxw167/article/details/54695181渲染管线主要分为四个步骤:顶点变换,图元装配,光栅化,像素处理。顶点处理:顶点渲染的作用是对三维图元的顶点进行坐标变换和光照计算,生成可用于渲染到投影空间的顶点坐标、颜色和纹理坐标。顶点渲染就是定义了一系列针对顶点的渲染指令或渲染语句,当Direct3D处理图元顶点时,自动...

2019-04-29 11:56:41

【动态规划】经典题目小结(切割钢条、最长公共子序列、背包、硬币找零、数组组合、连续最大和、最长回文子序列)

切割钢条参考《算法导论》和 http://www.cnblogs.com/mengwang024/p/4342796.html自底向上,从r[0]开始,r[0]=0,r[n]=我们所要求的,第一个for遍历完后,所有从0-n的r最优解都得到了,第二个for,在每个i下,都求最优解,自底向上,最后i=n时,输出r[n]。class Solution: def PrintBUCutRod...

2019-04-29 11:53:52

常用python用法小记

生成器genration参考 https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/0014317799226173f45ce40636141b6abc8424e12b5fb27000如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generato...

2019-04-29 11:47:39

tensorflow入门笔记

Session 会话控制with tf.Session as sess这样就不用sess.close()了。前期定义的那些参数变量,还没有激活,sess.run(参数名)相当于有了一个指针指向某个参数,使之执行那条语句(激活)(才能输出变量值)。# method 1sess = tf.Session()result = sess.run(product)print(result)se...

2019-04-20 18:51:30

《语音信号处理》 语音识别章节 读书笔记

P34HMM是一个双内嵌式随机过程,由两个随机过程组成:一个是状态转移序列,对应单纯markov过程;另一个是每次转移时输出的符号组成的符号序列。(这个也是随机的,理解为 不知道状态序列,也不知道输出符号序列。。。)P130:模板(模型)Mi,即 i 单词的均值和协方差矩阵。P135:语音信号的特征矢量序列的集合作为观察值序列O = O1,O2,…OTP136:声学...

2019-04-02 12:05:39

快手2019年春季校园招聘笔试试题--算法A试卷

第一题好像是leetcode第一题还是第二题,用异或做,刷过leetcode的都能做出来。第二题的思路是从后往前,很容易。第三题直接用python暴力了。。快手这个笔试应该只是出着玩玩,没想招人吧。对自己挺无语的,其实没啥希望。应该是最后一场笔试了,没投其他家了。感觉自己的能力确实很有限,需要时间成长,慢慢来吧,我已经足够幸运了,没有大厂也没什么,想做算法本来就难一点吧。...

2019-03-30 20:53:20

《数学之美》读书笔记

2019-03-27 15:47:56

leetcode python实现

leetcode 695 Max Area of Island 岛屿的最大面积给定一个包含了一些 0 和 1的非空二维数组 grid , 一个 岛屿 是由四个方向 (水平或垂直) 的 1 (代表土地) 构成的组合。你可以假设二维矩阵的四个边缘都被水包围着。找到给定的二维数组中最大的岛屿面积。(如果没有岛屿,则返回面积为0。)示例 1:[[0,0,1,0,0,0,0,1,0,0,0,0,0]...

2019-03-20 22:03:29

虚拟机装ubuntu以及装完ubuntu要做的事

由于legion系列电脑装双系统由于无线网卡的问题,无法连接wifi,折腾了很久还是不行,而学校网线无法上网,无奈装了虚拟机代替。有大神是legion电脑,装双系统能连上wifi的,还请赐教啊,多谢多谢。首先装vmware,装的是VMware Workstation Pro 14.0.0,key为CV7T2-6WY5Q-48EWP-ZXY7X-QGUWD装好后根据https://zhuanl...

2019-03-16 17:58:43

SentencePiece,subword-nmt,bpe算法

BPE(Byte Pair Encoding,双字节编码)。2016年应用于机器翻译,解决 集外词(OOV)和罕见词(Rare word)问题。论文题目《Neural Machine Translation of Rare Words with Subword Units》 —发表于ACL2016http://www.sohu.com/a/115373230_465975tensor2ten...

2019-03-14 11:14:30

nabu日记

Nabu 是一套实现了LAS(listen, attend, spell)的语音识别系统。https://github.com/vrenkens/nabuLAS是一个基于Attention mechanism的encoder-decoder语音识别模型。相比与传统模型,LAS模型的输出结果是变长序列(decoder部分非常类似于RNN语言模型)。关于LAS的细节可以看论文:https://ar...

2019-03-14 11:11:22

macbook只有windows下安装os系统、trackpad++下载

mac电脑原本只有windows单系统,原来的os系统删掉了,现在想装上os系统的方法:先恢复到原来的os系统,再升级到最新的os系统。这里不展开说明。强烈建议早期的macbook不要安装双系统,或者不要升级到最近的os系统,带不动,非常卡。windows单系统删除os系统的方法:直接在[我的电脑],右键[管理]-左栏[磁盘管理],将os系统所在的盘右键[删除卷]即可。c盘无法扩展卷的解决...

2019-03-04 14:19:39

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv3
    勤写标兵Lv3
    授予每个自然周发布7篇到8篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。