2 Xwei1226

尚未进行身份认证

江南大学

等级
TA的排名 3w+

基于树莓派语音控制—LED开关控制

此文是学术记录,亦是技术交流文档,本文使用LVCSR构建的语音控制系统。研究接近两年的语音识别,最近一个月开始准备将自己的研究应用于实践中。从今年5月初开始研究语音控制,到今天才出一个简单的demo,最后演示结果如下:(https://v.youku.com/v_show/id_XNDIyNDY2MjcxMg==.html?spm=a2h3j.8428770.3416059.1...

2019-06-12 09:32:47

树莓派LED灯控制

随着Mini型PC越来越多,与之而来的创客也丰富起来,比如说Arduino就是一个非常好里例子。不过,Arduino毕竟是一块适合入门型的基础开发板,无论是从性能上,还是处理复杂问题的实现上,其本身都是有限的。所以有些时候我们会考虑成本更高的卡片式PC,类似于树莓派、香蕉派、橙子派等等。话虽然可以这么说,但作为PC跟GPIO一体的板卡,有些朋友刚拿到手确实是不知道何从下手,更不知道如何去控...

2019-06-05 09:11:32

树莓派连接电脑

1、串口连接这种方式在我树莓派的第一篇博客有讲,这里我简单介绍。连接树莓派,树莓派GPIO串口的GND,txd,rxd分别与转接口的GND,rxd,txd相连,用的什么转接模块我不管,反正最后得变成一个USB的接口接在电脑上,并在电脑设备管理器上的端口选项可以发现它,用Serial登录。可以用PUTTY登录,我用的是新版的secureCRT。2、ssh登...

2019-06-04 16:01:01

kaldi 中文件读取

* 1.ark,scp文件~/kaldi/src/featbin/copy-featsark:raw_mfcc_dev.10.arkark,t:-|headark存的试二进制文件,scp可以直接用cat命令看。*2.fst文件~/kaldi/tools/openfst-1.6.2/bin/fstprintL.fst|head-n10~/kaldi/t...

2019-04-23 18:16:16

基于GMM-HMM语音识别系统的算法推导(全)

最近研究完CTC,转而研究GMM-HMM; 参考文献:《语音识别实践》;《数学之美》;清华大学开源资料;爱丁堡大学语音识别课件;以及一些高校本硕博学位论文; 本文将会刷新你对GMM-HMM的认识,以及对EM算法加深理解; 本文将对GMM-HMM中的转移概率,发射概率,高斯核权重以及Viterbi算法解码进行推导:以上为所...

2019-04-21 14:55:21

tensorflow 新版

AttributeError: 'module' object has no attribute 'SummaryWriter'tf.train.SummaryWriter改为:tf.summary.FileWriterAttributeError: 'module' object has no attribute 'summaries'tf.merge_all_summaries...

2019-04-10 18:26:05

tf中命名空间

1. tf.Variable与tf.get_variabletensorflow提供了通过变量名称来创建或者获取一个变量的机制。通过这个机制,在不同的函数中可以直接通过变量的名字来使用变量,而不需要将变量通过参数的形式到处传递。TensorFlow中通过变量名获取变量的机制主要是通过tf.get_variable和tf.variable_scope实现的。当然,变量也可以通过tf.Va...

2019-04-10 09:35:37

GMM-HMM kaldi 详解

虽然现在端到端语音识别模型可以直接对后验概率建模,可以不需要HMM结构了。但实际上目前很多state-of-the-art模型还是以HMM结构为主,比如chain model。而且掌握HMM-GMM结构,对于深入理解语音识别过程是由有一定好处的。但对于外行(比如像我这种从机械行业转行到语音识别领域的人)或者刚接触语音识别的人来说,要弄懂HMM-GMM结构还是要花不少时间的,因为语音识别任务的特殊...

2019-04-09 09:00:34

语音识别的前世今生

这是我4月份在BitTiger公开课听的王赟大牛《语音识别的前世今生》整理的笔记,本来打算整理通畅再发的,结果实在没时间就一拖再拖。笔记有些草率,不过应该可以看明白,希望可以对大家有用,也祝王赟大神好。Q&A1. 历史上非特定人和特定人的语音识别是不是有很大的不同?这个就是前面讲过的打补丁,各种说话人适应的那一页(如下图)这一页上的这三种方法就是历史上,其实也包...

2019-04-03 18:32:55

ctc decoder

本文主要对CTC 原理及实现中的代码进行解释。1.np.random.seed(1111)请参见本专栏文章numpy中random.seed()的妙用2.softmax的实现代码是这样的:def softmax(logits): max_value = np.max(logits, axis=1, keepdims=True) exp = np.exp(log...

2019-04-01 21:12:09

GMM详解

本文就高斯混合模型(GMM,Gaussian Mixture Model)参数如何确立这个问题,详细讲解期望最大化(EM,Expectation Maximization)算法的实施过程。单高斯分布模型GSM多维变量X服从高斯分布时,它的概率密度函数PDF为:x是维度为d的列向量,u是模型期望,Σ是模型方差。在实际应用中u通常用样本均值来代替,Σ通常用样本方差来代替。很容易判断一个...

2019-03-20 20:52:24

GMM-HMM 详解

本文简明讲述GMM-HMM在语音识别上的原理,建模和测试过程。这篇blog只回答三个问题:1.什么是Hidden Markov Model?HMM要解决的三个问题:1) Likelihood2) Decoding3) Training2. GMM是神马?怎样用GMM求某一音素(phoneme)的概率?3. GMM+HMM大法解决语音识别3.1 识别3.2...

2019-03-20 20:50:53

语音识别一(预处理)

好久没写自己的原创博客,受到群里的小伙伴的要求,最近写一个手推版本的MFCC FBANK 提取的详细过程,见下:

2019-03-19 15:35:32

linux 基本操作

1.nohup用途:不挂断地运行命令。语法:nohup Command [ Arg … ] [ & ]  无论是否将 nohup 命令的输出重定向到终端,输出都将附加到当前目录的 nohup.out 文件中。  如果当前目录的 nohup.out 文件不可写,输出重定向到 $HOME/nohup.out 文件中。  如果没有文件能创建或打开以用于追加,那么 Comman...

2019-02-25 19:53:23

keras基础学习-二

1. 目标函数Objectives目标函数,或称损失函数,是编译一个模型必须的两个参数之一可以通过传递预定义目标函数名字指定目标函数,也可以传递一个Theano/TensroFlow的符号函数作为目标函数,该函数对每个数据点应该只返回一个标量值,并以下列两个参数为参数:y_true:真实的数据标签, Theano/TensorFlow张量y_pred:预测值,与y_true相同shape的...

2019-02-25 13:58:45

Densenet综述

Densely Connected Convolutional Networks ,作者清华姚班的刘壮,获得cvpr 2017 best paper。非常值得阅读。DenseNet优势:(1)解决了深层网络的梯度消失问题(2)加强了特征的传播(3)鼓励特征重用(4)减少了模型参数DenseNet的网络基本结构如上图所示,主要包含DenseBlock和transition laye...

2019-02-20 09:39:15

transformer优秀文章

[1] https://blog.csdn.net/pipisorry/article/details/84946653[2] https://blog.csdn.net/Zhangbei_/article/details/85036948[3] https://jalammar.github.io/illustrated-transformer/

2019-02-14 16:30:57

transformer

Google于2017年6月发布在arxiv上的一篇文章《Attention is all you need》,提出解决sequence to sequence问题的transformer模型,用全attention的结构代替了lstm,抛弃了之前传统的encoder-decoder模型必须结合cnn或者rnn的固有模式,只用attention,可谓大道至简。文章的主要目的是在减少计算量和提高并行...

2019-02-14 16:21:34

python中计算BLEU分数

BLEU,全称为Bilingual Evaluation Understudy(双语评估替换),是一个比较候选文本翻译与其他一个或多个参考翻译的评价分数。尽管BLEU一开始是为翻译工作而开发,但它也可以被用于评估文本的质量,这种文本是为一套自然语言处理任务而生成的。通过本教程,你将探索BLEU评分,并使用Python中的NLTK库对候选文本进行评估和评分。完成本教程后,你将收获:B...

2019-02-13 15:20:48

pytorch激活函数

pytorch中实现了大部分激活函数,你也可以自定义激活函数,激活函数的实现在torch.nn.functional中,每个激活函数都对应激活模块类,但最终还是调用torch.nn.functional,看了定义,你也能自定义激活函数,我们从最早的激活函数来看sigmoiddef sigmoid(input): r"""sigmoid(input) -> Tensor ...

2019-02-11 14:55:19

查看更多

勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。