12 会飞行的小蜗牛

尚未进行身份认证

暂无相关描述

等级
TA的排名 2k+

声学模型与语音模型是如何联系在一起的?

1.先讲解一下语音识别时内部机理 如图1,识别过程要计算声学概率P(X|W)和语音概率P(W)如图2,语音模型计算出的概率为P(W),计算声学概率时,是给定W,计算P(Y|W)。wav波形会被切片->提取特征MFCC后与HMM的GMMstate关联,       ...

2018-12-16 11:54:33

EM 算法在 GMM 学习中的应用

本内容摘自:李航-统计学习方法

2018-03-18 22:46:55

Kaldi WFST

  HCLG.fst由四部分构成1.G:语言模型WFST,输入输出符号相同,实际是一个WFSA(acceptor接受机),为了方便与其它三个WFST进行操作,将其视为一个输入输出相同的WFST。2.L:发音词典WFST,输入符号:monophone,输出符号:词;3.C:上下文相关WFST,输入符号:triphone(上下文相关),输出符号:monophnoe;4....

2017-11-22 18:01:02

Kaldi nnet3 -------- Data Type

    本文为kaldi官网关于nnet3的译文:    简介    本文覆盖最新的nnet3。为了了解Kaldi里的所有DNN,例如karel的版本,参考 DeepNeuralNetworksinKaldi。nnet3的创建是为了以更自然的方式不需要实际编码就支持更多通用种类的网络,而不仅仅是反馈网络(例如RNN和LSTM)。和nnet2一样支持多...

2017-11-14 15:36:28

Linux下getopt()函数的简单使用

最近在弄LinuxC编程,本科的时候没好好学啊,希望学弟学妹们引以为鉴。好了,虽然啰嗦了点,但确实是忠告。步入正题:我们的主角----getopt()函数。英雄不问出处,getopt()函数的出处就是unistd.h头文件(哈哈),写代码的时候千万不要忘记把他老人家include上。 再来看一下这家伙的原型(不是六耳猕猴):intgetopt(i

2017-09-14 14:21:40

Python 生成 -1~1 之间的随机数矩阵

1.使用函数 np.random.random    由于 np.random.random() 默认生成0~1之间的小数,因此需要转换一下       如生成3*3的-1~1之间的随机数矩阵              -1+2*np.random.random((3,3))#-*-co

2017-09-12 10:53:41

pycharm下的多个python版本共存

上一篇博文介绍了在windows下同时安装python2和python3.而在工作的过程中,我习惯于用pycharm作为IDE。本文将记录如何在pycharm中选择python版本,并给相应的版本安装第三方库。     选择版本可以在创建项目的时候进行,也可以在设置中进行设置--->打开file/defaultsetting/projectinterpreter。在右侧界面的设

2017-09-12 10:44:42

Windows7 下python3和python2同时 安装python3和python2

1、下载python3和python2 进入python官网,链接https://www.python.org/选择Downloads--->Windows,点击进入就可以看到寻找想要的python版本本文选择的是:Python3.5.2,点击后面链接可直接下载,https://www.python.org/ftp/python/3.5.2/python-3

2017-09-12 10:38:16

Python 调用 opencv 处理图像

一、"Python"+"OpenCV"环境配置 #写下备忘1.步骤1.下载Python2.73,安装,并配置Python环境变量:".\ProgramFiles\Python27;";注意: OpenCV仅支持2.6&2.7,Python不能使用3.x版本;2.下载OpenCV2.46,安装,并配置OpenCV环境变量:".\Prog

2017-09-11 11:23:07

FreeRTOS 临界区总结

当一名嵌入式开发人员从裸机开发切换到基于FreeRTOS的开发后就要注意中断,资源竞争等等问题了。          下面,总结一下FreeRTOS临界区的知识及用法:     1.应该程序使用临界区     1.1深入剖析的方法:taskENTER_CRITICAL()->portENTER_CR

2017-08-31 18:40:51

STM32 DMA 多通道 ADC 采集

1.本次实践目标  a.完成外部ADC的采集,连接引脚为PC2   b.完成STM32内置温度传感器ADC的采集  c.ADC的采集必须以DMA的方式工作,通过FreeRTOS系统中创建的一个进程读取采集结果,并打包通过网络发送至上位机2.查看datasheet   2.1确认STM32内部温度传感器

2017-08-27 18:15:22

VS2010 MFC 动态编译以静态编译发布

VS2010c++编写的程序在别人的机子运行不了,缺少mfc100u.dllxxx100d.dll等的解决方法解决方法:1.将这些dll打包,和应用程序一起发布;2.采用MFC静态编译; 使用VS2010编译的程序在windowsxp中运行时 经常会出现找不到 相关的DLL文件,我们可以使用静态编译的方法把这些运行依赖文件打包到*.exe中来,以减少对环境的依

2017-06-04 22:15:10

分分钟推导神经网络

推荐看这个连接:点击打开链接

2017-04-13 09:49:00

什么是 openFST,如何应用于语音识别?

转自:点击打开链接加权有限状态机 453加权有限状态机OpenFst学习资源FST在语音识别中的应用WFSTinKaldiOpenFstOpenFstisalibraryforconstructing,combining,optimizing,andsearchingweightedfinite-statetr

2017-04-13 09:44:53

Kaldi 中文语音识别需要考虑的问题

转自:点击打开链接原文作者:英语流利说团队李飞腾Kaldi语音识别1.声学建模单元的选择1.1对声学建模单元加入位置信息2.输入特征3.区分性技术4.多音字如何处理?5.NoiseRobustASR6.DeepLearning[DNN/CNN替换GMM]7.在手机等资源受限设备author:FeitengEmail:

2017-04-13 09:40:03

DNN-HMM 中 DNN 与 HMM 的关系

状态绑定参考:点击打开链接决策树的聚类参考:点击打开链接一、简单原理介绍在发音过程中,因为协同发音的影响,同一个音素在不同的位置,其发音变化很大,如下图所示:同样的元音[eh]在不同的单词中的发音在频域上区分非常明显。因为单音素monophone是上下文独立的(context-independent)为了能够表示这种区别,因此提出了triphone的概念,triphone是根据左右音素来确定的,

2017-04-13 01:02:24

汉语拼音音节的歧义指数

汉语拼音音节的歧义指数             冯志伟     如果不计声调,基本的汉语音节只有405个,这405个汉语音节可以表示全部汉字的读音。而《通用规范汉字表》包含了8105个通用汉字,在这种情况下,在一般使用中,一个汉语音节平均要表示20个以上的汉字(8,105/405 = 20.01)。     例1  在《通用规范汉字表》(

2017-04-12 15:54:19

语音识别中的 senone 是什么?

有时候,音素会被放在上下文中考虑,这样就形成了三元音素或者多元音素。但它与亚音素不同,他们在波形中匹配时长度还是和单一音素一样。只是名字上的不同而已,所以我们更倾向于将这样的多元音素称为senone。一个senone的上下文依赖比单纯的左右上下文复杂得多,它是一个可以被决策树或者其他方式来定义的复杂函数。(英语的上下文相关建模通常以音素为基元,由于有些音素对其后音素的影响是相似的,因而可以通过音素

2017-04-12 14:31:25

如何用 Kaldi 训练一个 DNN 声学模型

1.介绍:  首先,需要完成标准的GMM-HMM声学模型的训练  训练monophonemodel是通过GMM-HMMSystem 做utterance-leveltranscriptions,即训练label-audio的映射  训练triphonemodel是通过GMM-HMMSystem做phoneme-to-audiogli

2017-04-11 21:15:11

Kaldi HCLG 深入理解

1.相关部分包含的主要任务1.1WFSTKeyConceptsdeterminizationminimizationcompositionequivalentepsilon-freefunctionalon-demandalgorithmweight-pushingepsilonremoval1.2HMMKeyConceptsMarkovChainHid

2017-04-11 15:38:10

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!