13 会飞行的小蜗牛

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 2k+

声学模型与语音模型是如何联系在一起的?

1. 先讲解一下语音识别时内部机理 如图1,识别过程要计算 声学概率 P(X|W) 和 语音概率 P(W)如图2,语音模型计算出的概率为P(W),计算声学概率时,是给定 W,计算 P(Y|W)。wav波形会被切片->提取特征MFCC后与 HMM 的 GMM state 关联,       ...

2018-12-16 11:54:33

EM 算法在 GMM 学习中的应用

本内容摘自:李航-统计学习方法

2018-03-18 22:46:55

Kaldi WFST

  HCLG.fst由四部分构成1. G:语言模型WFST,输入输出符号相同,实际是一个WFSA(acceptor接受机),为了方便与其它三个WFST进行操作,将其视为一个输入输出相同的WFST。2. L:发音词典WFST,输入符号:monophone,输出符号:词;3. C:上下文相关WFST,输入符号:triphone(上下文相关),输出符号:monophnoe;4. ...

2017-11-22 18:01:02

Kaldi nnet3 -------- Data Type

       本文为 kaldi 官网关于 nnet3 的译文:       简介        本文覆盖最新的nnet3。为了了解Kaldi里的所有DNN,例如karel的版本,参考 Deep Neural Networks in Kaldi。nnet3的创建是为了以更自然的方式不需要实际编码就支持更多通用种类的网络,而不仅仅是反馈网络(例如RNN和LSTM)。和nnet2一样支持多...

2017-11-14 15:36:28

Linux下getopt()函数的简单使用

最近在弄Linux C编程,本科的时候没好好学啊,希望学弟学妹们引以为鉴。好了,虽然啰嗦了点,但确实是忠告。步入正题:我们的主角----getopt()函数。英雄不问出处,getopt()函数的出处就是unistd.h头文件(哈哈),写代码的时候千万不要忘记把他老人家include上。 再来看一下这家伙的原型(不是六耳猕猴):int getopt(i

2017-09-14 14:21:40

Python 生成 -1~1 之间的随机数矩阵

1. 使用函数 np.random.random        由于 np.random.random()  默认生成 0~1 之间的小数,因此需要转换一下             如生成 3*3 的 -1~1 之间的随机数矩阵                          -1 + 2*np.random.random((3,3))# -*- co

2017-09-12 10:53:41

pycharm下的多个python版本共存

上一篇博文介绍了在windows下同时安装python2和python3.而在工作的过程中,我习惯于用pycharm作为IDE。本文将记录如何在pycharm中选择python版本,并给相应的版本安装第三方库。        选择版本可以在创建项目的时候进行,也可以在设置中进行设置--->打开file/default setting/project interpreter 。在右侧界面的设

2017-09-12 10:44:42

Windows7 下python3和python2同时 安装python3和python2

1、下载python3和python2 进入python官网,链接https://www.python.org/选择Downloads--->Windows,点击进入就可以看到寻找想要的python版本本文选择的是:Python3.5.2,点击后面链接可直接下载,https://www.python.org/ftp/python/3.5.2/python-3

2017-09-12 10:38:16

Python 调用 opencv 处理图像

一、"Python" + "OpenCV" 环境配置 #写下备忘1. 步骤1. 下载Python2.73, 安装, 并配置Python环境变量:".\Program Files\Python27;"; 注意: OpenCV仅支持2.6&2.7, Python不能使用3.x版本;2. 下载OpenCV2.46, 安装, 并配置OpenCV环境变量:".\Prog

2017-09-11 11:23:07

FreeRTOS 临界区总结

当一名嵌入式开发人员从裸机开发切换到 基于 FreeRTOS 的开发后就要注意 中断,资源竞争等等问题了。                  下面,总结一下 FreeRTOS 临界区的知识及用法:          1. 应该程序使用临界区          1.1 深入剖析的方法:taskENTER_CRITICAL() -> portENTER_CR

2017-08-31 18:40:51

STM32 DMA 多通道 ADC 采集

1. 本次实践目标    a. 完成外部 ADC 的采集, 连接引脚为 PC2     b. 完成 STM32 内置温度传感器 ADC 的采集    c. ADC 的采集必须以 DMA 的方式工作,通过 FreeRTOS 系统中创建的一个进程读取采集结果,并打包通过网络发送至上位机2. 查看 datasheet     2.1 确认 STM32 内部温度传感器

2017-08-27 18:15:22

VS2010 MFC 动态编译以静态编译发布

VS2010 c++编写的程序在别人的机子运行不了,缺少mfc100u.dll xxx100d.dll等的解决方法解决方法:1.将这些dll打包,和应用程序一起发布;2.采用MFC静态编译; 使用VS2010编译的程序在windows xp中运行时  经常会出现找不到  相关的DLL文件,我们可以使用静态编译的方法把这些运行依赖文件打包到*.exe中来,以减少对环境的依

2017-06-04 22:15:10

分分钟推导神经网络

推荐看这个连接:点击打开链接

2017-04-13 09:49:00

什么是 openFST,如何应用于语音识别?

转自:点击打开链接加权有限状态机 453加权有限状态机OpenFst学习资源FST在语音识别中的应用WFST in KaldiOpenFstOpenFst is a library for constructing, combining, optimizing, and searching weighted finite-state tr

2017-04-13 09:44:53

Kaldi 中文语音识别需要考虑的问题

转自:点击打开链接原文作者:英语流利说团队 李飞腾Kaldi语音识别1.声学建模单元的选择1.1对声学建模单元加入位置信息2.输入特征3.区分性技术4.多音字如何处理?5.Noise Robust ASR6.Deep Learning[DNN/CNN替换GMM]7.在手机等资源受限设备author:FeitengEmail:

2017-04-13 09:40:03

DNN-HMM 中 DNN 与 HMM 的关系

状态绑定参考:点击打开链接决策树的聚类参考:点击打开链接一、简单原理介绍在发音过程中,因为协同发音的影响,同一个音素在不同的位置,其发音变化很大,如下图所示:同样的元音[eh]在不同的单词中的发音在频域上区分非常明显。因为单音素monophone 是上下文独立的(context-independent)为了能够表示这种区别,因此提出了triphone的概念,triphone是根据左右音素来确定的,

2017-04-13 01:02:24

汉语拼音音节的歧义指数

汉语拼音音节的歧义指数                       冯志伟         如果不计声调,基本的汉语音节只有405个,这405个汉语音节可以表示全部汉字的读音。而《通用规范汉字表》包含了8105个通用汉字,在这种情况下,在一般使用中,一个汉语音节平均要表示20个以上的汉字(8,105/405 = 20.01)。         例1  在《通用规范汉字表》(

2017-04-12 15:54:19

语音识别中的 senone 是什么?

有时候,音素会被放在上下文中考虑,这样就形成了三元音素或者多元音素。但它与亚音素不同,他们在波形中匹配时长度还是和单一音素一样。只是名字上的不同而已,所以我们更倾向于将这样的多元音素称为senone。一个senone的上下文依赖比单纯的左右上下文复杂得多,它是一个可以被决策树或者其他方式来定义的复杂函数。(英语的上下文相关建模通常以音素为基元,由于有些音素对其后音素的影响是相似的,因而可以通过音素

2017-04-12 14:31:25

如何用 Kaldi 训练一个 DNN 声学模型

1. 介绍:    首先,需要完成 标准的 GMM-HMM 声学模型的训练    训练 monophone model 是通过 GMM-HMM System 做 utterance-level transcriptions,即训练 label-audio 的映射    训练 triphone model 是通过 GMM-HMM System 做 phoneme-to-audio gli

2017-04-11 21:15:11

Kaldi HCLG 深入理解

1. 相关部分包含的主要任务1.1 WFST Key Conceptsdeterminizationminimizationcompositionequivalentepsilon-freefunctionalon-demand algorithmweight-pushingepsilon removal1.2 HMM Key ConceptsMarkov ChainHid

2017-04-11 15:38:10

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 分享宗师
    分享宗师
    成功上传21个资源即可获取