自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

u010384318的专栏

机器学习 语音识别 ing

  • 博客(219)
  • 资源 (4)
  • 收藏
  • 关注

原创 告诉大家的话

由于工作的原因,我对这个博客已经不在维护。一晃眼,毕业已经四年了,我还在从事语音这块的工作。大家有问题全部去语音杂谈微信公众号里问。kaldi日新月异,语音技术也日新月异,博客里有很多错误暂时也没法管理。望各位见谅。kaldi群有很多已经满了,建议大家一个一个试试。kaldi交流群为:367623211。kaldi新手群:279295537。kaldi新手交流群:374355...

2020-06-02 10:24:04 1583 1

原创 微信公众账号发布了

是的,咱们开始使用微信公众账号了,名字叫语音杂谈,欢迎关注。有啥问题可以在微信公众账号后台回复我。已经有2篇了,分别为:1.语音杂谈2.推荐一个非常好的语音专题系列欢迎关注,欢迎讨论,谢谢……

2017-04-26 20:04:37 2939 1

原创 kaldi群和kaldi新手群

从2014年2月27日开始建立kaldi学习群(群号:367623211),经过一段时间的努力,今天终于群达到1000人了,后期将逐步清理一些人,腾出一些位置。此外,如果你是新手,欢迎加入kaldi学习新手群(群号:279295537),这里也许有跟你一样的新手,这样你们遇到的问题也就一样。

2016-06-22 12:06:32 4852

原创 对各位语音识别新手的几句建议

对各位语音识别新手的建议由于工作的原因,很长时间不能更新博客和管理kaldi群,每天看着kaldi群的人数不断增长,由衷的为从事语音感到自豪,希望在我博客和群里能得到你们想要的,但我同时拒绝伸手党。这几年语音的发展很迅速,所以导致更多的人来学习:下面主要从2个方面来说明,一个是从学生角度,一个是从工业角度。希望以后问怎么学习和怎么研究的人会越来越少,当然我这里也只是抛砖引玉。学生角度如果你是本科生,

2016-03-14 22:55:41 12998 3

原创 语音识别原理介绍-----(这次是收费的)

理解语音识别原理

2014-12-04 19:09:30 9081 1

原创 kaldi群北京线下交流会(2017年4月9日)

kaldi群线下交流会(2017年)自2015年组织了第一次kaldi群交流会,一直到现在才有机会弄第二次,后面也会有很多次。 本次线下交流目前正式启动,时间暂时定位4月9日。目前开始需要征集发言人和学生展示环节。发言人主要就一个熟悉的语音领域或者kaldi的一部分进行分享;学生展示就是学生利用kaldi或者其他的工具箱做的项目展示一下。此外,如果有人愿意赞助场地,水和水果等,那就更好了。此

2017-03-10 12:03:38 2492 1

原创 kaldi上第一个免费的中文语音识别例子

今天在清华大学cslt实验室王东老师的分享下,kaldi终于有了免费的中文语音识别的例子,网址为:https://github.com/kaldi-asr/kaldi/tree/master/egs/thchs30。各位可以根据这个来训练自己的模型。 再次谢谢王东老师的付出。 此外,清华大学cslt分享的数据库还有很多,网址为:http://pan.baidu.com/s/1dEhUghz

2016-02-04 12:46:09 38317 12

原创 htk-3.5

htk-3.5终于在2015年最后一天来了,也没算失约。对于之前使用htk的人来说,算是一个福利吧。毫无疑问,新版添加了DNN部分。同步更新了HTKbook和源码,现在上传到百度云上,具体链接是:链接:http://pan.baidu.com/s/1pKmfZ4Z 密码:bh1y。大家可以下载看看……

2016-01-02 12:28:52 3400

原创 语音课程(此群已解散,请加kaldi群)

语音课程真的来了,真的来了,期待已久的可能真的来了。语音课堂群:499169362。 本次将邀请几位大神,他们都是从业多年。现在可以加群,但是是收费的,所以不考虑收费的就加入kaldi群吧。 后面人数达到50人后,课程将正式启动。后期的课程大纲和内容明细将逐步发布。 谢谢各位,有兴趣加群。记住是收费的。备注:收费 语音课堂。

2015-10-21 23:07:27 3517 6

原创 kaldi主页搬家了……

最近大家是不是发现kaldi主页打不开了,的确,kaldi已经全部从sourceforge搬家到github上了,具体的链接如下:1.kaldi主页的内容:http://kaldi-asr.org/doc/2.kaldi代码:https://github.com/kaldi-asr/kaldi3.更多的内容和消息:http://kaldi-asr.org/

2015-07-23 22:59:41 2158

原创 展望几件事情

时间过得很快,清楚的记得来成电那天的大雨,然而是时候跟母校说再见了。很幸运的能成为成电的一份子,很幸运在这所学校涨了很多见识,觉得考研那个决定还是很正确的。这三年在成电的成长,让我知道外面的人更强,外面的世界更加的精彩。这三年期间写了一堆博文,虽然水平不高,但是我的确用心写了,我不求高深,只求通俗易懂。然而,这篇博文应该算是学生生涯最后一篇博文了。我即将踏上工作,未来也许没有足够的时间来打理这个群,

2015-06-13 21:46:03 1989

翻译 kaldi中的深度神经网络

这里是翻译kaldi主页的深度神经网络这部分,主要包括karel的版本和dan的版本,由于现在更新了新的版本,所以重新翻译。这些也将在kaldi的中文版本gitbook中发布,如果你想加入,你与我们取得联系,为kaldi的中文版做点贡献。karel的深度神经网络翻译:[email protected]时间:2014年4月翻译,2015年4月重新修改翻译综述这个文档主要来说kaldi中Karel Ves

2015-05-11 10:35:33 20372 4

原创 kaldi群见面会的计

新学期的来临,我也开始忙碌毕设的事情,加上一些杂事,导致在群里没回复大家的问题,抱歉。今天开始写博客,主要为了下面几个事情:1.大概4月份上旬和中旬的时候,首先会去趟北京,希望没有其他事情的干扰吧。这次去北京的一大目的就是为了跟大家群里交流,剩下就是几个事情安排:     1)时间安排:最好是某个周末吧。具体时间希望大家可以讨论下;     2)场地安排:希望有场地的,有的可以提前跟我

2015-03-13 20:41:46 1516

原创 音频、语音信号处理的相关需求(广告)

下面是某同学做出来的一些东西,有:电话语音状态识别、音乐检索、广告监测、相似性音乐比对。如果你需要一些语音或者音乐方面的需求没法解决,可以去尝试联系他。具体的四个应用链接如下:1.电话语音状态识别2.广告监测3.音乐检索4.相似性音频比对如果你有其他的需求,也可以去联系他。也许你的联系,可以减少你寻找的时间。谢谢……有任何问题也可以留言。也可以联系我,邮箱:wbgxx333@1

2015-03-10 14:21:07 2024

原创 关于kaldi群的年终总结

去年的这个时候,写了一篇timit数据库的分享,分享这个的原因也是因为自己之前困于没有数据库,但是分享一段时间后,大家提醒我版权问题,我就停止了,相信需要的都下载了.想想这个博客到现在,正好一年,这一年来,kaldi群的不断壮大,kaldi最全资料的更新到第四版,大家共同去翻译kaldi主页上的资料,这些事情我觉得还是很好的,这个事情本来还是可以做得更好,等有时间,我会放到github上这样一起来

2014-12-31 16:34:19 2255

原创 kaldi上使用gpu以及如何安装cuda

本博客是在@冒顿的指导下完成的。

2014-11-17 21:24:42 15506 4

原创 语音识别原理介绍------组队理解原理

之前我自己一直想把语音识别原理解释清楚,大家翻我的博客

2014-11-11 22:18:55 7094 2

原创 语音识别基本原理介绍------dnn-hmm续

很久没更新博客了,最近找工作找的不是

2014-10-25 14:29:36 11958 6

原创 语音识别基本原理介绍--gmm-hmm中训练的完整版

看了几天了,结合之前看kaldi里的训练,现在我觉得可以wanqua

2014-09-02 16:06:49 28203 4

翻译 语音识别基本原理介绍----gmm-hmm中的embedded training (嵌入式训练)

本文是翻译Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition. Daniel Jurafsky & James H. Martin.Copyright c 2006, All rights r

2014-09-01 21:48:28 6224 1

原创 语音识别基本原理介绍之gmm-hmm续

在之前的博文里,我已经写过了一篇博文:语音识别系统原理介绍----gmm-hmm,但是觉得还是没有说清楚这个事情,特别是在gmm和hmm过程里。过段时间也要找工作了,很有必要再弄清楚。现在这里说下,但愿可以说的很清楚,如果有错误,欢迎指正。这里,提取特征这部分,我们就不再说说明了,这里直接说gmm了。当提完特征,接下来我们就需要计算声学似然比,也就是给定一个HMM的状态和观察序列,计算,这里的

2014-08-31 19:57:33 5923 15

翻译 kaldi里的聚类机制

kaldi里的聚类机制这里讲阐述在kaldi里的聚类机制和接口。可以看Classes and functions related to clustering来了解涉及到的类和函数列表。这里不包括音素决策树聚类(看Decision tree internals和How decision trees are used in Kaldi),尽管这里介绍的类和函数是在音素聚类的代码的底层使用。

2014-08-20 13:01:06 2420

翻译 HMM topology and transition modeling

HMM topology and transition modeling介绍在这里我们将介绍在kaldi用如何表示HMM topologies和我们如何让建模和训练HMM 转移概率的。我们将简要的说下它是如何跟决策树联系的;决策树你可以在How decision trees are used in Kaldi和Decision tree internals这些地方看到更详细的; 对于这个里

2014-08-17 21:15:44 3055 2

原创 语音识别的一些概念

最近发现台湾的陈老师的语音识别课程主页,

2014-08-13 15:43:30 2714

翻译 决策树是如何在kaldi中建立的

How decision trees are used in Kaldi介绍这部分将介绍音素决策树在kaldi中是如何建立和使用的,以及是如何将训练和图建立相交互的。对于决策树的构建的代码,可以看 Decision tree internals; 对于建立图解码的更多细节,可以看Decoding graph construction in Kaldi.最基本的实现方法就是自顶向下贪婪的

2014-08-11 16:57:12 5680

原创 有关语音方面的深度学习资料合集

深度学习如火如荼的在发展着,在应用着,下面把一些深度学习在语音上d

2014-08-03 17:36:45 8082 3

原创 kaldi资料合集下载

应kaldi学习 语音深度学习群大家的强烈要求,现把kaldi的zilia

2014-07-07 16:28:36 5909 7

转载 fftw库的window安装和linux安装和例子

机子里的FFTW库下了很长时间了,总也没有去搞。唉,有很多东西就是这样,千方百计搞过来,搞到手了就晾在那里了。记得《黄生借书说》里面说得对啊“书非借不能读也”。好了,感慨完毕。归入正题。Windows下FFTW库的安装1、  从网址http://www.fftw.org/install/windows.html上获得FFTW的windows dll预编译版本;2

2014-07-03 09:25:01 21422 2

转载 表达式"x=x&(x-1)"

x = x & (x - 1)含义:这条语句执行一次,就会把x用二进制格式表示时的最右边的一个二进制1变为二进制0,因为x-1会将该位(x用二进制表示时最右边的一个二进制1)变为0;应用1:把一个整数用二进制表示时,其中二进制1的个数;int Func(int x){  int count = 0;  while(x)  {    x = x & (x - 1)

2014-06-30 23:47:56 1116

转载 Science上发表的超赞聚类算法

作者(Alex Rodriguez, Alessandro Laio)提出了一种很简洁优美的聚类算法, 可以识别各种形状的类簇, 并且其超参数很容易确定.算法思想该算法的假设是类簇的中心由一些局部密度比较低的点围绕, 并且这些点距离其他有高局部密度的点的距离都比较大. 首先定义两个值: 局部密度ρi以及到高局部密度点的距离δi:ρi=∑jχ(dij−dc)其中

2014-06-29 12:10:54 2389

原创 我们的语音识别有论坛了……

语音识别模块正式入驻nlp论坛,这里感谢nlp论坛里的管理员,谢谢他们可以为我们提供这个平台。       希望在这个平台里,大家可以相互学习,学习到更多的关于语音识别的东西。欢迎大家的加入和交流。       我们的语音识别模块主要分为语音识别文章子模块,语音识别工具箱子模块和其他子模块。下面我来分别介绍下每个子模块的功能,也希望大家可以对号发帖,你的帖子也会最可能最快的得到回复。 

2014-06-04 23:24:33 3807 6

翻译 Phn2vec Embeddings

昨天在我爱机器学习上看到

2014-06-02 10:11:55 1538 2

原创 如何利用kaldi提自己想要的特征(mfcc plp pitch)

首先,确保你的s5文件夹有conf local step utils文件夹。然后你把你的数据保存为test文件夹,比如test文件夹里有test1.wav test2.wav test3.wav。然后,新建个data文件夹,data文件夹新建个test文件夹,这个test文件夹里需要三个文件:wav.scp utt2spk  spk2utt。Wav.scp可以这么写:test1 tes

2014-05-30 19:14:04 9585 3

翻译 kaldi中的数据准备

数据准备译者:V ([email protected])  水平有限,如有错误请多包涵。介绍在运行完示例脚本后(见Kaldi tutorial),你可能会想用自己的数据在Kaldi上跑一下。本节主要讲述如何准备相关数据。我们假设本页的读者使用的是最新版本的示例脚本(即在脚本目录下被命名为s5的那些,例如egs/rm/s5)。另外,除了阅读本页所述内容外,你还可以查看脚本目录下的那

2014-05-19 12:24:17 21606 12

翻译 kaldi中的特征提取

本翻译原文http://kaldi.sourceforge.net/feat.html,由@煮八戒翻译,@wbglearn校对和修改。 特征提取简介我们做特征提取和波形读取的这部分代码,其目的是为了得到标准的MFCC(译注:梅尔倒谱系数)和PLP(译注:感知线性预测系数)特征,设置合理的默认值但留了一部分用户最有可能想调整的选项(如梅尔滤波器的个数,最小和最大截止频率等等)。这部分

2014-05-14 10:36:27 10639

原创 kaldi学习的过程

最近太忙,群里大家讨论的不够积极,而且翻译的事情似乎大家还在进行zhong

2014-05-09 14:53:27 7542

翻译 kaldi中的在线识别----Online Recognizers

本文是kaldi学习联盟中@冒顿翻译的,下面是@冒顿的翻译结果,在这里感谢@冒顿的辛勤劳动,希望更多的人加入到这个翻译上来,为更多的人学习……因为我们翻译的文档都有url,csdn不支持我们的直接发表,所以只能用图片,最后的翻译会集成pdf版,后面会公开的。最后,如果你发现有任何问题,欢迎留言讨论。我会在最快的时间回复大家,希望大家共同学习……

2014-05-03 19:43:55 5814 1

翻译 kaldi中深度学习的主要实现---------Karel's DNN training implementation

说明:本文是翻译kaldi主页里的Karel的深度学习模型的实现。

2014-04-24 22:01:37 5789

原创 关于语音识别系统kaldi及qq群的一些想法

自从建议kaldi学习 语音深度学习的qq群以来

2014-04-22 18:55:35 2914 4

原创 kaldi主页上的翻译的事情(更新)

kaldi主页上的翻译的事情一直

2014-04-08 21:02:34 3340 4

kaldi资料合集

kaldi资料合集,内含kaldi的安装,使用和kaldi主页上的翻译

2014-07-07

语音识别kaldi安装

语音识别系统之kaldi安装。里面有具体步骤,欢迎下载。

2013-12-13

julius-4.2.3

语音识别工具箱 非常好用的,可以自行运行 不懂的私信我

2013-10-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除