自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 GPU Occupacy

定义:the ratio of the number of active warps per multiprocessor to the maximum number of possible active warps每个多处理器上的活跃warps/最大可能warps的比值percentage of the hardware's ability to process warps that ...

2019-05-14 18:56:24 213

原创 论文笔记

论文摘要P1:【说话人识别】 DEEP NEURAL NETWORKS FOR SMALL FOOTPRINT TEXT-DEPENDENTSPEAKER VERIFICATION离线多说话人训练说话人区分网络 net,目标层为one-hot说话人矢量利用net对enrollment的说话人语音进行计算,在多特征多语句上的最后隐层的平均作为说话人矢量d-vectord-vector进行cosi

2017-03-07 10:46:14 668

原创 3D音效-HRTF

最近VR比较火热,但聚焦点主要在视频方面。事实上音频对于VR的体验也十分重要。想象一下你在看VR电影的时候,来自不同方位的声音,是不是会更加增加临场感。为什么我们的耳朵能够分辨出声音来自己与不同的方向。下面让我们来揭晓一下。人们能够分辨出声音的远近,方向,主要与声波到达双耳的能量,时间和相位差等信息密切相关。把声音经介质到达人耳的路径可以看成一个滤波的过程,到达两个耳朵的声波在不同的角度是

2016-10-11 17:56:58 2246

原创 如何用kaldi训练好的DNN模型做在线识别

在已经训练好模型的情况下,需要针对一个新任务做在线识别应该怎么做呢?一种情况是,用已有的声学模型和新训练的语言模型。语言模型可以同srilm等工具训练,但是怎样将语言模型与DNN声学模型一起来进行识别的。SRILM可以用来训练ARPA格式的LM,假设train.txt是语料,wordlist是词汇,假设语言模型的字典和识别器的字典一样,可以按如下办法训练LMngram-coun

2016-10-11 17:46:55 7992 3

原创 端到端语音识别系统

本文主要观点来自于 google论文。Towards End-to-EndSpeech RecognitionUsing Deep Neural Networks。问题背景:传统语音识别系统需要经过提特征,声学建模(state-phoneme-triphone),语言建模系列过程,其中声学建模需要对上下文相关的音素模型进行状态聚类,对每一帧特征需要做对齐。端到端系统主要提出了下面的

2016-10-11 16:13:55 9057 1

原创 android NDK 编译 静态动态库

(1)配置Android.mkinclude$(BUILD_SHARED_LIBRARY) 编译静态库 include $(BUILD_STATIC_LIBRARY) 编译动态库(2) 库的使用  使用动态库配置如下include $(CLEAR_VARS)LOCAL_MODULE := Ne10LOCAL_SRC_FILES := libNe10.soincl

2016-10-09 17:11:39 618

原创 数据处理memo

(1)  Data1(EST) 多处文件为空(2) Data2(EST-2)windows转到linux下处理,需要利用dos2unix转化;存在文本类别里面的?号在从gbk转utf8时,转码错误(f59 -> f65);(3) Data3 (corp)guangzhou shanghai的女声目录下存在error文件夹

2015-12-15 09:48:25 570

转载 【转载】Deep Learning方向的paper整理

Deep Learning方向的paper整理,分了几部分吧,但有些部分是有交叉或者内容重叠,也不必纠结于这属于DNN还是CNN之类,个人只是大致分了个类。目前只整理了部分,剩余部分还会持续更新。一 RNN1 Recurrent neural network based language model  RNN用在语言模型上的开山之作2 Sta

2015-10-14 14:08:49 663

转载 【转载】Google研究员Ilya Sutskever:成功训练LDNN的13点建议

摘要:本文由Ilya Sutskever(Google研究员、深度学习泰斗Geoffrey Hinton的学生、DNNresearch联合创始人)所写,讲述了有关深度学习的见解及实用建议,包括深度学习为什么强大,如何强大,以及训练深度神经网络的tricks。【编者按】本文由Ilya Sutskever(Google研究员、深度学习泰斗Geoffrey Hinton的学生、DNNre

2015-10-14 14:05:29 1080

原创 Linux命令

(1) vim字符串计数%s/test/&/gn

2015-09-15 18:14:44 546

原创 Kaldi-Running the example scripts

(1) 特征:提取:steps/make_mfcc.sh --nj 8 --cmd "run.pl" data/$x exp/make_mfcc/$x $featdir;查看:copy-feats ark:$featdir/raw_mfcc_train.1.ark ark,t:- | head(2) 模型:   训练:steps/train_mono.sh --nj 4 --c

2015-08-24 10:34:24 1005

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除