SpeechScience-CSDN博客

原创 GPU Occupacy

定义：the ratio of the number of active warps per multiprocessor to the maximum number of possible active warps每个多处理器上的活跃warps/最大可能warps的比值percentage of the hardware's ability to process warps that ...

2019-05-14 18:56:24 213

原创论文笔记

论文摘要P1：【说话人识别】 DEEP NEURAL NETWORKS FOR SMALL FOOTPRINT TEXT-DEPENDENTSPEAKER VERIFICATION离线多说话人训练说话人区分网络 net，目标层为one-hot说话人矢量利用net对enrollment的说话人语音进行计算，在多特征多语句上的最后隐层的平均作为说话人矢量d-vectord-vector进行cosi

2017-03-07 10:46:14 668

原创 3D音效-HRTF

最近VR比较火热，但聚焦点主要在视频方面。事实上音频对于VR的体验也十分重要。想象一下你在看VR电影的时候，来自不同方位的声音，是不是会更加增加临场感。为什么我们的耳朵能够分辨出声音来自己与不同的方向。下面让我们来揭晓一下。人们能够分辨出声音的远近，方向，主要与声波到达双耳的能量，时间和相位差等信息密切相关。把声音经介质到达人耳的路径可以看成一个滤波的过程，到达两个耳朵的声波在不同的角度是

2016-10-11 17:56:58 2246

原创如何用kaldi训练好的DNN模型做在线识别

在已经训练好模型的情况下，需要针对一个新任务做在线识别应该怎么做呢？一种情况是，用已有的声学模型和新训练的语言模型。语言模型可以同srilm等工具训练，但是怎样将语言模型与DNN声学模型一起来进行识别的。SRILM可以用来训练ARPA格式的LM，假设train.txt是语料，wordlist是词汇，假设语言模型的字典和识别器的字典一样，可以按如下办法训练ＬＭngram-coun

2016-10-11 17:46:55 7992 3

原创端到端语音识别系统

本文主要观点来自于 google论文。Towards End-to-EndSpeech RecognitionUsing Deep Neural Networks。问题背景：传统语音识别系统需要经过提特征,声学建模（state-phoneme-triphone），语言建模系列过程，其中声学建模需要对上下文相关的音素模型进行状态聚类，对每一帧特征需要做对齐。端到端系统主要提出了下面的

2016-10-11 16:13:55 9057 1

原创 android NDK 编译静态动态库

（1）配置Android.mkinclude$(BUILD_SHARED_LIBRARY) 编译静态库 include $(BUILD_STATIC_LIBRARY) 编译动态库(2) 库的使用使用动态库配置如下include $(CLEAR_VARS)LOCAL_MODULE := Ne10LOCAL_SRC_FILES := libNe10.soincl

2016-10-09 17:11:39 618

原创数据处理memo

(1) Data1(EST) 多处文件为空(2) Data2(EST-2)windows转到linux下处理，需要利用dos2unix转化；存在文本类别里面的？号在从gbk转utf8时，转码错误(f59 -> f65)；(3) Data3 (corp)guangzhou shanghai的女声目录下存在error文件夹

2015-12-15 09:48:25 570

转载【转载】Deep Learning方向的paper整理

Deep Learning方向的paper整理，分了几部分吧，但有些部分是有交叉或者内容重叠，也不必纠结于这属于DNN还是CNN之类，个人只是大致分了个类。目前只整理了部分，剩余部分还会持续更新。一 RNN1 Recurrent neural network based language model RNN用在语言模型上的开山之作2 Sta

2015-10-14 14:08:49 663

转载【转载】Google研究员Ilya Sutskever：成功训练LDNN的13点建议

摘要：本文由Ilya Sutskever（Google研究员、深度学习泰斗Geoffrey Hinton的学生、DNNresearch联合创始人）所写，讲述了有关深度学习的见解及实用建议，包括深度学习为什么强大，如何强大，以及训练深度神经网络的tricks。【编者按】本文由Ilya Sutskever（Google研究员、深度学习泰斗Geoffrey Hinton的学生、DNNre

2015-10-14 14:05:29 1080

原创 Linux命令

(1) vim字符串计数%s/test/&/gn

2015-09-15 18:14:44 546

原创 Kaldi-Running the example scripts

(1) 特征：提取：steps/make_mfcc.sh --nj 8 --cmd "run.pl" data/$x exp/make_mfcc/$x $featdir;查看：copy-feats ark:$featdir/raw_mfcc_train.1.ark ark,t:- | head(2) 模型：训练：steps/train_mono.sh --nj 4 --c

2015-08-24 10:34:24 1005

Inger_H的博客