deal_blank.py
使用python进行数据处理,处理text,当text里面有空行的时候,使用python进行删除text里面的空行。
get_wav.py
使用python进行查找,查找文件夹下面的子文件夹下面的wav文件,并输出wav文件的具体位置,直接寻找子文件夹下面的所有文件,并输出wav文件。
dic_match.py
python批量处理wav文件,将两个文件以字典的方式进行存储,然后进行匹配,当字典1里面的键与字典2里面的键相同的时候,进行输出。
语音识别噪声库
应用于语音识别数据加噪的数据,这里面包含了各种噪声,kaldi下面thchs30里面有具体的加噪代码,增加噪声可以使得声学模型更具有鲁棒性。有兴趣的可以尝试。
服务器上面硬盘挂载
当时在挂载硬盘的时候自己做的文档,因为当时挂载的时候出现的很多问题,希望可以有帮助。
CUDA以及驱动更新
当时自己安装的时候做的笔记,主要是基于centos7下面cuda的更新,做的比较粗糙,希望有帮助。
kaldi工具箱
kaldi工具箱,kaldi是一款语音识别工具库,由Daniel Povey进行开发和维护,整个框架比较成熟,在容纳经久不衰的GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别模型之外,还将现阶段比较“火”的DNN、CNN、LSTM、BLSTM等深度神经网络模型加入其中,获得了广大科研工作者和不少企业公司研发团队的青睐。