自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

liuliqun520的博客

原创 dockers 后台启动

docker run -itd --name --gpus all -v /home/:/home/ --restart=always --name=dockerName --p 80:80 dockername:版本号# -i 不是必需，加了，容器起来后终端返回容器ID# -t是显示# -d是后台运行# --gpus是使用gpu# -v是映射硬盘# --restart保存可以重启-p 映射端口-name 容器名字--shm-size 交互空间--ipc标志在容器之间共享内存docker run -itd

2022-07-11 14:47:04 1464

原创 docker迁移遇到torch不能使用

报错OSError: /opt/hpcx/ompi/lib/libmpi.so.40: undefined symbol: opal_hwloc201_hwloc_get_type_depth这个torch编译得环境存在问题解决方案sudo apt-get install libopenblas-base libopenmpi-dev原链接Unable to import pytorch - Jetson & Embedded Systems / Jetson Nano - NVIDIA Developer

2022-06-22 20:38:39 2695 1

原创 nemo-conformer-subword bug调试

背景法语asr根据英语asr反应conformer效果不quartznet效果好法语数据没得到实质性的增长，开启模型调研环境配置避坑拉取nemo官方镜像nvcr.io/nvidia/pytorch:21.05-py3，安装nemo库pip install nemo_toolkit==1.4.0，这个是将库暗转虚拟环境可以选择将nemo_toolkit对应的环境下在Nemo25下运行./reinstall.sh 运行docker可能回出现nccl错误，在运行doc.

2022-02-11 13:53:18 1638

原创关键词识别

Transformer 架构在许多领域都取得了成功，包括自然语言处理、计算机视觉和语音识别。在关键字发现中，自我注意主要用于卷积或循环编码器之上。我们研究了一系列使 Transformer 架构适应关键字发现的方法，并引入了 Keyword Transformer (KWT)，这是一种完全自我注意的架构，无需任何预训练或额外数据即可在多个任务中超越最先进的性能.令人惊讶的是，这种简单的架构优于混合卷积、循环和注意力层的更复杂模型。 KWT 可以作为这些模型的替代品，在 Google Speech Comm.

2022-02-11 11:46:26 1905

原创保存修改docker并打包镜像

1、将修改的容器保存为镜像通过docker ps找到需要保存的镜像，得到镜像id 保存修改id这个时候建议提交时候修改镜像名称或者版本号 docker commit -m "第一次保存subword镜像" 18e16153e6d5 conformer_subword:v0.0 详细介绍docker commit -a :提交的镜像作者； -c :使用Dockerfile指令来创建镜像； -m :提交时的说明文字； -p :在commit时，将容器暂停。将容器18e1

2022-02-11 11:45:39 2100

原创 train_mono.sh kaldi介绍

1.首先是初始化GMM，使用的脚本是/kaldi-trunk/src/gmmbin/gmm-init-mono，输出是0.mdl和tree文件；$cmd JOB=1 $dir/log/init.log \ gmm-init-mono $shared_phones_opt "--train-feats=$feats subset-feats --n=10 ark:- ark:-|" $la...

2020-01-04 16:25:08 247

转载 kaldi 中train_mono.sh分析

$cmd JOB=1 $dir/log/init.log \ gmm-init-mono $shared_phones_opt "--train-feats=$feats subset-feats --n=10 ark:- ark:-|" $lang/topo $feat_dim \ $dir/0.mdl $dir/tree || exit 1;训练结果是生成0.mdl和tree...

2020-01-02 20:51:47 260

原创配置pycharm环境，使用秘钥通过跳板机访问服务器。

1、在本地端输入vim~/.ssh/config然后编辑Host * ForwardAgent yes ForwardX11 yes ForwardX11Trusted yes ControlPersist yes ControlMaster auto ControlPath ~/.ssh/master-%r@%h:%p跳板机上输入...

2019-12-09 16:51:39 675

原创 librosa.load报错。audioread.NoBackendError

1、确保你安装了ffmpeg，要求apt方式安装的2、which ffmpeg找到安装的位置3、/home/ubuntu/miniconda3/envs/pytorch_cpu/lib/python3.5/site-packages/audioread就是进入audioread文件夹zhong找到ffdec.py文件最后发现在ffdec.py第89行for i, command...

2019-11-15 10:27:13 1064

原创 mobaxterm通过跳板机访问远程服务器（跳板机使用秘钥）

https://www.jianshu.com/p/43a0ab131ad9最上面哪行ip填的是目标机器的，最下面哪行填的是跳板机的，最后选择的是秘钥登陆。注意任何配置修改后都需要重启下 MobaXterm，否则不会生效。2.1. 取消自动关闭连接MobaXterm 使用 ssh 直接连接远程主机，或者通过跳板机登陆远程服务器可能会出现一段时候不操作就会自动关闭连接。要解决这个...

2019-11-04 14:46:23 12548 4

原创 winscp通过跳板机访问远程服务器（使用秘钥的方式传输文件）

一般需要ssh两个账户或两个设备才能有权限传输数据时经常遇到下面情况：我们一般连接跳板机使用的用户权限很小，能访问的文件不多，要是我想传输数据到我的设备上，却必须用跳板机连接设备怎么办？（别告诉我先在设备上搭个FTP服务器）下载winscp：下载地址https://winscp.net/eng/downloads.php然后傻瓜式安装一键到底安装好就是配置访问服务器1、直接...

2019-11-04 14:17:44 4736

原创 Ubuntu下安装anaconda、pytorch、tensorflow等科学软件

Ubuntu18安装 Anaconda3安装路径参考文献anaconda所有版本下载清华源https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/https://blog.csdn.net/qq_40584960/article/details/83928829配置安装pytorchhttps://blog.csdn.net/hktx...

2019-08-28 17:04:24 211

原创 anaconda安装pytorch

#1安装anaconda 对应python版本https://www.jianshu.com/p/2fd2754d8d53[anaconda安装](https://blog.csdn.net/Yushl_sirius/article/details/77866411)![anaconda与python对应关系](../pics/anaconda_001.png)[清华库](https...

2019-08-27 11:15:47 2586

转载 Python的Tqdm模块——进度条配置

版权声明：请大家使用时记得显示原创的博主哦！！ https://blog.csdn.net/qq_33472765/article/details/82940843 ...

2019-07-31 16:49:23 439

转载面试L0,L1,L2范数

在深度学习中，监督类学习问题其实就是在规则化参数同时最小化误差。最小化误差目的是让模型拟合训练数据，而规则化参数的目的是防止模型过分拟合训练数据。参数太多，会导致模型复杂度上升，容易过拟合，也就是训练误差小，测试误差大。因此，我们需要保证模型足够简单，并在此基础上训练误差小，这样训练得到的参数才能保证测试误差也小，而模型简单就是通过规则函数来实现的。规则化项可以是模型参数向量的范数。...

2019-06-20 22:25:19 295

转载 shell 命令

Shell编程快速入门指南Shell编程快速入门指南原文地址：https://juejin.im/post/5a5caaf8f265da3e393a6835#heading-2第一个shell脚本#!/bin/bashecho "hello, world"复制代码运行程序可以作为解释器参数或者作为可执行程序bash test.sh复制代码chmod +x t...

2019-04-09 20:45:38 1129

原创 kaldi第二步 timit调试

修改run.sh文件内容1、首先需要下载timit的数据集，kaldi不自带这是因为版权问题，你可以在其它地方下到。2、将预训练中的timit的地址更改一下例如：#timit=/mnt/matylda2/data/TIMIT/timit # @BUTtimit=/data1/williamli/gitlab/kaldi/egs/timit/s5/data/TIMIT修改cmd.s...

2019-04-08 21:52:08 510

转载 kaldi第一步安装kaldi测试yesno

Kaldi是一个非常强大的语音识别工具库，主要由Daniel Povey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。其中DNN-HMM中的神经网络还可以由配置文件自定义，DNN、CNN、TDNN、LSTM以及Bidirectional-LSTM等神经网络结构均可支持。目前在Github上这个项目依旧非常活跃，可以在 https://gi...

2019-04-08 21:02:40 1592 1

转载使用SSH命令行传输文件到远程服务器

以前一直在windows下用SSH Secure Shell连接远程服务器，它自带了一个可视化的文件传输工具，跟ftp差不多但是它也存在一个缺陷，不支持编码的选择，遇到utf8就自动乱码了，另外mac下也没有这个工具在mac下我用终端登录上去之后，想传个文件上去就犯愁了，难不成要开个ftp？搜了一下，果然有直接的命令行工具，名字叫SCP使用方式如下：1、上传本地文件到服务器...

2019-04-08 14:53:19 218

转载 Kaldi学习笔记（一）——Kaldi的下载安装与编译

Kaldi是一款基于C++编写的开源语音识别工具箱。这款工具既可以在Windows下编译也可以在Linux下编译。本次我是在虚拟机装上了Ubuntu 16.04.03，64位，可以联网。文档里面也说还是建议在Linux下使用Kaldi。原文地址：https://blog.csdn.net/snowdroptulip/article/details/78896915一、下载下载直接利用g...

2019-04-08 11:15:36 509

转载 win10下安装Anaconda、opencv3和配置pycharm（本人亲自安装过程）

https://blog.csdn.net/congcong7267/article/details/82947698

2019-03-01 21:38:27 289

原创 win7 下anaconda TensorFlow tensorboard使用

第一步在 Spyder（TensorFlow）中输入一下代码：# View more python learning tutorial on my Youtube and Youku channel!!!# Youtube video tutorial: https://www.youtube.com/channel/UCdyjiB5H8Pu7aDTNVXTTpcg# Youku vid...

2018-11-27 11:39:50 232

原创 keras报错softmax() got an unexpected keyword ‘axis‘’

# -*- coding: utf-8 -*-"""Created on Tue Oct 23 18:43:30 2018@author: Administrator"""import numpy as np from keras.models import Sequentialfrom keras.layers.core import Dense, Dropout, Activ...

2018-10-23 20:16:27 542 1

转载 python+各种包集成安装之Anaconda安装及使用教程

转载自http://bbs.pinggu.org/thread-4602381-1-1.html对于初学者，Python的安装也许并不容易，尤其面临python版本的困境，浪费了很多宝贵的时间，甚至让人放弃的感觉，然而今天我们介绍一种简便的安装方法，可以完美的兼容python2.7和python3.5，并集成了许多packages，免去配置环境变量的烦恼，正好结合作者最近几天的折腾，很乐意和大...

2018-10-08 18:47:41 1724

转载 Ubuntu16.04 MATLAB2017a

需要MATLAB2017 liunx版本的话联系我（扣扣798718244），百度网盘分享很快会被删除。MATLAB安装教程很多,这里仅作为个人学习记录,如有问题,可留言.1. 下载MATLAB2017a 可以看到一个压缩包和两个iso镜像文件.其中rar文件最好要在Windows系统下解压完成后复制到Ubuntu系统中,Linux系统对rar文件解压做的不是很好....

2018-07-23 19:40:58 148

原创 mfcc程序

clear all;close;clc;[x,fs]=audioread('bj.wav');%x1=zeros(60001,1);%x1(1:60001,1)=x(30000:90000,1);x1=x(:,1);l=length(x1);%x1=x1(1:60000)-0.97*x1(2:60001);%预加重%x1=x1(1:l-1)-0.95*x1(2:l);xx=double(x1);x...

2018-06-08 14:23:33 510

转载 MFCC梅尔倒谱系数

MFCC梅尔倒谱系数阅读数：7386MFCC梅尔倒谱系数是说话人识别、语音识别中最为常用的特征。我曾经对这个特征困惑了很久，包括为什么步骤中要取对数，为什么要最后一步要做DCT等等，以下将把我的理解记录下来，我找到的参考文献中最有价值的要数【1】了。是CUM一个教授做的PPT。整个流程如下：时域的波形图如下图1. 时域波形图第一步获得语谱图，语谱图是一个非常有力的工具，因为人耳就是进行的频率分析。...

2018-06-08 14:18:58 1077

原创 win7系统下安装anaconda并且配置TensorFlow

直接上干货：一．安装Anaconda3选择相应版本的Anaconda安装，因为官网直接下载的速度太慢，我们选择从清华大学开源软件镜像站下载。下载地址：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/进入网站后，下拉到底部，选择windows版本下载。安装过程中，直接点Next即可，安装位置最好选择默认可以省去许多麻烦。到图中这一步时，注...

2018-06-05 22:55:57 594

转载梅尔频率倒谱系数（MFCC）

语音信号处理之（四）梅尔频率倒谱系数（MFCC）[email protected]://blog.csdn.net/zouxy09 这学期有《语音信号处理》这门课，快考试了，所以也要了解了解相关的知识点。呵呵，平时没怎么听课，现在只能抱佛脚了。顺便也总结总结，好让自己的知识架构清晰点，也和大家分享下。下面总结的是第四个知识点：MFCC。因为花的时间不多，所以可能会有不少说的不妥的地...

2018-06-01 15:31:42 890

转载 mfcc

MFCC(Mel-frequency cepstral coefficients):梅尔频率倒谱系数。梅尔频率是基于人耳听觉特性提出来的，它与Hz频率成非线性对应关系。梅尔频率倒谱系数(MFCC)则是利用它们之间的这种关系，计算得到的Hz频谱特征。主要用于语音数据特征提取和降低运算维度。例如：对于一帧有512维(采样点)数据，经过MFCC后可以提取出最重要的40维(一般而言)数据同时也达到了将...

2018-06-01 15:22:50 6892 2

转载 Fully Convolutional Networks for semantic Segmentation（深度学习经典论

Fully Convolutional Networks for semantic Segmentation（深度学习经典论文翻译）摘要卷积网络在特征分层领域是非常强大的视觉模型。我们证明了经过端到端、像素到像素训练的卷积网络超过语义分割中最先进的技术。我们的核心观点是建立“全卷积”网络，输入任意尺寸，经过有效的推理和学习产生相应尺寸的输出。我们定义并指定全卷积网络的空间，解释它们在空间范围内de...

2018-05-31 20:58:55 549

转载 The 9 Deep Learning Papers You Need To Know About (Understanding CNNs Part 3)

The 9 Deep Learning Papers You Need To Know About (Understanding CNNs Part 3)阅读数：2582 Introduction 本文主要总结了卷积神经网络在机器视觉领域的重要发展及其应用。我们将介绍几篇重要的公开发表的论文，讨论它们为何重要。前一半的论文（AlexNet到ResNet）将主要涉及整体系统架构的发展和...

2018-05-31 20:56:20 192

转载语音识别dome

耳蜗实质上相当于一个滤波器组，耳蜗的滤波作用是在对数频率尺度上进行的，在1000HZ下，人耳的感知能力与频率成线性关系；而在1000HZ以上，人耳的感知能力与频率不构成线性关系，而更偏向于对数关系，这就使得人耳对低频信号比高频信号更敏感。Mel频率的提出是为了方便人耳对不同频率语音的感知特性的研究。频率与Mel频率的转换公式为： MFCC在一定程度上模拟了...

2018-05-26 19:48:21 387

转载 mfcc特征提取

下面总结的是第四个知识点：MFCC。因为花的时间不多，所以可能会有不少说的不妥的地方，还望大家指正。谢谢。在任意一个Automatic speech recognition 系统中，第一步就是提取特征。换句话说，我们需要把音频信号中具有辨识性的成分提取出来，然后把其他的乱七八糟的信息扔掉，例如背景噪声啊，情绪啊等等。搞清语音是怎么产生的对于我们理解语音有很大帮助。人通过声...

2018-05-26 17:26:09 1438

转载下载安装SDK7.1

MATLAB新版本在运行mex库时需要Windows SDK 7.1，而不是之前的.NET4。又因为.NET4 + Visual C++ 10和SDK 7.1存在一定冲突，须将前者先卸载才能安装后面一个。在参考1.http://www.cnblogs.com/zzling007/p/6661705.html2.http://www.cnblogs.com/duanshuiliu/archive/2...

2018-05-17 21:57:43 10437 3

转载 MATLAB语音识别

如何在MATLAB中添加Voicebox工具箱1. voicebox介绍网站： http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html 这个网站包括了voicebox的介绍和下载包 “VOICEBOX is a speech processing toolbox consists of MATLAB routines that are...

2018-05-17 19:51:57 11253 1

原创怎么用U盘安装ubuntu系统具体步骤图文详解

U盘制作软通牒下载地址http://www.xitongcheng.com/soft/cpgj_xiazai_614.html#downloadUltraISO软碟通是一款光盘映像ISO文件编辑制作工具，它可以图形化地从光盘、硬盘制作和编辑ISO文件。 UltraISO是一款功能强大而又方便实用的光盘映像文件制作/编辑/格式转换工具，它可以直接编辑光盘映像和从映像中直接提取文件，也可以从CD...

2018-05-09 12:44:24 46349 5

原创 jupyter qtconsole 的安装

Jupyter qtconsole最近开始研究人工智能算法，发现了一款基于python的科学计算的神器，jupyter qtconsole，简直就是ipython的加强版，每个命令都直接显示帮助信息，配合matplotlib，能够在shell里直接显示绘图结果，爽歪歪。安装过程如下：pip install jupyterpip install pyqt5还没用过的小伙伴们赶紧试用吧。使用qtcon...

2018-05-08 15:34:26 5483

转载一文读懂隐马尔科夫

什么是熵(Entropy)简单来说，熵是表示物质系统状态的一种度量，用它老表征系统的无序程度。熵越大，系统越无序，意味着系统结构和运动的不确定和无规则；反之，，熵越小，系统越有序，意味着具有确定和有规则的运动状态。熵的中文意思是热量被温度除的商。负熵是物质系统有序化，组织化，复杂化状态的一种度量。熵最早来原于物理学. 德国物理学家鲁道夫·克劳修斯首次提出熵的概念，用来表示任何一种能量在空间中分布的...

2018-05-06 21:36:17 197

原创深度学习：神经网络中的前向传播和反向传播算法推导

1. 神经网络这是一个常见的神经网络的图：这是一个常见的三层神经网络的基本构成，Layer L1是输入层，Layer L2是隐含层，Layer L3是隐含层，当我们输入x1,x2,x3等数据时，通过隐含层的计算、转换，输出你的期望，当你的输入和输出是一样的时候，成为自编码模型(Auto-Encoder),而当你输入和输出是不一致的时候，也就是我们常说的人工神经网络。2. 如何计算传播首先我们先构建...

2018-04-21 22:27:36 283

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除