自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

marvin-nj

专注

  • 博客(51)
  • 收藏
  • 关注

原创 jason格式生成

想要生成如下格式jason文件:{ "query": { "bool": { "should": [ {"term": { "staticUrl.keyword": "/text2video/videos/sanguo-jilu/sanguo-01/0.mp4" }}, {"term": { "staticUrl.keyword": "/text2video/videos/sanguo-ji...

2021-05-07 19:59:35 325

原创 vs2019下DLL的创建及使用注意事项

创建过程不多讲,这里主要关注一些实际应用问题:代码应该同时考虑32和64位平台兼容情况,数据类型需要区分清楚。 交付使用时,应当将dll从CRT中剥离出来,或者拷贝对应的MSVCRTD.LIB,如:MSVCR80.DLL----> vs2005, MSVCR90.DLL---->vs2008, MSVCR100.DLL---->vs2010 在项目->属性-&g...

2020-03-04 17:03:03 2435

原创 论文笔记

1. A time delay neural network architecture for efficient modeling of long temporal contexts 2015,interspeech提出使用TDNN做ASR,与DNN作对比, 提出sub-sample的方法,这里的sub-sample特指对TDNN网络中间层的subsample,减少5倍的计算量,也缩减...

2019-09-11 11:45:29 642

原创 音频降噪工具整理

以下是几种主流降噪算法的效果对比图: 从上到下,分别是源音频–speex–webRTC–盲源分离–RNN 后面有时间再一一更新算法细节…

2019-06-15 13:15:43 21246 1

原创 信号处理资料收藏

FFT的实现,包括非2次幂基:Free small FFT in multiple languages

2019-05-31 10:15:07 147

转载 vim个性化设置

对齐::1,3 left 5gg=G.vimrc配置:filetype plugin indent on 开启vim的文件类型自动检测功能,这样编写代码换行时就会自动换行对齐等效于set autoindent + set smartindent去掉讨厌的有关vi一致性模式,避免以前版本的一些bug和局限set nocompatible“显示行号set ...

2019-03-28 10:04:10 417

原创 shell命令记录

1、ulimit 查看资源大小限制(如core、stack、pipe等)     ulimit  -a2、sysctl  内核运行时参数配置   如修改core文件生成路径名称:       sysctl -w kernel.core_pattern=/corefile/core-%e-%p-%t   将core文件统一生成到/corefile目录下,产生的文件名为core-命令名-...

2018-09-27 11:34:25 422

转载 多进程与多线程编程

https://www.jianshu.com/p/c1015f5ffa74多进程及进程间通信https://www.cnblogs.com/fuyunbiyi/p/3475602.html多线程及线程同步

2018-08-17 17:52:11 351

转载 socket应用实例之RTP音频流传输

套接字的特性由3个属性确定,它们分别是:域、端口号、协议类型。(1)套接字的域它指定套接字通信中使用的网络介质,最常见的套接字域有两种:一是AF_INET,它指的是Internet网络。当客户使用套接字进行跨网络的连接时,它就需要用到服务器计算机的IP地址和端口来指定一台联网机器上的某个特定服务,所以在使用socket作为通信的终点,服务器应用程序必须在开始通信之前绑定一个端口,服务器在指定...

2018-08-16 17:39:56 10376 3

转载 进程通信(消息队列、管道通信)

推荐一篇介绍进程通信的概论:(https://www.jianshu.com/p/c1015f5ffa74)消息队列是存放在内核中的消息链表,每个消息队列由消息队列标识符表示。对于系统中的每个消息队列,内核维护一个定义在#include <stdio.h> #include <st

2018-08-16 11:02:44 317

原创 有趣的开源

1、 SoundTouch 是一个开源的音频处理库,用于改变音频流或音频文件的节奏、音调和播放速率。 通过调节Tempo、Pitch和Playback Rate可以实现类似Tom猫的变声效果,对于这三个参数官方的解释如下: Tempo(时间段):在不影响声音音调的前提下改变音频播放的快、慢节奏。 Pitch(关键指标):在保持原有节奏(速度)的前提下改变音调。 Playback Rate...

2018-05-05 20:49:21 457

转载 python2 与python3 unicode与decode

unicode()与decode():https://blog.csdn.net/m0_38080253/article/details/78841280python2与python3区别https://www.cnblogs.com/meng-wei-zhi/articles/8194801.html

2018-04-27 14:40:22 792

原创 python 爬取电影名、电视名、或人民

关于爬虫的一个入门博客: http://blog.sina.com.cn/s/blog_63cf1c510101dshu.html BeautifulSoup的使用: http://wiki.jikexueyuan.com/project/python-crawler-guide/beautiful-soup.html https://www.c...

2018-04-20 14:35:42 1383

转载 实体识别之NLTK

https://blog.csdn.net/kobebryantlin0/article/details/54880933 pip的安装 https://blog.csdn.net/babydx/article/details/77836810 NLTK安装 https://blog.csdn.net/zzulp/article/details/77150129 NLTK介绍...

2018-04-19 18:57:41 934

原创 数据清洗----python

#!usr/bin/python# -*- coding: UTF-8 -*-from __future__ import unicode_literalsimport reimport sysnums = ['零', '壹', '贰', '叁', '肆', '伍', '陆', '柒', '捌', '玖']decimal_label = ['角', '分']small_int_la...

2018-04-19 15:18:17 340

转载 Levenshtein距离 -----字符串编辑距离

编辑距离,又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。动态规划公式如下: if i == 0 且 j == 0,edit(i, j) = 0 if i == 0 且 j > 0,edit(...

2018-04-19 14:47:24 185

原创 kaldi学习资料

Dan povey 主页,有kaldi的详细入门文档,以及相关的论文 kaldi官网 kaldi—github系统搭建过程及生成文件解释: http://blog.sina.com.cn/s/blog_444061c70101hx7l.html 单音素训练: https://blog.csdn.net/u010731824/article/detail...

2018-04-17 16:59:47 950 2

转载 压缩与解压

https://www.cnblogs.com/zhenghaonihao/p/6100657.html Linux下最常用的打包程序就是tar了,使用tar程序打出来的包我们常称为tar包,tar包文件的命令通常都是以.tar结尾的。生成tar包后,就可以用其它的程序来进 行压缩了,所以首先就来讲讲tar命令的基本用法:   tar命令的选项有很多(用man tar可以查看到),但常...

2018-03-30 16:57:35 187

原创 语音识别MFCC 一阶差分与二阶的含义

我们都知道MFCC很好的表达了语音的特征,但只是静态的特征。提取动态特征,一般都采用一阶二阶差分,但一阶二阶差分究竟表示什么,什么含义:一阶差分就是离散函数中连续相邻两项之差;定义X(k),则Y(k)=X(k+1)-X(k)就是此函数的一阶差分,物理意义就是当前语音帧与前一帧之间的关系, 体现帧与帧(相邻两帧)之间的联系;在一阶差分的基础上,Z(k)=Y(k+1)-Y(k)=X(k+2)-...

2018-03-09 15:02:34 17291 1

转载 secureCRT 颜色配置

这里写链接内容

2018-03-09 11:25:46 178

原创 shell 特殊符号

1,重定向:在Linux里经常使用,意思是将数据流重新定向。 标准输出重定向 >或1>:把流向标准输出的数据重新定位到后边的文件中,文件原本内容被丢弃 标准输出追加重定向 >> 或1>> :把流向标准输出的数据重新定位到后边的文件结尾处,在其尾部添加数据。文件原本内容不会被丢弃 标准输入重定向 <或<0 :把源数据流从标准输入重定向到其它文件...

2018-03-08 10:53:24 556

转载 linux软件安装

一、 解析Linux应用软件安装包:     通常Linux应用软件的安装包有三种:     1) tar包,如software-1.2.3-1.tar.gz。它是使用UNIX系统的打包工具tar打包的。     2) rpm包,如software-1.2.3-1.i386.rpm。它是Redhat Linux提供的一种包封装格式。     3) dpkg包,如software-1.2.3...

2018-02-28 14:23:38 234

原创 基于python简单socket实现

服务端:#!/usr/bin/pythonimport socketfrom time import ctimes=socket.socket() #默认AF_INET,SOCK_STREAMadd=('',5050) # ''为空表示可以使用任何地址s.bind(add)s.listen(5) #大于1即可,一般取5print "start service proc...

2018-02-26 15:10:43 423

原创 IP地址分类

IP被分为5大类: A的范围1.0.0.0~126.255.255.555 大型网络 B的范围128.1.0.0~191.254.255.255 中等规模网络 C的范围192.0.1.0~233.255.254.0 小型局域网 D类:224.0.0.0~239.255.255.255 用于广播 E类:240.0.0.0~255.255.255.255 (其中25...

2018-02-26 09:38:50 490

原创 语音识别之特征参数提取(一)

语音识别对特征参数有如下要求:1.能将语音信号转换为计算机能够处理的语音特征向量2.能够符合或类似人耳的听觉感知特性3.在一定程度上能够增强语音信号、抑制非语音信号常用特征提取方法有如下几种:(1)线性预测分析(LinearPredictionCoefficients,LPC) 拟人类的发声原理,通过分析声道短管级联的模型得到的。假设系统的传递函数跟全极点的数字...

2018-01-05 10:58:01 33874 4

原创 次声波的前生今世

次声波又称亚声波,它是一种频率低于人的可听声波频率范围的声波。次声波的频率范围大致为0-20Hz。  次声波产生的声源是相当广泛的,现在人们已经知道的次声源有:火山爆发、坠入大气层中的流星、极光、地震、海啸、台风、雷暴、龙卷风、电离层扰动,等等。利用人工的方法也能产生次声波,例如核爆炸、火箭发射、化学爆炸,等等。  由于次声波的频率很低,因而它显示出了种种奇特的

2018-01-04 15:38:01 2097

转载 声学原理及MFCC分析

频谱、倒谱与mel频率分析。CMU   kishore prahallad教授关于同态信号处理与MFCC的分析。中文翻译版MFCC具体求解步骤分析,与fbank(MFSC)的比较

2018-01-04 14:32:42 1815

转载 极大似然估计 EM算法

极大似然估计,是一种概率论在统计学的应用,它是参数估计的方法之一(MPA,贝叶斯估计)。已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是想通过若干次试验,观察其结果,利用结果推出参数的大概值。最大似然估计也是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值。说的更直白一点就是已知结果求...

2017-12-18 16:23:12 1036

原创 Vad for Detection

在常规端点检测函数部分做如下修改:void CMyWaveView::NormalvadDefault() { CMyWaveDoc* pDoc = GetDocument(); ASSERT_VALID(pDoc); if (!pDoc) return; OnPower();//修改一:预加重,加汉明窗 在methods类里 OnZero(); m_

2017-06-21 14:22:36 559

原创 ++符号优先级

C语言int a=1,b=1;b=a+++b;求bC++中,后置++的优先级高于前置++,所以b=(a++)+b=2

2016-09-13 18:41:26 390

原创 PHP+mysql链接

//生成一个连接 $db_connect=mysql_connect($dbhost,$username,$userpass) or die("Unable to connect to the MySQL!"); //选择一个需要操作的数据库 mysql_select_db($dbdatabase,$db_connect); //执行MySQL语句 $result=mysql

2016-09-12 14:14:43 176

原创 strcmp源码

/****strcmp - compare two strings, returning less than, equal to, or greater than**Purpose:* STRCMP compares two strings and returns an integer* to indicate whether the first is less

2016-08-11 11:12:03 398

原创 数组名总结

1、数组名作为参数时,退化未指针,不具有sizeof()属性:2、数组名是常量指针,不可以被修改(指针本身不可以被修改,指向的值可以改变):char a [20];a="abcd";//错误,试图使常量指针改变char a[20]="abcd";//通过,可以直接初始化

2016-08-02 11:50:43 271

原创 几种强制转换

1.reinterpret_cast::转换一个指针为其它类型的指针,一个指针到另一个指针的值的二进制拷贝,不做类型检查。2.const_cast:用于类型转换掉表达式的const或volatile属性。3. static_cast:在功能上基本上与C风格的类型转换一样,基本得转换方式。4. dynamic_cast:它被用于安全地沿着类的继承关系向下进行类型转换,多态情况下常用,进行转换后的类型...

2016-07-22 21:51:53 329

原创 static,const关键字作用

static关键词作用:1、作用域隐藏。当一个工程有多个文件的时候,用static修饰的函数或变量只能够在本文件中可见,文件外不可见。2、全局生命周期。用static修饰的变量或函数生命周期是全局的。被static修饰的变量存储在静态数据区。3、static修饰的变量默认初始化为0.4、static修饰的变量或函数是属于类的,所有对象只有一份拷贝。因此,不能够将静态函数设置为虚函数。1:定义con...

2016-07-22 21:16:32 404

原创 define,const与inlin

1>  define与const1.编译器处理阶段不同:define宏在编译预处理阶段展开, const常量在编译阶段使用2.类型安全检查不同defined宏没有类型,不做类型检查,只做简单的展开const常量有类型,在编译阶段会执行类型检查3.存储方式不同define定义的常量在替换后运行过程中会不断地占用内存,在内存中有若干份copy,而const定义的常量存储在数据段,只有一份copy...

2016-07-22 20:47:27 232

转载 内存字节对齐

定义一个结构体的一般形式为:struct 结构体名{//类型说明符 成员名;};例如有如下结构体:struct Stu{int id;char sex;float hight;};那么一个这样的结构体变量占多大内存呢?也就是cout在了解字节对齐方式之前想当然的会以为:sizeof(Stu) = sizeof(int)+siz

2016-07-22 16:44:31 222

转载 定义一个只能在堆上(栈上)生成对象的类

    在C++中,类的对象建立分为两种,一种是静态建立,如A a;另一种是动态建立,如A* ptr=new A;这两种方式是有区别的。静态建立一个类对象,是由编译器为对象在栈空间中分配内存,是通过直接移动栈顶指针,挪出适当的空间,然后在这片内存空间上调用构造函数形成一个栈对象。使用这种方法,直接调用类的构造函数。    动态建立类对象,是使用new运算符将对象建立在堆空间中。这个过程分为两步,第...

2016-07-22 16:18:25 309

转载 25匹马的角逐

    问题是这样的:一共有25匹马,有一个赛场,赛场有5个赛道,就是说最多同时可以有5匹马一起比赛。假设每匹马都跑的很稳定,不用任何其他工具,只通过马与马之间的比赛,试问最少 得比多少场才能知道跑得最快的5匹马。    注意: "假设每匹马都跑的很稳定" 的意思是在上一场比赛中A马比B马快,则下一场比赛中A马依然比B马快。(1) 首先将25匹马分成5组,并分别进行5场比赛之后得到的名次排列如下:...

2016-07-21 15:21:58 233

原创 关于eof的烦恼

int main(){ ofstream f2("c:\\read.txt"); if(f2.good()) { f2.write("abcd",5); } f2.close(); char ch; //f.seekg(ios::beg); ifstream f1("c:\\read.txt"); while(!f1.eof()) { f1>>ch;

2016-07-20 09:45:30 446

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除