自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

golfbears的博客

爱生活,艾拉芳

  • 博客(84)
  • 收藏
  • 关注

原创 二阶巴特沃兹滤波器的数字推导

二阶巴特沃兹滤波器

2024-04-09 14:45:35 911

原创 几个好用的audio数字信号处理的开源地址marks(持续更新中)

可以看到主要来自Columbia University Computer Music Center (CMC)的一个邮件list,amazing。这里主要专注音乐相关的数字信号处理算法,非常又启发的一个站点。介绍,SOF项目是针对声音处理的开源固件平台, BSD 3-clause license协议, firmware部分使用者有比较大的自由度。cmsis提供了dsp库可以支持再arm系统快速实现音频的一些功能。安卓用的东西,可靠性还是值得信赖的。是一个c++的库,引用网站的话。

2024-04-01 15:17:32 651

原创 Flac 资料学习笔记

Free Lossless Audio Codec raft-ietf-cellar-flac-14home faq download links documentation changelog developersxiph/flacflac-test-files音频文件格式–Vorbis编解码 Fish Logo and Xiph.org 关于FLAC你所要知道的那些事情FLAC是一套著名的自由音频压缩编码时隔近10年:无损音频编码FLAC终于发布1.4版本

2024-03-02 21:17:45 488

原创 windows下玩anaconda和librosa遇到的一些坑

在conda里安装soundfile应该是不可能的,最后查阅网站,在conda的虚拟环境下,用pip install pysoundfile安装成功,然后再回头安装librosa

2023-09-23 14:04:38 294

原创 经典回声消除算法学习笔记

经典回声消除算法学习笔记时域自适应滤波频域自适应滤波双通判断WEBRTC-AECM学习

2023-03-26 19:51:31 232

原创 了解一下chirp,扫频信号的生成

chirp信号作为测试激励信号,用处很多,搜索了一下也有很多成熟的应用,如matlab和python都能生成,可以从获取示例代码自己来生成chirp。如果深究内在原理,可以参考博文的介绍,但该文生成的是指数级的扫频,其频谱曲线如下图:为此,编写线性生成扫频,结合起来更加方便,贴在下面供需要的参考一下;

2022-12-18 19:50:03 1390 1

原创 ALC AGC DRC-容易混淆的音频前端算法

音频前端距离模拟端最近的数字信号是需要动态改变幅值的,输出端即希望饱满的声音,有担心幅值大引起失真,所以DRC就必不可少,简单的可以用limiter来处理;采集端希望捕获的信号能在最佳表达区间,所以agc就需要了,如果没有真实的模拟gain控制,也可称为alc-自动电平控制(这么解释也很牵强,两者的表达的控制主体不一样,实质是一回事),即对采集的信号进行数字增益控制。

2022-10-18 20:50:21 4069

原创 温故而知新:IIR滤波器设计的方法,幅频计算和参数理解

温习数字信号处理中滤波器设计的点滴

2022-08-21 19:02:45 2344

原创 梳理一下各大平台使用的sample rate convert算法

梳理一下各大平台使用的resample算法

2022-04-10 11:25:37 3200

原创 AMR文件怎么存储的

amr是3gpp开发的语音编码规范,初衷是用在3g语音通信,但没想到3g是如此的昙花一现。

2022-02-09 20:15:06 1534

原创 回顾链表的点点滴滴

回顾链表的点点滴滴基础二级目录三级目录基础链表是比较经典的数据结构,但很多面向过程的软件用的不多,而涉及OS的代码又封装了几层,所以说用的多,但真正有机会去一窥究竟的时候却不是很多。二级目录三级目录...

2022-02-02 18:32:41 871

原创 ubuntu的一些常用软件安装

ubuntu的一些常用软件安装nvdia工具beyondcompareto be updatednvdia工具apt install nvidia-cuda-toolkitapt install nvidia-utils-470他们提供了nvidia-smi和nvcc两个常用的工具beyondcomparewget https://www.scootersoftware.com/bcompare-4.4.1.26165_amd64.debsudo apt updatesudo apt in

2022-01-28 11:26:13 1151

原创 研究一下exp, ln, pow的数值计算

exp, ln, pow的数值计算一级目录二级目录参考一级目录二级目录参考Numerical Approximationshow is log(x) calculated指数函数e^x的快速计算方法DSP Trick: Quick-and-Dirty Logarithms

2021-11-05 16:46:25 2020

原创 高斯-勒让德积分学习

高斯-勒让德积分求解函数积分前言高斯-勒让德积分参考前言梯度和辛普森是经典的几何求积分方法,简单易懂,那如果要更加高档(复杂难懂)的求积分方法找哪家了?高斯-勒让德积分当仁不让。举例来说,下面这个公式看着很高档,但真的要用C来实现还真的有些令人头痛。Ak^=ξk1+ξkexp{12∫vk∞e−ttdt}Rk\begin{aligned}\hat{A_k}&=\frac{{\xi_k}}{1+\xi_k}exp \Big \{ \frac{1}{2}\int_{v_k}^{\infty}\

2021-11-03 15:23:12 6466

原创 C语言积分思想和算法学习

用C语言积分的资料收集C语言积分Trapezoidal RuleSimpson's Rule参考文档C语言积分标准C语言的积分好像很难,至少收集资料前是这么想的,当收集完资料,看到各位前辈的介绍,又重拾信心,梳理记录一下,以备后用吧。翻了翻参考文献,打底利用数值计算的方法都是利用微积分的思维,小图像累加求和来做的。实用的算法分为梯形算法(Trapezoidal Rule)和辛普森算法(Simpson’s Rule),那么区别和性能呢?本文的图形都来自文献IntegrationTrapezoidal

2021-10-29 18:33:19 1035

原创 一窥数字傅里叶变换矩阵

一窥数字傅里叶变换矩阵前言DFT vs IDFT matrics酉矩阵特性矩阵DFT运算矩阵的值长什么样操练总结参考前言DFT技术虽然很神奇,但总觉得是个黑洞,摸不着头脑,今天研究一下DFT matrix,能更加清楚的了解一些内核的东西。DFT vs IDFT matrics这是一个N*N方阵,矩阵的基本元素由W=e−j2π/NW=e^{-j2\pi/N}W=e−j2π/N来构成,每个位置元素aij=W(i−1)∗(j−1)=e−j2π(i−1)(j−1)/Na_{ij}=W^{(i-1)*(j-1

2021-10-28 17:25:34 3789 2

原创 采样率变换和多速率filter

采样率变换和多速率filter一级目录二级目录参考文档一级目录二级目录参考文档1.从“零”开始学习一下DCT2.The Filter Bank Summation (FBS) Interpretation of the Short Time Fourier Transform (STFT) 3.Multirate Filter Banks from CCRMA...

2021-10-26 17:41:53 1151 2

原创 对比IMCRA来研究一下Cohen的TBRR跟踪方法

对比IMCRA来研究一下Cohen的TBRR跟踪方法前言MCRA1vs2-信噪比门限得出的语音存在概率IMCRA vs TBRR-的语音存在概率计算:IMCRA的语音不存在算法TBRR的语音存在概率后记参考文献前言科恩大神的巅峰之作MCRA是菜鸟容易看懂的一个算法,但不妨碍它成为经典噪声跟踪的天花板,他再接再厉提出了Improved版本和TBRR版本的MCRA,罗爱洲也在专著中改进了一版号称MCRA-2。但这么多烟花缭乱的改进本质上改的是啥呢?答案是语音存在概率!MCRA1vs2-信噪比门限得出的

2021-10-21 14:53:27 1842

原创 正交性,从內积开始到施密特正交化

正交性前言內积、长度和正交性[1]內积长度和距离正交向量非正交向量正交集,正交基和正交投影內积空间和格拉姆-施密特正交化参考前言多维空间,向量和矩阵,以及正交性的概念都是欧几里得多维空间的扩展,因为人类的认知很难超越三维思考,所以我们对n维的理解往往降维到2-3维来类比,所以学习和分析这些概念和问题,三维思考是最直观的工具,在你即将迷失在矩阵空间的时候,她会想灯塔一样。。。。內积、长度和正交性[1]这三个概念是基础,然而并不容易搞懂。內积假设u,vu,vu,v是RnR^nRn中的向量:u=[u1

2021-09-30 17:17:30 865

原创 docker 使用pytorch在gpu上训练模型

docker 使用pytorch在gpu上训练模型安装docker下载docker image建立启动容器进入docker虚拟空间不一定能运行起来安装dockersudo apt-get -y install docker.io不是sudo apt-get install docker虽然后者也能安装成功但是无法启动。下载docker image在docker hub上寻找pytorch的image,然后下载sudo docker pull pytorch/pytorch建立启动容器

2021-09-01 16:42:04 1123

原创 顺藤摸瓜一下神级网络DCCRN

顺藤摸瓜一下神级网络DCCRN前言一根藤上5个瓜U-NETCRNDEEP COMPLEX NETWORKSDeep Complex CRNDeep Complex U-Net小结参考文档前言作为井底之蛙,其实一直对业界的动态不是很了解,幸好有老师指点,看了西北工大谢磊教授对他们研究成果的介绍,领略了神经网络在语音增强领域取得的重大进展。这期间最瞩目的莫过于DCCRN在DNS-Challenge竞赛中取得的好成绩,遂求锤得锤的学习一下。一根藤上5个瓜这个神级网络也是吸收了很多优秀的成果,所以研究他之前

2021-08-26 16:15:37 4322

原创 通过实例学习理解HMM建模

通过实例学习理解HMM建模例子1-什么是马尔科夫过程Markov process-马尔科夫过程Observable-State Markov Process-显式马尔科夫过程Hidden-State Markov Process-隐式马尔科夫过程小结例子2-Markov Chains 马尔科夫链ergodic Markov chains-遍历型left–right Markov chains-左右型(因果型)怎么理解HMMHMM的基本元素S-模型中状态的有限集合O-模型输出的观测值符号信合A-状态转移概率矩

2021-08-13 17:29:26 625

原创 FxLMS Filter学习笔记

FxLMS Filter学习笔记前言循序渐进的了解主动降噪主动降噪的核心算法FxLMS Filter参考文档前言当前耳机中的主动降噪技术中,有FxLMS的一席之地,本文根据参考文档整理学习笔记,理解一下主动降噪和FxLMS技术。循序渐进的了解主动降噪在【7】的文章中,贴出了索尼公司耳机为主动降噪设计的双mic结构,下图引用一下:很容易理解为了主动降噪,在耳机的外层利用mic采集环境噪音,作为自适应滤波的参考信号,帮助完成降噪的目的,那为什么在喇叭附近也放置一个mic呢?它的目的是什么?其实如图中

2021-07-28 17:22:46 2669 1

原创 ANC 与 adaptive filter

ANC 与 adaptive filter前言 NC/NS/NR都是降噪二级目录参考文献前言 NC/NS/NR都是降噪cancellation、suppression和reduction都是降低noise的影响,ANC的概念从adaptive noise cancellation变成active noise cancellation,本质上却也都离不开adaptive filter的理论。引用【3】文的框图,典型的LMS自适应滤波如下:图中上半部为典型的anc自适应降噪模型,第二个叫做ALE自适应线

2021-07-26 16:56:05 851

原创 统计模型和贝叶斯方法在对数功率谱域的噪声鲁棒性应用

统计模型和贝叶斯方法在对数功率谱域的噪声鲁棒性应用统计模型和贝叶斯方法贝叶斯估计MAP最大后验概率和ML最大似然估计EM方法估计GMM的参数对数功率谱域的降噪范式参考文档统计模型和贝叶斯方法语音增强的问题是离不开统计模型框架的,即从一组未知参数的观察值,找出未知参数的估计器。这些估计器最具代表的是最大似然ML和最大后验MAP两种方法,MAP被认为是bayesian估计器是没有异议的,但【1】中认为ML属于假设一组未知但确定的参数θ\thetaθ,通过观察值yyy来寻找是p(y;θ)p(y;\theta)

2021-06-29 15:30:17 222

原创 泰勒级数在语音增强中的应用

原来泰勒级数也能被拿来做语音增强扫盲=前言泰勒级数定义泰勒级数扩展多变量泰勒级数多变量矢量函数的泰勒展开应用方向VTS在变换域的鲁棒性应用环境建模参考文档扫盲=前言这些储备知识有的忘记了,有的就没学过,还要从头慢慢来学泰勒级数定义【摘抄百度】泰勒级数是以于1715年发表了泰勒公式的英国数学家布鲁克·泰勒(Sir Brook Taylor)的名字来命名的。通过函数在自变量零点的导数求得的泰勒级数又叫做麦克劳林级数,无限项连加式(级数)来表示一个函数,这些相加的项由函数在某一点的导数求得。说到此其实跟

2021-06-24 16:22:13 330

原创 OMLSA&IMCRA学习笔记

这两个搭配好像这个是经典算法的集大成者。首先回忆一下MMSE-LSA的经典公式如下Ak^=ξk1+ξkexp{12∫vk∞e−ttdt}Rk\begin{aligned}\hat{A_k}&=\frac{{\xi_k}}{1+\xi_k}exp \Big \{ \frac{1}{2}\int_{v_k}^{\infty}\frac{e^{-t}}{t} {\rm d}t\Big \}R_k\end{aligned}Ak​^​​=1+ξk​ξk​​exp{21​∫vk​∞​te−t​dt}

2021-06-10 10:36:19 2242 2

原创 常用又容易遗忘的指令备忘录

常用又容易遗忘的指令备忘录linux命令和相关应用增加用户文件权限chmod +x filename -Rchown owner filename -Rchgrp owner filename -Rlinux给用户添加sudo权限linux 给用户添加用户组目录查询递归统计当前目录下文件夹的个数递归统计当前目录下文件的个数文件和磁盘显示磁盘分区上可以使用的磁盘空间显示指定的目录或文件所占用的磁盘空间free 可以显示Linux系统中空闲的、已用的物理内存及swap内存,及被内核使用的buffer显示像硬盘这

2021-04-29 14:24:09 184 1

原创 阅读理解:Yariv.E的MMSE方法

阅读理解:Yariv.E的MMSE方法致敬Yariv.Ephraim,重温MMSE都是MMSE,Yariv的和Wiener的有何不同MMSE-Minimum Mean-square ErrorMMSE-STSA EstimatorMMSE-LSA Estimator参考文献致敬Yariv.Ephraim,重温MMSEYariv.Ephraim翻译成中文应该叫亚力夫.伊弗雷姆,毕业于海法的以色列工业大学,博士论文的核心就是MMSE,即谱减法、维纳滤波的基础上,为频域降噪算法奠定了另一个发展领域,翻越他的研

2021-04-27 18:05:01 414

原创 除了信噪比SNR,还有哪些指标评价降噪语音的水平

除了信噪比SNR,还有哪些指标评价降噪语音的水平主观subjective和客观objectiveMOS:Mean Opinion ScoreCSIG: MOS predictor of speech distortion,CBAK: MOS predictor of intrusiveness of background noiseCOVL: MOS predictor of overall processed speech quality.ITU-T RecommendationsPESQ : Perce

2021-04-19 17:13:16 7206

原创 从MIXMAX概率模型理解Bayesian建模方法

MIXMAX 概率模型理解储备知识HMM-隐马尔可夫模型(Hidden Markov Model)GMM-混合高斯模型多元高斯分布(The Multivariate normal distribution)多元高斯还是混合高斯Bayesian概率模型储备知识HMM-隐马尔可夫模型(Hidden Markov Model)HMM建模时需要目标有这两个特征:基于序列的,比如时间序列,或者状态序列。有两类数据,一类序列数据是可以观测到的,即观测序列;而另一类数据是不能观察到的,即隐藏状态序列,简称状态

2021-04-14 14:49:07 314

原创 频域噪声模型估计的话音增强方法

传统的噪声谱密度估计理论并没有随着神经网络的出现而衰退,因为经典的算法模型大大降低了运算速度,而将比较难搞的(估算)参数交给神经网络后,模型实现起来更简单实惠,所以有必要对此做一个回顾学习。

2021-04-07 17:34:34 912 1

原创 利用LateX让拉丁字母和希腊字母变成数学符号

现代数学(物理化学生物学等)方法离不开拉丁(罗马)字母和希腊字母。但是拉丁字母(英文)只有26个,希腊字母只有24个,远远不够用,所以数学家们发明了各种字母的变种(X战警字母)来表达他们与众不同的领域,我上大学那会儿互联网不是很发达,各位数学老师的手写体真的是眼花缭乱,而今白LateX工具所赐,可以回顾一下这些变种字母是怎么被数学家玩坏的了。也为了以后遇到数学字母到这里来查询对照,省的一时雾水。

2021-03-26 18:32:16 4458

原创 阵列信号处理笔记-波达方向DOA-子空间方法

阵列信号处理-波达方向DOA前言MUSIC和ESPRIT三级目录参考文献前言波达方向-Direction Of Arrival是研究波束形成的重要课题,引用之前的老图,DOA要估算出来的就是两个角度:俯仰角φ\varphiφ和方位角θ\thetaθ,而如果是全向麦克风组成的线性阵列(z轴),那么方位角就可以省略了,只研究俯仰角就可以了,所以很多算法简化假设条件,然而实际中无法省略,不过可以通过阵列的摆放,设计的估算角度范围小一些,算法也会容易一些。经典的DOA估算方法有波束形成测向方法(base),

2021-03-19 10:26:40 5241 1

原创 FSL小样本学习few-shot learning知识点整理

虽然deeplearning在语音视频和语言处理上有了革命性的进步,数据增强和正则化技术也是的小数据样本的过拟合问题得到了改善,但是距离大数据大模型的差距还是存在的。本文结合《Matching Networks for One Shot Learning》,《Domain-Adaptive Few-Shot Learning》和《Prototypical Networks for Few-shot Learning》三篇论文的内容,梳理一下few shot learning的一些知识点,试图探究一下提高小样

2021-02-02 18:20:42 2225

原创 从“零”开始学习一下DCT

“汝果欲学诗,工夫在诗外”,这两句诗来形容对DCT的学习最贴切不过了,应为这个技术从DTFT技术衍生出来,具体实现又大量借鉴了FFT的蝶形运算,所以想搞懂DCT,先要拾起久违的傅里叶频率分析理论。

2021-01-18 19:33:55 666

原创 从__init__()到__init__.py 让你的python代码看起来像个程序猿写的

python好用,容错性好,可读性也不错。用起来信手拈来,天马行空。而且各种支持库你有你想不到,没有它做不到。但是自己洗的python代码往往就是一段脚本,代码片段。虽然功能上没有任何问题,但是扩展性、整洁性以及比格都很成问题,如果想走捷径,只需在你的代码中增加一些方法,立竿见影。

2020-11-17 16:25:22 208

原创 总是傻傻分不清,是时候总结一下numpy,tensorflow,keras的乘除法了

乘除法好理解,但是一维向量,二维矩阵,三维+张量的乘除法就不一定能招架了,为了以后碰到类似问题不抓狂,本文总结罗列一下numpy,tensorflow,keras几种工具对各种乘除法的定义和api。

2020-11-16 17:23:14 1331

原创 TripletsLoss不是解决距离的银色子弹,而是打开度量学习的大门钥匙

在deeplearning时代,姑且肤浅的将表征学习理解成变成向量后的度量学习吧。就解决问题的角度而言,表征学习是建模,抽象到异次元,度量学习是把异次元的东西再量化到三维空间,用“横看成岭侧成峰”来比喻他们作为解决问题(庐山)的两个方面(岭峰)再合适不过了。而用“远近高低各不同”来理解度量学习中各种loss策略,好像也很形象,看来苏轼真的很懂机器学习啊。

2020-11-06 18:26:58 1906 1

原创 高维向量的相似度判定-距离产生了,美还在吗

“海内存知己,天涯若比邻”,古人用心理距离辨证了时空距离,机器学习何尝不是,看似毫不相关或者毫无头绪的分类问题,由于采用了合适的数学距离,就将它们在高维度空间分开了,展现在三维空间里,很多神奇的事情令人难以置信。现实中,我们做神经网络分类或者编码时,loss函数往往需要根据‘distance’来设计,这些distance理解起来是比较烧脑的,下面这个笔记整理些常用的距离,系统的分析一下这些距离的前世今生,看看哪些距离美到令人窒息,还有哪些距离令人痛苦的不能自拔?

2020-10-27 19:10:21 4964 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除