自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 webrtc ns模块代码公式详细解读

总述webrtc的降噪模块主要分为3个部分:模块初始化、噪声分析(analysis)、噪声抑制。模块初始化是在最开始为降噪模块设置参数以及初始化一些状态的值。噪声分析模块,主要进行噪声估计、speech/noise概率计算等。噪声抑制模块则根据前面计算的语音概率和噪声使用维纳滤波来抑制噪声。下面首先对一些相关公式进行介绍,再对整个算法流程进行分析。相关算法公式分析假设麦克风接收到的信号为y(t)y(t)y(t),语音信号为为x(t)x(t)x(t),噪声信号为n(t)n(t)n(t),则y(t)=x(

2021-11-27 21:42:55 2909 2

原创 QZL FFT笔记

FFT笔记在写程序时,发现对FFT相关细节有所遗忘,现回忆并记录下来。以matlab的fft函数为标准,假设数据为x(n),n=1,2,...,512x(n),n=1,2,...,512x(n),n=1,2,...,512,做完FFT后得到X(k),k=1,...512X(k),k=1,...512X(k),k=1,...512,则第一个点X(1)X(1)X(1)为直流分量对应的点,第257个点X(257)X(257)X(257)为频率为Fs/2的分量对应的点。假设x(n)x(n)x(n)为实序列,则

2021-11-25 19:07:11 262

原创 webrtc_ns降噪模块详细解读

webrtc_ns降噪模块详细解读总述webrtc的降噪模块主要分为3个部分:模块初始化、噪声分析(analysis)、噪声抑制。模块初始化是在最开始为降噪模块设置参数以及初始化一些状态的值。噪声分析模块,主要进行噪声估计、speech/noise概率计算等。噪声抑制模块则根据前面计算的语音概率和噪声使用维纳滤波来抑制噪声。下面首先对一些相关公式进行介绍,再对整个算法流程进行分析。(目前只完成了相关词算法分析,代码流程分析待更新。疏忽错误在所难免,如有劳烦指出)相关算法公式分析假设麦克风接收到的信

2021-10-23 16:35:45 2134

原创 Pytorch GRU网络前向传递Python实现

Pytorch GRU网络前向传递/Python实现(可运行)一、背景​ 对于训练好的神经网络网络模型,实际使用时,只需要进行前向传递的计算过程即可,而不需要考虑反向传播过程。对于一些Hybrid模型如rnnoise降噪算法来说,为了将算法落地,需要在一些低功耗设备上进行神经网络的运算,这时候往往需要使用C语言。本文是个人的笔记,将简单介绍如何将GRU网络部署在C语言上。二、Pytorch中的GRU网络信息​ GRU网络的具体原理本文不再赘述,下面看看pytorch中GRU网络的计算过程:rt

2021-10-05 21:20:56 1461 5

原创 RNNoise超详细解析

rnnosise笔记论文阅读​ 原始论文为 Jean-Marc Valin 等发表的A Hybrid DSP/Deep Learning Approach to Real-Time Full-Band Speech Enhancement一文,该文章提出一种将传统信号处理与深度学习结合的语音增强算法。项目地址为:GitHub - xiph/rnnoise: Recurrent neural network for audio noise reduction,下面简单总结一下论文。INTRODUC

2021-08-07 03:03:58 9647 5

原创 基音周期计算(pitch tracking)

基音(Pitch)计算笔记音高(Pitch)定义:基础频率:准周期(quasi-periodic, 指周期几乎确定,但有小幅波动)波的基础频率的倒数,单位为HzPitch(in semitone, 半音):由基础频率经过类对数(log-based)变换得到特点:噪声和非语音没有Pitch音高追踪(Pitch Tracking)定义:即对整段音频求取音高前处理(Pre-processing):滤波(Filtering)激励提取(Excitation extracti

2021-07-18 18:53:01 4925

原创 多通道语音增强笔记

多通道语音增强笔记固定波束形成:利用阵列对特定方向进行波束增强(即目标语音方向),若噪声和目标语音同向,则无显著效果。麦克风接受信号:Ym(ω,θ)=Hm(ω,θ)∗exp(−kωτm(θ))∗S(ω)Y_m(\omega,\theta)=H_m(\omega,\theta)*exp(-k\omega \tau _m(\theta))*S(\omega)Ym​(ω,θ)=Hm​(ω,θ)∗exp(−kωτm​(θ))∗S(ω)HmH_mHm​是麦克风的指向性,τm\tau_mτm​是麦克风时延

2021-05-03 17:23:51 1437

原创 FPGA实现计时器功能(黑金开发平台)

基于黑金开发平台FPGA实现计时器这学期我们开设了DSP实验这门课,主要目的是使用开发平台(本校使用黑金动力社区基于飓风IV的初级产品)进行数字信号处理,当然在课程的开始,熟悉开发板的使用方式以及verilog语言的编写时十分必要的,这写东西都是第一次接触,尤其是verilog语言,这次都是按照老师教的一点点知识来写的,所以代码异常繁杂。当然希望以后的文章中我的Verilog代码能够慢慢进步。...

2019-03-19 22:00:09 5657

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除