MoussaTintin-CSDN博客

原创语音 AI 技术简介

语音 AI 技术（e.g. 语音识别、语音合成）是人工智能重要的研究和应用方向。但是，不同于 CV、NLP 等“显学”，语音相关的从业人员（学界和业界）相对较少，语音领域的学术会议和期刊影响力也比较有限。比如语音顶级会议 ICASSP 也仅是 CCF-B 类，InterSpeech 更是被划在 C 类；并且两个会议接近 50% 的文章接收率也经常为人诟病。语音 AI 是一个多学科交叉的技术方向，涉及到信号处理、语言学、语音学（e.g. 发音规律）、心理学（e.g. 听觉感知）、传统机器学习以及深度学习等。

2021-07-18 14:38:03 4328 1

丁丁的博客

原创语音 AI 技术简介

原创【Learning Notes】Sequence Transducer

原创【Learning Notes】PLDA（Probabilistic Linear Discriminant Analysis）

原创基于 python 的语音识别 API 调用

原创 A Note on Kaldi's PLDA Implementation

原创【Learning Notes】线性链条件随机场（CRF）原理及实现

原创【Learning Notes】CTC 原理及实现

原创【Learning Notes】KMeans GMM 模型及 EM 训练

原创【Learning Notes】Gumbel 分布及应用浅析

原创基于 NVRTC 和 CUPY 的 Python CUDA 扩展

原创【Learning Notes】Quasi-recurrent Neural Networks

翻译语音应用开发中的 11 个常见错误

原创 AMD ROCm 平台简介

原创【Learning Notes】基于 boosting 原理训练深层残差神经网络

原创 keras CNTK 后端

原创 pytorch 学习笔记之编写 C 扩展

原创 pytorch 学习笔记之自定义 Module

原创智能音箱技术概览

原创【Learning Notes】生成式对抗网络（Generative Adversarial Networks，GAN）

原创【Learning Notes】变分自编码器（Variational Auto-Encoder，VAE）

原创模型压缩之 BinaryNet

原创基于表达式模版（expression template）的惰性求值（lazy evaluation）

原创神经网络端到端序列学习（一）

原创【Learning Notes】作为 Ensemble 模型的 Residual Network

原创为 OpenCL 提供支模版支持

原创静态集成 OpenCL 的 Kernel 源代码到可执行文件

原创 Matlab数据可视化（5）：二维数据可视化 I

原创 Matlab数据可视化（4）：一维数据绘图 II

原创 Matlab数据可视化（3）：一维数据绘图 I

原创 Matlab数据可视化（2）：基础篇 II

原创 Matlab数据可视化（1）：基础篇 I

原创随机数生成（一）：均匀分布

翻译 Halide：简化图像编程

原创 Intel 超线程技术（Hyper-Threading Technology）

翻译 HPC：大规模是祝福还是诅咒？

空空如也

空空如也