fmstereo-CSDN博客

原创 ffmpeg处理语音的常用命令行

把语音处理为16K采样率的16bit PCM编码的Wav常用命令行，用于语音处理 Mp3处理为Wav ffmpeg -i "xxx.mp3" -f wav -ar 16000 -ac 1 "yyy.wav" Mp4处理为Wav ffmpeg -i "xxx.mp4" -f wav -ar 16000 -ac 1 -vn "yyy.wav" -ar 指定

2017-08-09 09:35:21 2021

原创百度语音API的Python语音识别实践

百度语音对上传的语音要求目前必须是单声道，16K采样率，采样深度可以是16位或者8位的PCM编码。其他编码输出的语音识别不出来。语音的处理技巧：录制为MP3的语音（通常采样率为44100），要分两步才能正确处理。第一步：使用诸如GoldWave的软件，先保存为16K采样率的MP3；第二步，打开16K采样率的MP3，另存为Wav格式，参数选择PCM，单声道即可。另外，也可以使用ffm

2017-08-08 09:25:48 5916

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 ffmpeg处理语音的常用命令行

原创 百度语音API的Python语音识别实践

空空如也

空空如也

原创百度语音API的Python语音识别实践