我对音频检测不太了解,我今天才开始学习它,遇到了 webrtcvad(这感觉记录不足 :'( ) 和 LibROSA。我要做的任务是给定一个音频文件,(它可以是空的或者它可以有噪音但没有语音),我必须检测它是否包含任何语音。知道我如何开始它吗?任何帮助将不胜感激。提前致谢。
3 回答
海绵宝宝撒
TA贡献1809条经验 获得超8个赞
听起来像是一个笼统的问题。虽然有几种可能的解决方案:
将其传递给语音以进行文本识别。如果你有文字,就会有语音。
在更多的音频分析方法中,使用仅检查人声范围的频率滤波器。
编辑:这里有一些用于处理音频的库
librosa ( https://github.com/librosa/librosa ) - 有很多功能,但文档让初学者很难理解
pydub ( https://github.com/jiaaro/pydub ) - 与 librosa 相比更易于使用,但只有很少的功能,并且与 librosa 不同地表示音频(不易与 librosa 集成)
spleeter ( https://github.com/deezer/spleeter ) - 分离人声和其他乐器
哈士奇WWW
TA贡献1799条经验 获得超6个赞
添加回答
举报
0/150
提交
取消