在python中检测音频文件是否有语音

我对音频检测不太了解，我今天才开始学习它，遇到了 webrtcvad（这感觉记录不足 :'( ) 和 LibROSA。我要做的任务是给定一个音频文件，（它可以是空的或者它可以有噪音但没有语音），我必须检测它是否包含任何语音。知道我如何开始它吗？任何帮助将不胜感激。提前致谢。

查看完整描述

3 回答

海绵宝宝撒

TA贡献1809条经验获得超8个赞

听起来像是一个笼统的问题。虽然有几种可能的解决方案：

编辑：这里有一些用于处理音频的库

librosa ( https://github.com/librosa/librosa ) - 有很多功能，但文档让初学者很难理解
pydub ( https://github.com/jiaaro/pydub ) - 与 librosa 相比更易于使用，但只有很少的功能，并且与 librosa 不同地表示音频（不易与 librosa 集成）
spleeter ( https://github.com/deezer/spleeter ) - 分离人声和其他乐器

反对回复 2023-02-07

哈士奇WWW

TA贡献1799条经验获得超6个赞

该speechmetrics软件包提供了两种绝对语音质量测量方法，即 MOSNet 和 SRMR。您可以将音频摘录传递给这些包，检查返回的静音/噪音/语音质量并相应地设置阈值。

反对回复 2023-02-07

肥皂起泡泡

TA贡献1829条经验获得超6个赞

这可以通过频率分析来完成吗？如果是这样，取决于您使用的是 mp3 还是 wav，这些是我知道的 2 个选项：

反对回复 2023-02-07

热搜