为了账号安全,请及时绑定邮箱和手机立即绑定

在python中检测音频文件是否有语音

在python中检测音频文件是否有语音

守着一只汪 2023-02-07 14:42:50
我对音频检测不太了解,我今天才开始学习它,遇到了 webrtcvad(这感觉记录不足 :'( ) 和 LibROSA。我要做的任务是给定一个音频文件,(它可以是空的或者它可以有噪音但没有语音),我必须检测它是否包含任何语音。知道我如何开始它吗?任何帮助将不胜感激。提前致谢。
查看完整描述

3 回答

?
海绵宝宝撒

TA贡献1809条经验 获得超8个赞

听起来像是一个笼统的问题。虽然有几种可能的解决方案:

  1. 将其传递给语音以进行文本识别。如果你有文字,就会有语音。

  2. 在更多的音频分析方法中,使用仅检查人声范围的频率滤波器。

编辑:这里有一些用于处理音频的库

  1. librosa ( https://github.com/librosa/librosa ) - 有很多功能,但文档让初学者很难理解

  2. pydub ( https://github.com/jiaaro/pydub ) - 与 librosa 相比更易于使用,但只有很少的功能,并且与 librosa 不同地表示音频(不易与 librosa 集成)

  3. spleeter ( https://github.com/deezer/spleeter ) - 分离人声和其他乐器


查看完整回答
反对 回复 2023-02-07
?
哈士奇WWW

TA贡献1799条经验 获得超6个赞

speechmetrics软件包提供了两种绝对语音质量测量方法,即 MOSNet 和 SRMR。您可以将音频摘录传递给这些包,检查返回的静音/噪音/语音质量并相应地设置阈值。



查看完整回答
反对 回复 2023-02-07
?
肥皂起泡泡

TA贡献1829条经验 获得超6个赞

这可以通过频率分析来完成吗?如果是这样,取决于您使用的是 mp3 还是 wav,这些是我知道的 2 个选项:



查看完整回答
反对 回复 2023-02-07
  • 3 回答
  • 0 关注
  • 423 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信