为了账号安全,请及时绑定邮箱和手机立即绑定

确定录音的音质?

确定录音的音质?

翻阅古今 2021-03-29 19:15:02
有什么方法可以通过算法确定.wav或.mp3文件的音频质量?基本上,我的用户使用了多种录音设置(即,他们来自世界各地,我无法控制它们)将音频录音到mp3 / wav文件中。在这一点上,软件应确定其设置是否正确(可悲的是,由于某些原因,他们不能仅通过听自己的录音来做出确定,因此,有时由于以下原因,我们基本上无法理解录音:低音量或高噪音)。我正在做一个音量检查,以确保麦克风的音量还可以。不幸的是,这错过了体积大但清晰度低的情况。我想知道是否可以进行某种标准扫描(最好在Python中),以检测何时存在大量背景噪音。我意识到一种可能的解决方案是让他们录制完全静音,然后与语音录音进行比较,如果“静音”录音的音量与语音录音的音量太接近,则认为音频“不良”。但这取决于两次都从演讲者那里获得好的样本,这可能是我可能依赖的,也可能不是。因此,我想知道是否只有一种方法可以扫描音频文件(大约10秒钟长),并识别声音文件是否“嘈杂”或清晰。
查看完整描述

3 回答

?
HUX布斯

TA贡献1876条经验 获得超6个赞

这完全取决于您的质量问题,问题尚不完全清楚,但这里有一些建议:

在音量高而清晰度低的情况下,我猜问题是用户输入增益过高。录制后,您可以简单地检查是否失真。更好的是,您可以在录制过程中使用自动增益控制(AGC)来防止这种情况的发生。

如果噪音太大,我假设问题是扬声器离麦克太远了。在这种情况下,史蒂夫(Steve)的建议可能有用,但要使其真正起作用,您需要做大量工作来比较样本记录和开发统计数据,以了解如何进行区分。在实践中,我认为这是太多的工作。我认为一个更简单且更可行的替代方法(尽管不一定保证)将是创建信号的包络,然后从中创建直方图,并查看直方图与现有的好坏录音之间的比较。如果我们仅谈论语音,则可以将信号分为三个频段(使用时域滤波器,

再次,尽管如此,我将使用AGC在录制过程中进行录音,如果AGC发现需要将输入增益设置得过高,则可能是不好的录音。


查看完整回答
反对 回复 2021-04-06
?
狐的传说

TA贡献1804条经验 获得超3个赞

不完全是我的专业领域,但我怀疑如果您获得了频谱(可能进行了傅立叶变换),并比较了“好”和“有噪声”的录音,您会发现噪声对交叉频谱的影响更大,而坏频谱的影响更大。录音比好。看一下SciPy中的信号处理部分-这可能会有所帮助。


查看完整回答
反对 回复 2021-04-06
  • 3 回答
  • 0 关注
  • 178 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号