有什么方法可以通过算法确定.wav或.mp3文件的音频质量?基本上,我的用户使用了多种录音设置(即,他们来自世界各地,我无法控制它们)将音频录音到mp3 / wav文件中。在这一点上,软件应确定其设置是否正确(可悲的是,由于某些原因,他们不能仅通过听自己的录音来做出确定,因此,有时由于以下原因,我们基本上无法理解录音:低音量或高噪音)。我正在做一个音量检查,以确保麦克风的音量还可以。不幸的是,这错过了体积大但清晰度低的情况。我想知道是否可以进行某种标准扫描(最好在Python中),以检测何时存在大量背景噪音。我意识到一种可能的解决方案是让他们录制完全静音,然后与语音录音进行比较,如果“静音”录音的音量与语音录音的音量太接近,则认为音频“不良”。但这取决于两次都从演讲者那里获得好的样本,这可能是我可能依赖的,也可能不是。因此,我想知道是否只有一种方法可以扫描音频文件(大约10秒钟长),并识别声音文件是否“嘈杂”或清晰。
3 回答

HUX布斯
TA贡献1876条经验 获得超6个赞
这完全取决于您的质量问题,问题尚不完全清楚,但这里有一些建议:
在音量高而清晰度低的情况下,我猜问题是用户输入增益过高。录制后,您可以简单地检查是否失真。更好的是,您可以在录制过程中使用自动增益控制(AGC)来防止这种情况的发生。
如果噪音太大,我假设问题是扬声器离麦克太远了。在这种情况下,史蒂夫(Steve)的建议可能有用,但要使其真正起作用,您需要做大量工作来比较样本记录和开发统计数据,以了解如何进行区分。在实践中,我认为这是太多的工作。我认为一个更简单且更可行的替代方法(尽管不一定保证)将是创建信号的包络,然后从中创建直方图,并查看直方图与现有的好坏录音之间的比较。如果我们仅谈论语音,则可以将信号分为三个频段(使用时域滤波器,
再次,尽管如此,我将使用AGC在录制过程中进行录音,如果AGC发现需要将输入增益设置得过高,则可能是不好的录音。

狐的传说
TA贡献1804条经验 获得超3个赞
不完全是我的专业领域,但我怀疑如果您获得了频谱(可能进行了傅立叶变换),并比较了“好”和“有噪声”的录音,您会发现噪声对交叉频谱的影响更大,而坏频谱的影响更大。录音比好。看一下SciPy中的信号处理部分-这可能会有所帮助。
添加回答
举报
0/150
提交
取消