我正在尝试对一些音频剪辑进行分类,为此,我必须将每 30 秒长的音频剪辑分成 1 秒的剪辑。然后我想将这个 1 秒音频片段放入分类器中,并对所有 30 个一秒音频文件的输出进行平均以获得最终响应。我想要每 30 个输入有 1 个输出。我的问题是我不知道如何将它们输入到我的分类器中,我无法按照此处的建议使用多个输入,因为我有 30 个输入,而不仅仅是 2 个输入,这会很混乱。
1 回答
三国纷争
TA贡献1804条经验 获得超7个赞
您提到的链接是关于拥有 2 个独立的输入管道,而不是 2 个输入音频剪辑。您需要将30 个一秒音频数据包装在一个Tensor
(如果您使用的是 Tensorflow,如果没有,则使用您正在使用的框架的等效框架)
然后可以将其Tensor
输入到深度学习模型的一个输入管道中。
添加回答
举报
0/150
提交
取消