我想知道测试集的结果是否用于优化模型的权重。我正在尝试制作一个模型,但我遇到的问题是我没有很多数据,因为他们是医学研究患者。在我的情况下,患者数量有限(61),每个患者有 5 个特征向量。我尝试的是通过排除一个主题来创建一个深度学习模型,并使用排除主题作为测试集。我的问题是主题特征存在很大差异,我的模型非常适合训练集(60 个主题),但不适用于 1 个排除的主题。所以我想知道测试集(在我的情况下是排除的主题)是否可以以某种方式使用来使模型收敛以更好地对排除的主题进行分类?
2 回答
猛跑小猪
TA贡献1858条经验 获得超8个赞
您不应在训练过程中使用数据集的测试数据。如果你的训练数据不够,那么在这几天(尤其是医学图像)使用很多的一种方法是数据增强。所以我强烈建议你在训练过程中使用这种技术。如何在数据有限时使用深度学习 是关于数据增强的好教程之一。
12345678_0001
TA贡献1802条经验 获得超5个赞
不,您不应使用测试集进行训练以防止过度拟合,如果您使用交叉验证原则,则您需要将数据准确地拆分为三个数据集,一个用于训练模型的训练集,一个验证集测试您的超参数的不同值,以及一个测试集来最终测试您的模型,如果您使用所有数据进行训练,您的模型显然会过拟合。
如果您拥有庞大且非常丰富的数据集,请记住深度学习效果很好的一件事
添加回答
举报
0/150
提交
取消