我有一个简单的问题要问你们中的一些人。我从事过一些图像分类教程。只有像 MNIST 数据集这样更简单的。然后我注意到他们这样做train_images = train_images / 255.0现在我知道矩阵(即图像)中的每个值都除以 255.0。如果我没记错的话,这就是所谓的规范化吧?(如果我错了,请纠正我,否则告诉我我是对的)。我只是好奇是否有“更好的方法”、“另一种方法”或“最好的方法”来预处理或清理图像,然后将这些清理过的图像提供给网络进行训练。如果您想提供示例源代码,请提供。请!别客气。我很想看看代码示例。谢谢你!
1 回答

慕哥9229398
TA贡献1877条经验 获得超6个赞
在图像分类之前预处理图像可以包括以下内容:
规范化:你已经提到过
重塑为统一分辨率(img 高度 x img 宽度):更高的分辨率会带来更好的学习效果,而较小的分辨率可能会丢失重要特征。某些模型具有默认输入大小,您可以参考。也可以使用所有图像的平均大小。
颜色通道:1指的是灰度,3指的是rgb-scale。根据您的应用程序,您可以设置它。
数据扩充:如果你的模型过度拟合或你的数据集很小,你可以通过改变原始图像(翻转、旋转、裁剪、缩放......)来增加你的数据集来重现你的数据集
图像分割:可以执行分割以突出显示可能有益于您的应用程序的区域或边界。例如,在医学图像分类中,身体的某些部分可能被遮盖以提高分类性能。
例如,我最近从事肺部 CT 扫描图像的图像分类。为了进行预处理,我重新调整了图像的形状并将它们设为灰度。然后我执行图像分割以突出显示图像中的肺部。然后我将图像像素归一化以放入我的分类模型中。根据您的应用程序,您可能还需要考虑其他更多的预处理技术。
添加回答
举报
0/150
提交
取消