我正在开发一个系统来简化我们的图像库,该系统每周会增加 7k 到 20k 新图片。具体应用是识别图片中的赛车(所有汽车的形状相似,但涂装方案不同)。我计划在这部分项目中使用 python 和 tensorflow。我最初的想法是使用图像分类来按汽车对图像进行分类;但是,图片中包含多辆汽车的概率非常高。我的下一个想法是使用对象检测来检测汽车编号(出现在所有汽车的固定位置 [鼻子、尾巴、两个门和屋顶] 和每周一致的字体)。最后是整车物体识别的方法。从表面上看,这似乎是最实用的;然而,油漆方案变化很大,可能没有。哪种方法会给我最好的结果?我已经提取了大量图像进行训练,显然不同的方法需要非常不同的训练数据集。
1 回答
慕的地8271018
TA贡献1796条经验 获得超4个赞
最好的方法是使用所有 3 种方法作为整体。您训练所有 3 个模型,并将输入图像传递给所有 3 个模型。然后,有几种方法可以评估输出。
您可以总结所有 3 个模型的所有类别的概率,然后根据最高概率得出结论。
您可以从每个模型中获得预测并根据投票数做出决定:1. 模型 - class1,2. 模型 - class2,3. 模型 - class2 ==> class2
你可以做一些类似加权决策的事情。所以,假设第一个模型是最好的和最健壮的模型,但您不能 100% 相信它,并想看看其他模型会怎么说。您可以将第一个模型的输出权重为 0.6,其他两个模型的输出权重为 0.2。
我希望这有帮助 :)
添加回答
举报
0/150
提交
取消