为了账号安全,请及时绑定邮箱和手机立即绑定

手动为 Conv2d 层分配权重

手动为 Conv2d 层分配权重

慕虎7371278 2023-06-20 10:34:17
我有一个有很多 conv2d 层的模型。我将模型转换为 Tflite 模型。转换后我得到单个 conv2d 的权重。重量的形状看起来像这样# codew2 = get_variable(interpreter, 1)print(w2.shape)# output(16, 3, 3, 3)w2 是我从 tflite 模型获得的 conv2d 层的权重。# looking at weightstf.constant(w2)# out<tf.Tensor: shape=(16, 3, 3, 3), dtype=float32, numpy=array([[[[-0.09935276,  0.02673087,  0.01329462],         [-0.15000243,  0.12058315,  0.06234892],         [-0.04185663, -0.11198951, -0.02449715]],        [[-0.01043741,  0.00516671, -0.04251045],         [ 0.09123346, -0.18056516, -0.15848799],         [ 0.13060766, -0.07997198, -0.01930575]],        [[-0.03572255, -0.01315425,  0.08955526],         [ 0.16559589,  0.03411882,  0.0018566 ],         [-0.14274003,  0.1362513 ,  0.02790332]]],       [[[-0.18470907, -0.08563003, -0.1520263 ],         [-0.04288448, -0.18342438, -0.15801121],         [-0.03374813,  0.06371641,  0.03502055]],现在是我使用命令 model.weights 从模型文件中获得的权重。# codemodel_layer = model.get_layer(index = 1)model_layer.weights[0]# out<tf.Variable 'conv2d/kernel:0' shape=(3, 3, 3, 16) dtype=float32, numpy=array([[[[-0.09935276, -0.18470907, -0.16035978, -0.00957598,           0.12404141,  0.09072036,  0.08940545,  0.16788253,          -0.09028493, -0.07161955,  0.05057701,  0.00413197,           0.12936822,  0.13274643, -0.11566465,  0.06050111],         [ 0.02673087, -0.08563003,  0.15529695, -0.16517243,           0.09419081,  0.03450985,  0.05399269,  0.06663677,          -0.1096884 ,  0.11150008, -0.14434202,  0.08073789,          -0.00857992,  0.17634535, -0.1686475 , -0.02407928],         [ 0.01329462, -0.1520263 , -0.16246322, -0.06716946,           0.18214822, -0.13206367, -0.05873053,  0.13359356,           0.13813934, -0.05382906,  0.1032899 ,  0.03165779,我想要的是转换权重 w2 以便将其分配给我的图层的正确方法。
查看完整描述

1 回答

?
慕桂英4014372

TA贡献1871条经验 获得超13个赞

出于优化原因,TFlite 更改了 Conv2D 权重形状。我无法在文档中找到它,但在这里,在最后一条评论中,他们解释了“标准”和“精简版”张量流形状实现之间的区别:


在标准张量流中,Conv2D 权重形状是 HWIO,意思是(filter_height, filter_width, input_channels, output_channels).


TFlite 实现是 OHWI,意思是(output_channels, filter_height, filter_width, input_channels).


为了解决您的问题,我们需要重新排序轴。直观地从 OHWI 转到 HWIO 我们只需要将“O”从 OHWI 移动到最后一个索引(3),其余轴应该转到较低的索引:


Index:      0    1    2    3

            O    H    W    I


Reordering axes we have


New index:  1    2    3    0

            H    W    I    O


为此,我们可以使用tf.transposebut 指定我们希望如何交换轴,正如刚才讨论的那样:


tf.transpose(tf.constant(w2), (1,2,3,0) )


查看完整回答
反对 回复 2023-06-20
  • 1 回答
  • 0 关注
  • 102 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信