为了账号安全,请及时绑定邮箱和手机立即绑定

将 python/numpy 索引转移到 Tensorflow 并提高性能

将 python/numpy 索引转移到 Tensorflow 并提高性能

www说 2023-07-27 10:36:06
在之前的一个问题中,我询问了有关更快地将项目分配给数组的建议。从那时起,我取得了一些进展,例如,我扩展了推荐的版本来处理 3-D 数组,其目的是类似于神经网络后续训练数据的批量大小:import numpy as npimport timebatch_dim = 2first_dim = 5second_dim = 7depth_dim = 10upper_count = 5000toy_dict = {k:np.random.random_sample(size = depth_dim) for k in range(upper_count)}a = np.array(list(toy_dict.values()))def create_input_3d(orig_arr):  print("Input shape:", orig_arr.shape)  goal_arr = np.full(shape=(batch_dim, orig_arr.shape[1], orig_arr.shape[2], depth_dim), fill_value=1234, dtype=float)  print("Goal shape:", goal_arr.shape)  idx = np.indices(orig_arr.shape)  print("Idx shape", idx.shape)  goal_arr[idx[0], idx[1], idx[2]] = a[orig_arr[idx[0], idx[1], idx[2]]]  return goal_arrorig_arr_three_dim = np.random.randint(0, upper_count, size=(batch_dim, first_dim, second_dim))orig_arr_three_dim.shape # (2,5,7)reshaped = create_input_3d(orig_arr_three_dim)然后,我决定创建一个自定义层以提高性能并即时进行转换(减少内存):import tensorflow as tffrom tensorflow import kerasimport numpy as np#custom layerclass CustLayer(keras.layers.Layer):    def __init__(self, info_matrix, first_dim, second_dim, info_dim, batch_size):        super(CustLayer, self).__init__()        self.w = tf.Variable(            initial_value=info_matrix,            trainable=False,            dtype=tf.dtypes.float32        )        self.info_dim = info_dim        self.first_dim = first_dim        self.second_dim = second_dim        self.batch_size = batch_size由于高级索引(如我第一个发布的代码中)不起作用,我回到了天真的 for 循环 - 这太慢了。我正在寻找的是一种使用第一个代码片段中所示的高级索引的方法,并将其重新编程为 tf 兼容。这让我以后能够使用 GPU 进行学习。简而言之:输入的形状为(batch_size, first_dim, second_dim),返回的形状为(batch_size, first_dim, second_dim, info_dim),摆脱了缓慢的 for 循环。提前致谢。
查看完整描述

1 回答

?
呼唤远方

TA贡献1856条经验 获得超11个赞

对于其他寻找答案的人来说,这就是我最终想出的:


import tensorflow as tf

from tensorflow import keras

import numpy as np

import time


class CustLayer(keras.layers.Layer):

    def __init__(self, info_matrix, first_dim, second_dim, info_dim, batch_size):

        super(CustLayer, self).__init__()

        self.w = tf.Variable(

            initial_value=info_matrix,

            trainable=False,

            dtype=tf.dtypes.float32

        )

        self.info_matrix = info_matrix

        self.info_dim = info_dim

        self.first_dim = first_dim

        self.second_dim = second_dim

        self.batch_size = batch_size

   

    def my_numpy_func(self, x):

      # x will be a numpy array with the contents of the input to the

      # tf.function

      shape = x.shape

      goal_arr = np.zeros(shape=(shape[0], shape[1], shape[2], self.info_dim), dtype=np.float32)


      # indices to expand

      idx = np.indices(shape)

      goal_arr[idx[0], idx[1], idx[2]] = self.info_matrix[x[idx[0], idx[1], idx[2]]]


      shape_arr = np.array([shape[0], shape[1], shape[2]], dtype=np.int8)

      #tf.print("Shape:", shape)

      #tf.print("Shape_arr:", shape_arr)

      #tf.print("Type:",type(shape_arr))

      return goal_arr, shape_arr


    @tf.function(input_signature=[tf.TensorSpec((None, 39, 25), tf.int64)])

    def tf_function(self, input):

      

      y, shape_arr = tf.numpy_function(self.my_numpy_func, [input], [tf.float32, tf.int8], "Nameless")

      #tf.print("shape_arr", shape_arr)

      y = tf.reshape(y, shape=(shape_arr[0], shape_arr[1], shape_arr[2], self.info_dim))

      return y


    def call(self, orig_arr):

      return self.tf_function(orig_arr)

      

注意事项:在 GPU 上运行,但不能在 TPU 上运行。


查看完整回答
反对 回复 2023-07-27
  • 1 回答
  • 0 关注
  • 116 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信