我有以下代码:A = Tensor of [186,3]如果我创建一个新的空张量如下:tempTens = torch.tensor(np.zeros((186,3)), requires_grad = True).cuda()我对 A 块应用一些操作并将其输出到 tempTens,我完全使用它进行进一步计算,如下所示:tempTens[20,:] = SomeMatrix * A[20,:]梯度实际上是否会正确传输,假设我有一个成本函数,可以将 tempTens 的输出优化为某些基本事实
添加回答
举报
0/150
提交
取消