2 回答
TA贡献1880条经验 获得超4个赞
您可以利用 pytorch 的稀疏数据类型:
class SparseLinear(nn.Module):
def __init__(self, in_features, out_features, sparse_indices):
super(SparseLinear, self).__init__()
self.weight = nn.Parameter(data=torch.sparse.FloatTensor(sparse_indices, torch.randn(sparse_indices.shape[1]), [in_features, out_features]), requires_grad=True)
self.bias = nn.Parameter(data=torch.randn(out_features), requires_grad=True)
def forward(self, x):
return torch.sparse.admm(self.bias, self.weight, x, 1., 1.)
TA贡献1876条经验 获得超6个赞
我假设您想使用密集张量来实现这种稀疏连接层。如果是这样,您可以将要屏蔽(无连接)的元素的屏蔽矩阵(张量)定义为 0.0,否则为 1.0。在前向传递中,您可以简单地将权重张量与掩码张量相乘(您想要采用逐元素乘积,这是您在 PyTorch 中使用 * 运算符时的默认值),然后再与输入进行矩阵乘法对于你的稀疏层。
为了使其正常工作,您必须确保您的掩模张量没有收到梯度,否则它会在您训练模型时更新并变得无效。为此,您只需requires_grad=False
在创建掩模张量时进行设置。
添加回答
举报