1 回答

TA贡献1836条经验 获得超3个赞
这种类型的扣除并不完全正确。特征之间的组合不是线性的。确实,如果严格为 0 没有关系,但它可能会以另一种方式在另一个深层重新组合。
如果您的模型是线性的,那将是正确的。事实上,这就是 PCA 分析的工作原理,它通过协方差矩阵搜索线性关系。特征值将指示每个特征的重要性。
我认为有几种方法可以证实你的怀疑:
消除您认为不重要的特征,再次训练并查看结果。如果是相似的,那么你的怀疑是正确的。
应用当前模型,举一个例子(我们称之为枢轴)来评估和显着改变你认为不相关的特征并创建许多例子。这适用于多个枢轴。如果结果相似,则该字段应该无关紧要。示例(我认为第一个功能无关紧要):
data = np.array([[0.5, 1, 0.5], [1, 2, 5]])
range_values = 50
new_data = []
for i in range(data.shape[0]):
sample = data[i]
# We create new samples
for i in range (1000):
noise = np.random.rand () * range_values
new_sample = sample.copy()
new_sample[0] += noise
new_data.append(new_sample)
添加回答
举报