我正在训练一个模型来根据一些数据预测真假。在训练和测试模型时,我从功能列表中删除了产品编号。X = df.drop(columns = 'Product Number', axis = 1)y = df['result']X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 42)SVC = LinearSVC(max_iter = 1200)SVC.fit(X_train, y_train)y_pred = SVC.predict(X_test)我有什么办法可以恢复已通过或未通过的项目的产品编号及其功能吗?如何获取 y_pred 的结果/将其与其对应的产品编号关联起来?我还计划使用交叉验证,以便对数据进行洗牌,我还有办法恢复每个测试项目的产品编号吗?
1 回答
守候你守候我
TA贡献1802条经验 获得超10个赞
我意识到我使用交叉验证只是为了评估模型的性能,因此我决定只运行代码,而不重新整理数据以查看每个数据点的结果。
编辑:对于没有交叉验证的评估,只有当我将其传递给分类器时,我才会删除不相关的列,如下所示:
cols = ['id', 'label']
X = train_data.copy()
y = train_data['label']
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=2)
knn = make_pipeline(StandardScaler(),KNeighborsClassifier(n_neighbors=10))
y_val_pred = knn.fit(X_train.drop(columns=cols), y_train).predict(X_val.drop(columns=cols))
X_val['y_val_pred'] = y_val_pred
我加入y_val_pred后预测来检查哪些数据点被错误分类。
添加回答
举报
0/150
提交
取消