我正在尝试使用 ADASYN 库来平衡我高度不平衡的数据。在我平衡我的数据之后,我必须将特征和目标标签 numpy 数组加入到一个数据框中。这是我用于平衡数据的 Python 代码:from imblearn.over_sampling import ADASYNada = ADASYN()# X is feature set and y is the labelX_resampled, y_resampled = ada.fit_sample(X, y)# Add X_resampled, y_resampled into one dataframe我该怎么做?
1 回答
侃侃尔雅
TA贡献1801条经验 获得超16个赞
X_resampled
并且y_resampled
是 numpy 数组,因此我们需要np.hstack
(水平堆叠)它们在解决方案中。
X_resampled
是二维的,但是y_resampled
是一维的。之前np.hstack
,我们需要重塑y_resampled
为一列的二维数组。
全部一起:
df = pd.DataFrame(np.hstack((X_resampled, y_resampled.reshape(-1, 1))))
添加回答
举报
0/150
提交
取消