2 回答
TA贡献1934条经验 获得超2个赞
这也是一个很好的检查可能性:https ://scikit-learn.org/stable/tutorial/basic/tutorial.html
-fit
方法总是在机器学习中学习一些东西。
您通常有以下步骤:
将您的数据分成两个/三个数据集
选择你的数据的一部分来学习/训练一些东西(通常
X_train
)fit
使用学习算法来预测看不见的数据(通常
X_test
)predict
在您的第一个示例中:missingvalues.fit(X[:, 1:3])
您正在根据仅使用 columnSimpleImputer
的数据进行训练,而您使用转换来覆盖此数据。X
1,2,3
在您的第二个示例中:您正在对两个数据集进行训练StandardScaler
并X_train
正在使用此训练X_train, X_test
,StandardScaler 从中X_train
学习,这意味着如果他知道必须将 10 转换为 2,他将在两组中将 10 转换为 2 X_train, X_test
。
TA贡献1860条经验 获得超9个赞
Sklearn 使用类。有关 Python中的类的更多信息,请参阅Python 文档。有关sklearn
特别的更多信息,请查看此sklearn 文档。
以下是您如何在sklearn
.
首先,您使用or实例化您的sklearn
类。sc_X = StandardScaler()
missingvalues = SimpleImputer(...)
对象sc_X
和missingvalues
,每个都有方法。您可以使用键入的方法object_name.method_name(...)
。例如,您在键入时使用fit_transform()
了实例的方法, . 此方法将获取您的数据并返回它的缩放版本。它既s(确定缩放参数)和s(应用缩放)到您的数据。该方法将使用它为之前的数据学习的相同缩放参数来转换新数据。sc_X
sc_X.fit_transform(...)
fit
transform
transform()
在第一个示例中,您已将fit
和transform
方法分成两行,但想法是相似的——您首先使用该fit
方法学习插补参数,然后转换您的数据。
顺便说一句,我认为missingvalues = missingvalues.fit(X[:, 1:3])
可以更改为missingvalues.fit(X[:, 1:3])
.
添加回答
举报