1 回答
TA贡献1840条经验 获得超5个赞
对于此类问题,可以说您最好的朋友是文档;引用 scikit-learn 文档中关于模型评估的内容:
有 3 种不同的 API 可用于评估模型预测的质量:
估算器评分方法:估算器有一种
score
方法,为它们旨在解决的问题提供默认评估标准。本页未讨论这一点,而是在每个估算器的文档中讨论。评分参数:使用交叉验证(例如
model_selection.cross_val_score
和model_selection.GridSearchCV
)的模型评估工具依赖于内部评分策略。评分参数:定义模型评估规则部分对此进行了讨论。度量函数:该
metrics
模块实现了为特定目的评估预测误差的函数。这些指标在分类指标、多标签排名指标、回归指标和聚类指标的部分中有详细说明。
在您在代码中使用的所有 3 个分类器(逻辑回归、随机森林和决策树)的文档中,有相同的描述:
score ( X, y, sample_weight=None )
返回给定测试数据和标签的平均准确率。
这回答了您对所使用的特定模型的第二个问题。
尽管如此,在盲目相信score
估算器附带的方法之前,您应该始终检查文档;在线性回归和desision树回归量,例如,score
返回判定R ^ 2,这实际上从未使用ML从业者建立的系数的预测模型(它是经常使用的统计人员构建说明模型,但是另一回事)。
顺便说一句,我简要地瞥见了您链接到的代码,我看到您计算了 MSE、MAE 和 RMSE 等指标 - 请记住,这些是回归指标,它们在分类设置中没有意义,例如你面对这里(反过来,准确性在回归设置中毫无意义)......
添加回答
举报