为了账号安全,请及时绑定邮箱和手机立即绑定

二分类模型常用评价指标汇总

标签:
机器学习

有很多指标可以衡量机器学习模型的效果,不同的任务使用的评价指标也不尽相同。本文对二分类任务的评价指标加以总结。全文系作者原创,仅供学习参考使用,转载授权请私信联系,否则将视为侵权行为。码字不易,感谢支持。

在二分类问题中,数据的标签通常用(0/1)来表示,在模型训练完成后进行测试时,会对测试集的每个样本计算一个介于0~1之间的概率,表征模型认为该样本为阳性的概率,我们可以选定一个阈值,将模型计算出的概率进行二值化,比如选定阈值=0.5,那么当模型输出的值大于等于0.5时,我们就认为模型将该样本预测为阳性,也就是标签为1,反之亦然。选定的阈值不同,模型预测的结果也会相应地改变。二元分类模型的单个样本预测有四种结果:

  1. 真阳性(TP):判断为阳性,实际也是阳性。

  2. 伪阳性(FP):判断为阳性,实际却是阴性。

  3. 真阴性(TN):判断为阴性,实际也是阴性。

  4. 伪阴性(FN):判断为阴性,实际却是阳性。

这四种结果可以画成2 × 2的混淆矩阵

webp

二阶混淆矩阵

有了混淆矩阵,就可以定义各种指标了。

  • TPR(真阳性率) = TP / (TP + FN)

  • FPR(假阳性率) = FP / (FP + TN)

  • Accuracy(准确率)= (TP + TN) / (TP+TN+FP+FN)

  • Precision(精确率)= TP / (TP + FP)

  • Recall(召回率)= TP / (TP + FN)

  • F1值 = 2TP / (2TP+FP+FN)

  • PPV(positive predictive value)= TP / (TP + FP)

  • sensitivity(敏感性)= TP / (TP + FN)

  • specificity(特异性)= TN / (TN + FP)


以上就是本文的全部内容,如果你喜欢这篇文章,欢迎将它分享给朋友们。

感谢您的阅读,祝您生活愉快!



作者:郗南枫
链接:https://www.jianshu.com/p/9e5e1928a66c


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
数据库工程师
手记
粉丝
42
获赞与收藏
203

关注作者,订阅最新文章

阅读免费教程

  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消