为了账号安全,请及时绑定邮箱和手机立即绑定

算法岗位做数据挖掘大多都是抽特征跑跑现成模型”

标签:
算法

这句话,说起来很简单,看起来也很容易,但真的是这样吗?
我列举几点,扩展一下上面这句话:
1、label符合业务场景吗?label准确吗?能够校准吗?放在哪张表里,怎么正确关联特征?
2、特征合理吗?预处理流程正确吗?有效吗?特征会泄露标签信息吗?特征时间维度一致吗?
3、用什么模型?模型出来的结果有什么业务含义?该怎么定义合适的指标来判断模型的性能?
4、根据模型结果,怎么回调特征,参数?
还有很多。造轮子,在工业界的数据挖据流程当中真的不重要。
假设你很牛逼,造了个GBDT,但是你比xgboost在同一数据集下好上多少?一个点?两个点?快上几秒?在牛比的特征工程面前都没有太大意义。

点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消