首页手记【学习打卡】第一天数据挖掘 - 消除共线性

【学习打卡】第一天数据挖掘 - 消除共线性

标签：

Python

模块一：Python全能工程师2022，6-2数据挖掘与特征工程之消除共线性

模块二：掌握Python数据读取、预处理、分析、挖掘与模型搭建的全流程必备知识。

模块三：

可能之前就有些没看懂，因此这里需要删除强相关性因子的其中之一个的时候不是很能理解。于是重新复习了之前那一节关于相关性的小节。

Xy有相关性不代表有因果性，可以用斯皮尔曼相关系数来计算。当相关性系数0.8-1之间都是强相关，0不相关。斜对角相互对称。

先建立空列表是强相关字段，还有一个空列表用于删除字段的，当强相关则可删除其一，因为是多余的。

这种方法在数据量较小的时候合适，看每一个相关性系数。但是如果数据量大，每一次运算前都要运行一次前缀，浪费计算时间。

如果相关性系数大于0.7的可以列出来，如果行列不同一个，col可以放到需要删除的一列里。最终需要删除的字段皆是有强需求删除的，可以看看返回的列表确认一下结论是否正确。

模块四：

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

慕码人5253727

手记
篇

粉丝

0

获赞与收藏

2

关注作者，订阅最新文章

阅读免费教程

Python 办公自动化教程

17个小节 27556 930

Python 算法入门教程

15个小节 30305 1172

Python 进阶应用教程

38个小节 73051 1146

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

【学习打卡】第一天 数据挖掘 - 消除共线性

阅读免费教程

【学习打卡】第一天数据挖掘 - 消除共线性