为了账号安全,请及时绑定邮箱和手机立即绑定

在pandas python中随机排列数据框的行会带来不同的回归结果吗?

在pandas python中随机排列数据框的行会带来不同的回归结果吗?

哔哔one 2021-04-09 18:15:16
我正在尝试对数据框中的行进行随机化-在应用线性回归之前将数据进行随机化,但是我意识到在对行进行随机化之后,回归结果会有所不同,不是这样吗?我尝试使用的代码:Without row randomisation: data X = data[feature_col]y = data['median_price']lr = LinearRegression()lr.fit(X, y)With row randomisation: Method 1: data = data.sample(frac=1)Method 2:data = data.sample(frac=1, axis=1)Method 3: from sklearn.utils import shuffledata = shuffle(data)Method 4: data = data.sample(frac=1, axis=1).reset_index(drop=True)在我尝试过的4行随机方法中,只有方法4的结果与未应用随机方法的结果相同。我认为行随机化在任何情况下都不会影响回归结果?
查看完整描述

1 回答

?
守着一只汪

TA贡献1872条经验 获得超3个赞

方法2和方法4是否相同?

如果将相同类型的回归应用于相同的数据(是否随机),则回归结果应该不会有所不同。您应该axis = 0用来随机化数据帧的行,axis = 1随机化列。


查看完整回答
反对 回复 2021-04-20
  • 1 回答
  • 0 关注
  • 129 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号