为了账号安全,请及时绑定邮箱和手机立即绑定

一个热编码单个分类数值列

一个热编码单个分类数值列

慕尼黑5688855 2021-12-09 15:39:00
我正在寻找对分类数字列进行编码。我从字符串类型的分类列中看到了很多编码,但在已经转换为数字时却没有。我的目标是转换这个熊猫数据框:+---------+|year|hour||2018|1||2018|3||2019|4||2019|4|+------+到:+-----------------------------------------+|year_2018|year_2019|hour_1|hour_3|hour_4||1|0|1|0|0||1|0|0|1|0||0|4|0|0|1||0|1|0|0|1|+---------+
查看完整描述

1 回答

?
撒科打诨

TA贡献1934条经验 获得超2个赞

你需要 pd.get_dummies


df = pd.DataFrame({'year':[2018,2018,2019,2019], 'hour':[1,3,4,4]})


print(pd.get_dummies(df, columns=['year','hour'], drop_first=False))

输出:


  year_2018  year_2019  hour_1  hour_3  hour_4                                                                                                                   

0          1          0       1       0       0                                                                                                                   

1          1          0       0       1       0                                                                                                                   

2          0          1       0       0       1                                                                                                                   

3          0          1       0       0       1  


查看完整回答
反对 回复 2021-12-09
  • 1 回答
  • 0 关注
  • 138 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信