例如,Gender 属性会被转化为两个属性,“Genre=M”和“Genre=F”我需要两列男性和女性,分配对应于该属性存在与否的二进制值
2 回答
慕运维8079593
TA贡献1876条经验 获得超5个赞
方法 1:您可以使用 pd.get_dummies(colname) 它将为您提供 n 个新列(其中 n 是该列的不同值的数量),每个列代表二进制标志以表示每行的值状态。方法二:我们也可以使用df。名称。map({'M' :0,'F':1}) 方法三:我们可以像df一样使用replace命令。名称。replace(['M', 'F' ], [1, 0], inplace=True) 第一种方法是onehot encoding 其他2种类似于标签编码
蝴蝶不菲
TA贡献1810条经验 获得超4个赞
使用熊猫功能get_dummies。
get_dummies:将分类变量转换为虚拟/指标变量。来源。
用法示例:
s = pd.Series(list('abca'))
pd.get_dummies(s)
输出:
a b c
0 1 0 0
1 0 1 0
2 0 0 1
3 1 0 0
添加回答
举报
0/150
提交
取消