为了账号安全,请及时绑定邮箱和手机立即绑定

Pandas:如何从两个数据帧的联合中获取虚拟变量列?

Pandas:如何从两个数据帧的联合中获取虚拟变量列?

明月笑刀无情 2021-10-10 14:05:38
我有两个数据框,每个数据框都具有相同的变量和行长度,但是分类变量(对象列)有时在一个与另一个中具有不同的实现。这就是我的意思。Frame 1 | categorical_1 | categorical_2 |||  Frame 2 | categorical_1 | categorical_2row 1   | blue          | flakes        |||  row 1   | blue          | flakesrow 2   | red           | cheerios      |||  row 2   | red           | flakesrow 3   | blue          | cheerios      |||  row 3   | green         | flakes正如您在上面的基本插图中所见,绿色仅出现在第二个数据框中,而cheerios 仅出现在我的第一个数据框中。基本上,我需要一种方法来考虑两个数据帧(或更多)的“变量范围”来创建虚拟变量列,所以我不能只调用pd.get_dummies它们中的任何一个。
查看完整描述

1 回答

?
素胚勾勒不出你

TA贡献1827条经验 获得超9个赞

pandas 中没有其他功能可以帮助您做到这一点。正如您所提到的,pd.get_dummies只能在一个数据框中创建虚拟对象。

您的数据框中是否有索引或不同的 ID?

如果你这样做,你可以categorical_2将它们合并到一个数据帧中。然后您可以使用pd.get_dummies并最终根据不同的索引或 ID 将其匹配回原始数据帧。

如果你不这样做,我认为处理这个问题的唯一方法是手动编码。


查看完整回答
反对 回复 2021-10-10
  • 1 回答
  • 0 关注
  • 119 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信