1 回答
TA贡献1780条经验 获得超5个赞
增加 2 倍而不是增加 4 倍是因为每个系列中只有 2 个类别。(在您的示例中,第一行中的 A 和 G,第二行中的 G 和 C,第三行中的 T 和 C,依此类推)
下面的示例将更好地理解附加列的数量
In [38]: df = pd.DataFrame({'A': ['a', 'b', 'a'], 'B': ['b', 'a', 'c'], 'C': [1, 2, 3]})
In [39]: df
Out[39]:
A B C
0 a b 1
1 b a 2
2 a c 3
In [40]: pd.get_dummies(df)
Out[40]:
C A_a A_b B_a B_b B_c
0 1 1 0 0 1 0
1 2 0 1 1 0 0
2 3 1 0 0 0 1
添加回答
举报