为了账号安全,请及时绑定邮箱和手机立即绑定

如何使用python pandas从数据框中删除重复的列

如何使用python pandas从数据框中删除重复的列

四季花海 2021-03-17 10:13:38
通过将两列分组,我进行了一些更改。我使用python生成了一个文件,它导致了2个重复的列。如何从数据框中删除重复的列?
查看完整描述

3 回答

?
慕神8447489

TA贡献1780条经验 获得超1个赞

这里已经回答了python pandas删除重复的列。想法是df.columns.duplicated()生成布尔向量,其中每个值表示是否已查看过该列。例如,如果df具有列["Col1", "Col2", "Col1"],则生成[False, False, True]。让我们对其进行倒置并将其称为column_selector。


使用上述向量及其使用的loc方法df有助于选择行和列,我们可以删除重复的列。有了df.loc[:, column_selector]我们就可以选择列。


column_selector = ~df.columns().duplicated()

df = df.loc[:, column_selector]


查看完整回答
反对 回复 2021-03-30
?
收到一只叮咚

TA贡献1821条经验 获得超4个赞

这是到目前为止我发现的最好的。


remove = []

cols = df.columns

for i in range(len(cols)-1):

    v = df[cols[i]].values

    for j in range(i+1,len(cols)):

        if np.array_equal(v,df[cols[j]].values):

            remove.append(cols[j])


df.drop(remove, axis=1, inplace=True)


查看完整回答
反对 回复 2021-03-30
  • 3 回答
  • 0 关注
  • 645 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信