为了账号安全,请及时绑定邮箱和手机立即绑定

Pandas 比较 3 列,如果计数大于 1 则输出结果

Pandas 比较 3 列,如果计数大于 1 则输出结果

慕雪6442864 2023-10-26 14:33:03
我有 3 列,其值为 A、B 或 C 我想比较这 3 列并给出其中值计数超过 1 的输出。如果计数相等则输出将为“-”输入:    | col1  | col2  | col3  |    |-------|-------|-------|    | A     | A     | B     |    | A     | B     | B     |    | C     | B     | C     |    | A     | B     | C     |输出:    | col1  | col2  | col3  | Result|    |-------|-------|-------|-------|    | A     | A     | B     | A     |    | A     | B     | B     | B     |    | C     | B     | C     | C     |    | A     | B     | C     | -     |
查看完整描述

2 回答

?
烙印99

TA贡献1829条经验 获得超13个赞

让我们尝试Counter获取最常见的元素:


from collections import Counter


def most_common():

    for s in df.to_numpy():

        k, v = Counter(s).most_common(1)[0] 

        yield '-' if v == 1 else k


df['Result'] = list(most_common())

  col1 col2 col3 Result

0    A    A    B      A

1    A    B    B      B

2    C    B    C      C

3    A    B    C      -


查看完整回答
反对 回复 2023-10-26
?
慕侠2389804

TA贡献1719条经验 获得超6个赞

如果性能不是一个大问题,您可以编写一个按行方法返回出现多次的值:


def appear_more_than_once(s):

    cnt = s.value_counts()

    if len(cnt) > 0 and cnt.iloc[0] > 1:

        return cnt.index[0]

    else:

        return '-'

        

df['Result'] = df.apply(appear_more_than_once, axis=1)

print(df)

#  col1 col2 col3 Result

#0    A    A    B      A

#1    A    B    B      B

#2    A    B    C      -

https://uscript.co/public/Google_108617488638529745626/python/4e5d36bc.py


查看完整回答
反对 回复 2023-10-26
  • 2 回答
  • 0 关注
  • 135 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信