为了账号安全,请及时绑定邮箱和手机立即绑定

pandas在一列中找到相似的行,根据条件创建一个新列

pandas在一列中找到相似的行,根据条件创建一个新列

三国纷争 2023-08-08 15:04:43
我有一个 df,查询主题 HPSame0 WP_77.1 WP_706.1 HPS_11 WP_78.1 WP_46.1 HPS_22 WP_57.1 WP_26.1 HPS_33 WP_57.1 WP_627.1 HPS_44 WP_15.1 WP_16.1 HPS_55 WP_15 .1 WP_17.1 HPS_66 WP_15.1 WP_63.1 HPS_7 7 WP_15.1WP_61.1 HPS_88 WP_15.1 WP_56.1 HPS_99 WP_40.1 WP_11.1 HPS_10我试过,df['query_s'] = df['query'].shift(-1)df['HPSame_s'] = df['HPSame'].shift(-1)condition = [(df['query'] == df['query_s'])]ifTrue = df['HPSame']ifFalse = df['HPSame_s']df['match'] = np.where(condition, ifTrue, ifFalse)这会引发 ValueError: 值的长度与索引的长度不匹配我也尝试过,以下但没有给我我想要的结果。df.loc[(df['query'] == df['query_s']), 'match'] = df['HPSame']df.loc[(df['query'] != df['query_s']), 'match'] = df['HPSame_s']我正在寻找结果,df = query subject HPSame match 0 WP_77.1 WP_706.1 HPS_1 HPS_1 1 WP_78.1 WP_46.1 HPS_2 HPS_2 2 WP_57.1 WP_26.1 HPS_3 HPS_3 3 WP_57.1 WP_627.1 HPS_4 HPS_3 4 WP_15.1 WP_16.1 HPS_5 HPS_5 5 WP_15.1 WP_17.1 HPS_6 HPS_5 6 WP_15.1 WP_63.1 HPS_7 HPS_5 7 WP_15.1 WP_61.1 HPS_8 HPS_5 8 WP_15.1 WP_56.1 HPS_9 HPS_5 9 WP _40.1 WP_11。 1 HPS_10 HPS_10
查看完整描述

2 回答

?
慕斯709654

TA贡献1840条经验 获得超5个赞

您可以使用ffill:


df['match'] = df['HPSame'].where(df['query'] != df['query'].shift()).ffill()

输出:


     query   subject  HPSame   match

0  WP_77.1  WP_706.1   HPS_1   HPS_1

1  WP_78.1   WP_46.1   HPS_2   HPS_2

2  WP_57.1   WP_26.1   HPS_3   HPS_3

3  WP_57.1  WP_627.1   HPS_4   HPS_3

4  WP_15.1   WP_16.1   HPS_5   HPS_5

5  WP_15.1   WP_17.1   HPS_6   HPS_5

6  WP_15.1   WP_63.1   HPS_7   HPS_5

7  WP_15.1   WP_61.1   HPS_8   HPS_5

8  WP_15.1   WP_56.1   HPS_9   HPS_5

9  WP_40.1   WP_11.1  HPS_10  HPS_10


查看完整回答
反对 回复 2023-08-08
?
呼唤远方

TA贡献1856条经验 获得超11个赞

您也可以使用groupby.transform('first')如


df['match'] = (

    df.groupby('query')['HPSame'].transform('first')

    .reset_index(drop=True)

)

输出


     query   subject  HPSame   match

0  WP_77.1  WP_706.1   HPS_1   HPS_1

1  WP_78.1   WP_46.1   HPS_2   HPS_2

2  WP_57.1   WP_26.1   HPS_3   HPS_3

3  WP_57.1  WP_627.1   HPS_4   HPS_3

4  WP_15.1   WP_16.1   HPS_5   HPS_5

5  WP_15.1   WP_17.1   HPS_6   HPS_5

6  WP_15.1   WP_63.1   HPS_7   HPS_5

7  WP_15.1   WP_61.1   HPS_8   HPS_5

8  WP_15.1   WP_56.1   HPS_9   HPS_5

9  WP_40.1   WP_11.1  HPS_10  HPS_10


查看完整回答
反对 回复 2023-08-08
  • 2 回答
  • 0 关注
  • 112 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信