为了账号安全,请及时绑定邮箱和手机立即绑定

熊猫表,对重复数据删除的列值运行.apply()

熊猫表,对重复数据删除的列值运行.apply()

森林海 2021-03-23 17:18:01
嗨,我在熊猫中有一张桌子(请参见屏幕截图以提取一部分-它有很多行),希望提取出唯一的'author_id',然后运行一个函数以提取与每个ID相关的详细信息。我通过以下方式提取唯一ID的列表:unique_ids = df['author_id'].unique()然后,我尝试运行:df['author_id'].unique().apply(some_function)其中“ some_function”采用“ author_id”并返回一些信息。但是我得到了错误:AttributeError: 'numpy.ndarray' object has no attribute 'apply'因此,我诉诸于:[unique_ids中author_id的some_function(author_id)]哪个可行,但不是实现此目的的高效/矢量化方法。用矢量化方式进行此操作的方式是什么?
查看完整描述

2 回答

?
陪伴而非守候

TA贡献1757条经验 获得超8个赞

唯一函数的输出是一个numpy数组,它不提供apply方法。您可以Series通过该数组创建一个,然后应用您的函数:

pd.Series(df['author_id'].unique()).apply(some_function)


查看完整回答
反对 回复 2021-03-30
?
白猪掌柜的

TA贡献1893条经验 获得超10个赞

我认为您想执行以下操作groupby:


g = df.groupby('author_id')


g.apply(some_function)


查看完整回答
反对 回复 2021-03-30
  • 2 回答
  • 0 关注
  • 164 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号