我正在尝试按彼此更接近的值对列进行分组,例如:column1 column2322 a326 b323 c323 d323 e324 f325 g498 h498 i495 j496 k我希望使用方差为 +- 3 的值对 column1 进行分组结果:column1 , column2323 (+-3) a,b,c,d,e,f,g495 (+-3) h,i,j,k
1 回答

慕后森
TA贡献1802条经验 获得超5个赞
sort_values然后使用diff并cumsum创建 groupkey对值进行排序
df=df.sort_values('column1')
df.sort_index().\
groupby(df.column1.diff().gt(3).cumsum()).\
agg({'column1':'first','column2':','.join})
column1 column2
column1
0 322 a,b,c,d,e,f,g
1 498 h,i,j,k
添加回答
举报
0/150
提交
取消