为了账号安全,请及时绑定邮箱和手机立即绑定

设置值之间的最小间距

设置值之间的最小间距

慕娘9325324 2022-07-26 21:08:14
我有以下对列value进行排序的数据框:df = pd.DataFrame({'variable': {0: 'Chi', 1: 'San Antonio', 2: 'Dallas', 3: 'PHL', 4: 'Houston', 5: 'NY', 6: 'Phoenix', 7: 'San Diego', 8: 'LA', 9: 'San Jose', 10: 'SF'}, 'value': {0: 191.28, 1: 262.53, 2: 280.21, 3: 283.08, 4: 290.75, 5: 295.72, 6: 305.6, 7: 357.89, 8: 380.07, 9: 452.71, 10: 477.67}})输出:       variable   value0           Chi  191.281   San Antonio  262.532        Dallas  280.213           PHL  283.084       Houston  290.755            NY  295.726       Phoenix  305.607     San Diego  357.898            LA  380.079      San Jose  452.7110           SF  477.67我想找到相邻值之间的距离小于 10 的值:df['value'].diff() < 10输出:0     False1     False2     False3      True4      True5      True6      True7     False8     False9     False10    FalseName: value, dtype: bool现在我想平均间隔那些True彼此太接近的值。这个想法是取True序列之前的第一个值 (280.21) 并将 5 添加到每个下一个True值(累积和):第一个True= 280 + 5,第二个True= 280 + 5 + 5,第三个True= 280 + 5 + 5...预期输出:       variable   value0           Chi  191.281   San Antonio  262.532        Dallas  280.21 3           PHL  285.21 <-4       Houston  290.21 <-5            NY  295.21 <-6       Phoenix  300.21 <-7     San Diego  357.898            LA  380.079      San Jose  452.7110           SF  477.67我的解决方案:mask = df['value'].diff() < 10df.loc[mask, 'value'] = 5df.loc[mask | mask.shift(-1), 'value'] = last_day[mask | mask.shift(-1), 'value'].cumsum()也许有一个更优雅的。
查看完整描述

1 回答

?
牛魔王的故事

TA贡献1830条经验 获得超3个赞

让我们试试这个:


df = pd.DataFrame({'variable': {0: 'Chi', 1: 'San Antonio', 2: 'Dallas', 3: 'PHL', 4: 'Houston', 5: 'NY', 6: 'Phoenix', 7: 'San Diego', 8: 'LA', 9: 'San Jose', 10: 'SF'}, 'value': {0: 191.28, 1: 262.53, 2: 280.21, 3: 283.08, 4: 290.75, 5: 295.72, 6: 305.6, 7: 357.89, 8: 380.07, 9: 452.71, 10: 477.67}})


s = df['value'].diff() < 10

add_amt = s.cumsum().mask(~s) * 5


df_out = df.assign(value=df['value'].mask(add_amt.notna()).ffill() + add_amt.fillna(0))

df_out

输出:


       variable   value

0           Chi  191.28

1   San Antonio  262.53

2        Dallas  280.21

3           PHL  285.21

4       Houston  290.21

5            NY  295.21

6       Phoenix  300.21

7     San Diego  357.89

8            LA  380.07

9      San Jose  452.71

10           SF  477.67


查看完整回答
反对 回复 2022-07-26
  • 1 回答
  • 0 关注
  • 64 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信