为了账号安全,请及时绑定邮箱和手机立即绑定

按组计算连续行中的值之间的差异

按组计算连续行中的值之间的差异

扬帆大鱼 2019-07-30 16:56:36
按组计算连续行中的值之间的差异这是我的df(data.frame):group value1     101     201     252     52     102     15 我需要按组计算连续行中值之间的差异。所以,我需要一个结果。group value diff1     10    NA # because there is a no previous value1     20    10 # value[2] - value[1]1     25    5  # value[3] value[2]2     5     NA # because group is changed2     10    5  # value[5] - value[4]2     15    5  # value[6] - value[5]虽然,我可以通过使用来处理这个问题ddply,但需要花费太多时间。这是因为我的团队中有很多团体df。(我的超过1,000,000个团体df)有没有其他有效的方法来处理这个问题?
查看完整描述

3 回答

?
拉风的咖菲猫

TA贡献1995条经验 获得超2个赞

该软件包data.table可以使用该shift功能相当快速地完成此操作。


require(data.table)

df <- data.table(group = rep(c(1, 2), each = 3), value = c(10,20,25,5,10,15))

#setDT(df) #if df is already a data frame


df[ , diff := value - shift(value), by = group]    

#   group value diff

#1:     1    10   NA

#2:     1    20   10

#3:     1    25    5

#4:     2     5   NA

#5:     2    10    5

#6:     2    15    5

setDF(df) #if you want to convert back to old data.frame syntax

或者使用中的lag功能dplyr


df %>%

    group_by(group) %>%

    mutate(Diff = value - lag(value))

#   group value  Diff

#   <int> <int> <int>

# 1     1    10    NA

# 2     1    20    10

# 3     1    25     5

# 4     2     5    NA

# 5     2    10     5

# 6     2    15     5

有关前期data.table::shift和前期的替代方案dplyr::lag,请参阅编辑。


查看完整回答
反对 回复 2019-07-30
?
蛊毒传说

TA贡献1895条经验 获得超3个赞

您可以使用基本功能,ave()此


df <- data.frame(group=rep(c(1,2),each=3),value=c(10,20,25,5,10,15))

df$diff <- ave(df$value, factor(df$group), FUN=function(x) c(NA,diff(x)))

返回


  group value diff

1     1    10   NA

2     1    20   10

3     1    25    5

4     2     5   NA

5     2    10    5

6     2    15    5


查看完整回答
反对 回复 2019-07-30
?
蝴蝶不菲

TA贡献1810条经验 获得超4个赞

试着用tapply

df$diff<-as.vector(unlist(tapply(df$value,df$group,FUN=function(x){ return (c(NA,diff(x)))})))


查看完整回答
反对 回复 2019-07-30
  • 3 回答
  • 0 关注
  • 529 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信