如何在每个组中选择具有最大值的行目前我有一个问题如下。在每个主题存在多个观察的数据集中,我希望在该数据集的子集中只选择记录的最大数据。例如,对于数据集,如下所示:ID <- c(1,1,1,2,2,2,2,3,3)Value <- c(2,3,5,2,5,8,17,3,5)Event <- c(1,1,2,1,2,1,2,2,2)group <- data.frame(Subject=ID, pt=Value, Event=Event)被试1、2和3的最大pt值分别为5、17和5。首先,如何找到每个主题的最大pt值,然后将这个观察结果放到另一个数据框架中?这意味着这个子集对于每个主题只有最大的pt值。
3 回答
森林海
TA贡献2011条经验 获得超2个赞
data.table
require(data.table) ## 1.9.2group <- as.data.table(group)
pt
group[group[, .I[pt == max(pt)], by=Subject]$V1]# Subject pt Event# 1: 1 5 2# 2: 2 17 2# 3: 3 5 2
pt
:
group[group[, .I[which.max(pt)], by=Subject]$V1]# Subject pt Event# 1: 1 5 2# 2: 2 17 2# 3: 3 5 2
桃花长相依
TA贡献1860条经验 获得超8个赞
group %>% group_by(Subject) %>% top_n(1, pt)
Source: local data frame [3 x 3] Groups: Subject [3] Subject pt Event (dbl) (dbl) (dbl) 1 1 5 2 2 2 17 2 3 3 5 2
芜湖不芜
TA贡献1796条经验 获得超7个赞
使用的较短的解决方案data.table:
setDT(group)[, .SD[which.max(pt)], by=Subject]
# Subject pt Event
# 1: 1 5 2
# 2: 2 17 2
# 3: 3 5 2
- 3 回答
- 0 关注
- 518 浏览
添加回答
举报
0/150
提交
取消