与开始和结束位置重叠连接考虑以下几点data.tableS.第一个区域定义了每组“x”的起始和结束位置的一组区域:library(data.table)d1 <- data.table(x = letters[1:5], start = c(1,5,19,30, 7), end = c(3,11,22,39,25))setkey(d1, x, start)
# x start end# 1: a 1 3# 2: b 5 11# 3: c 19 22# 4: d 30 39# 5: e 7 25第二个数据集具有相同的分组变量‘x’,并在每个组中定位‘pos’:d2 <- data.table(x = letters[c(1,1,2,2,3:5)], pos = c(2,3,3,12,20,52,10))setkey(d2, x, pos)# x pos# 1: a 2# 2: a 3
# 3: b 3# 4: b 12# 5: c 20# 6: d 52# 7: e 10最后,我想提取‘d2’中的行,其中‘pos’在每个组中都属于由‘start’和‘end’定义的范围内。x..期望的结果是# x pos start end# 1: a 2 1 3# 2: a 3 1 3# 3: c 20 19 22# 4: e 10 7 25任何组的开始/结束位置。x永远不会重叠,但在任何地区都可能存在价值差距。现在,我认为我应该使用滚动连接。据我所知,我不能在联接中使用“end”列。我试过d1[d2, roll = TRUE, nomatch = 0, mult = "all"][start <= end]得到# x start end# 1: a 2 3# 2: a 3 3# 3: c 20 22# 4: e 10 25这是我想要的正确的行集;但是,“pos”变成了“start”,而原始的“start”已经丢失了。是否有一种方法可以保留所有列的滚动连接,以便我可以报告“开始”,“pos”,“结束”的要求吗?
3 回答
- 3 回答
- 0 关注
- 661 浏览
添加回答
举报
0/150
提交
取消