为了账号安全,请及时绑定邮箱和手机立即绑定

如何在R中完成VLOOKUP和填充(如Excel)?

如何在R中完成VLOOKUP和填充(如Excel)?

30秒到达战场 2019-07-11 16:18:28
如何在R中完成VLOOKUP和填充(如Excel)?我有一个大约105000行30列的数据集。我有一个分类变量,我想把它分配给一个数字。在Excel中,我可能会用VLOOKUP然后填满。我要怎么做同样的事R?本质上,我所拥有的是HouseType变量,我需要计算HouseTypeNo..以下是一些样本数据:HouseType HouseTypeNoSemi            1Single          2Row             3Single          2Apartment       4Apartment       4Row             3
查看完整描述

3 回答

?
潇湘沐

TA贡献1816条经验 获得超6个赞

如果我正确理解了您的问题,下面是四种方法来完成与Excel相同的操作VLOOKUP然后用R:

# load sample data from Qhous <- read.table(header = TRUE, 
                   stringsAsFactors = FALSE, text="HouseType HouseTypeNo
Semi            1
Single          2
Row             3
Single          2
Apartment       4
Apartment       4
Row             3")# create a toy large table with a 'HouseType' column # but no 'HouseTypeNo' column (yet)largetable <- data.frame(
HouseType = as.character(sample(unique(hous$HouseType), 1000, replace = TRUE)), stringsAsFactors = FALSE)# create a lookup table to get t
he numbers to fill# the large tablelookup <- unique(hous)
  HouseType HouseTypeNo1      Semi           12    Single           23       Row           35 Apartment    
         4

下面是四种方法来填充HouseTypeNolargetable中的值。lookup表:

先与merge基地:

# 1. using base base1 <- (merge(lookup, largetable, by = 'HouseType'))

第二种方法,基中有命名向量:

# 2. using base and a named vectorhousenames <- as.numeric(1:length(unique(hous$HouseType)))names(housenames) <- unique(hous$HouseType)base2
 <- data.frame(HouseType = largetable$HouseType,
                    HouseTypeNo = (housenames[largetable$HouseType]))

第三,使用plyr一揽子:

# 3. using the plyr packagelibrary(plyr)plyr1 <- join(largetable, lookup, by = "HouseType")

第四,使用sqldf包装

# 4. using the sqldf packagelibrary(sqldf)sqldf1 <- sqldf("SELECT largetable.HouseType, lookup.HouseTypeNo
FROM largetable
INNER JOIN lookup
ON largetable.HouseType = lookup.HouseType")

如果有可能有些人在largetable不存在于lookup然后使用左联接:

sqldf("select * from largetable left join lookup using (HouseType)")

对其他解决方案也需要相应的修改。

这就是你想做的吗?让我知道你喜欢哪种方法,我会添加评论。


查看完整回答
反对 回复 2019-07-11
?
手掌心

TA贡献1942条经验 获得超3个赞

我想你也可以用match():

largetable$HouseTypeNo <- with(lookup,
                     HouseTypeNo[match(largetable$HouseType,
                                       HouseType)])

如果我按…的顺序排列,这仍然有效。lookup.


查看完整回答
反对 回复 2019-07-11
?
不负相思意

TA贡献1777条经验 获得超10个赞

我也喜欢用qdapTools::lookup或速记二进制运算符%l%..它的工作原理与ExcelVLOOKUP相同,但它接受与列号相反的名称参数。

## Replicate Ben's data:hous <- structure(list(HouseType = c("Semi", "Single", "Row", "Single", 
    "Apartment", "Apartment", "Row"), HouseTypeNo = c(1L, 2L, 3L, 
    2L, 4L, 4L, 3L)), .Names = c("HouseType", "HouseTypeNo"), 
    class = "data.frame", row.names = c(NA, -7L))largetable <- data.frame(HouseType = as.character(sample(unique(hous$HouseType), 
    1000, replace = TRUE)), stringsAsFactors = FALSE)## It's this simple:library(qdapTools)largetable[, 1] %l% hous


查看完整回答
反对 回复 2019-07-11
  • 3 回答
  • 0 关注
  • 859 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信