首页猿问如何将数据从长格式转换为宽格式

如何将数据从长格式转换为宽格式

R语言

慕婉清6462132 2019-05-20 17:19:08

我无法重新排列以下数据框：set.seed(45)dat1 <- data.frame( name = rep(c("firstName", "secondName"), each=4), numbers = rep(1:4, 2), value = rnorm(8) )dat1 name numbers value1 firstName 1 0.34079972 firstName 2 -0.70334033 firstName 3 -0.37953774 firstName 4 -0.74604745 secondName 1 -0.89810736 secondName 2 -0.33479417 secondName 3 -0.50137828 secondName 4 -0.1745357我想重新整形它，以便每个唯一的“名称”变量是一个rowname，其中“值”作为沿该行的观察值，“数字”作为同名。有点像： name 1 2 3 41 firstName 0.3407997 -0.7033403 -0.3795377 -0.74604745 secondName -0.8981073 -0.3347941 -0.5013782 -0.1745357我看melt，并cast和其他一些东西，但没有人可以做的工作。

查看完整描述

6 回答

汪汪一只猫

TA贡献1898条经验获得超8个赞

使用reshape功能：

reshape(dat1, idvar = "name", timevar = "numbers", direction = "wide")

反对回复 2019-05-20

慕莱坞森

TA贡献1810条经验获得超4个赞

新的（2014年）tidyr包也做到这一点简单地说，与gather()/ spread()是的条款melt/ cast。

library(tidyr)spread(dat1, key = numbers, value = value)

来自github，

tidyr是一个重新reshape2设计，旨在配合整洁的数据框架，并与数据分析建立一个坚实的管道，magrittr并dplyr建立一个坚实的管道。
就像reshape2重塑tidyr不到一样，做得不到reshape2。它专门用于整理数据，而不是一般的重塑reshape2，或重塑的一般聚合。特别是，内置方法仅适用于数据帧，并且不tidyr提供边距或聚合。

反对回复 2019-05-20

侃侃尔雅

TA贡献1801条经验获得超16个赞

您可以使用该reshape()函数或reshape包中的melt()/ cast()functions 执行此操作。对于第二个选项，示例代码是

library(reshape)

cast(dat1, name ~ numbers)

或使用 reshape2

library(reshape2)

dcast(dat1, name ~ numbers)

反对回复 2019-05-20

墨色风雨

TA贡献1853条经验获得超6个赞

如果性能是一个问题的另一个选择是使用'的融合和dcast函数data.table的扩展reshape2

（参考：使用data.tables进行高效重塑）

library(data.table)

setDT(dat1)

dcast(dat1, name ~ numbers, value.var = "value")

# name 1 2 3 4

# 1: firstName 0.1836433 -0.8356286 1.5952808 0.3295078

# 2: secondName -0.8204684 0.4874291 0.7383247 0.5757814

而且，从data.table v1.9.6开始，我们可以在多列上进行转换

## add an extra column

dat1[, value2 := value * 2]

## cast multiple value columns

dcast(dat1, name ~ numbers, value.var = c("value", "value2"))

# name value_1 value_2 value_3 value_4 value2_1 value2_2 value2_3 value2_4

# 1: firstName 0.1836433 -0.8356286 1.5952808 0.3295078 0.3672866 -1.6712572 3.190562 0.6590155

# 2: secondName -0.8204684 0.4874291 0.7383247 0.5757814 -1.6409368 0.9748581 1.476649 1.1515627

反对回复 2019-05-20

慕少森

TA贡献2019条经验获得超9个赞

使用您的示例数据框，我们可以：

xtabs(value ~ name + numbers, data = dat1)

反对回复 2019-05-20

拉莫斯之舞

TA贡献1820条经验获得超10个赞

其他两个选择：

基础包：

df <- unstack(dat1, form = value ~ numbers)

rownames(df) <- unique(dat1$name)

sqldf 包：

library(sqldf)

sqldf('SELECT name,

MAX(CASE WHEN numbers = 1 THEN value ELSE NULL END) x1,

MAX(CASE WHEN numbers = 2 THEN value ELSE NULL END) x2,

MAX(CASE WHEN numbers = 3 THEN value ELSE NULL END) x3,

MAX(CASE WHEN numbers = 4 THEN value ELSE NULL END) x4

FROM dat1

GROUP BY name')

反对回复 2019-05-20

6 回答
0 关注
1302 浏览

关注

添加回答

0/150

提交

取消

热搜

最近搜索清空

如何将数据从长格式转换为宽格式

如何将数据从长格式转换为宽格式

6 回答

添加回答