如何将长数据帧转换为宽重复数据/重复数据帧?
问题描述:
考虑我有一个数据框在三列长格式。 x
列包含3个变量的名称,y
和z
包含2个等级。有重复测量每个y
变量:如何将长数据帧转换为宽重复数据/重复数据帧?
df <- data.frame(x=c(1:12), y=rep(0:2, 4), z=rep(letters[1:2], 6))
df$y <- as.factor(df$y)
df <- arrange(df, y, z)
df
x y z
1 1 0 a
2 7 0 a
3 4 0 b
4 10 0 b
5 5 1 a
6 11 1 a
7 2 1 b
8 8 1 b
9 3 2 a
10 9 2 a
11 6 2 b
12 12 2 b
我怎样才能得到df_wide
这个样子?
z 0 1 2
a 1 5 3
a 7 11 9
b 4 2 6
b 10 8 12
答
do.call(cbind, lapply(split(df, df$y), function(a)
setNames(object = data.frame(a$x,
row.names = paste0(as.character(a$z), 1:NROW(a))),
nm = a$y[1])))
# 0 1 2
#a1 1 5 3
#a2 7 11 9
#b3 4 2 6
#b4 10 8 12
+0
谢谢!实际上,我有一个dfs列表。这个df是我列表中的一个元素。我如何在列表中实现do.call(...)代码? – datanew
答
从data.table
包装就变成了 “单行程序” 使用dcast()
和rowid()
功能:
library(data.table)
dcast(setDT(df), paste0(z, rowid(y, z)) ~ y, value.var = "x")
z 0 1 2 1: a1 1 5 3 2: a2 7 11 9 3: b1 4 2 6 4: b2 10 8 12
+0
作品!谢谢! – datanew
你能否解释这到底是怎么回事? – mtoto
在df中,column-x是测量值,column-y是3个变量,column-z包含2个级别,并且每个列都具有用于列y变量的重复测量。希望这是明确的:)谢谢@ mtoto – datanew