合并两个数据帧,其中一个数据帧包含额外的行
问题描述:
我有两个数据帧,其中两个数据帧都有一个公共列。其中一个数据框有一个额外的行。合并两个数据帧,其中一个数据帧包含额外的行
> df1
type x y
1 A 10 417
2 B 2 575
3 C 3 14
4 D 944 205
5 E 44 87
6 F 355 883
7 G 73 150
> df2
X1 X2 X3 X4 X5 X6 term
1 9 28 3 34 5 39 B
2 43 7 39 41 46 32 C
3 17 30 0 27 0 9 D
4 42 32 1 10 26 49 E
5 21 17 34 28 35 12 F
6 16 10 18 25 2 0 G
我想列的x,y追加从DF1而插入包含term
A,而对于各列的其余部分引入NA
行到DF2。
的目标是获得如下:
X1 X2 X3 X4 X5 X6 x y term
NA NA NA NA NA NA 10 417 A
9 28 3 34 5 39 2 575 B
43 7 39 41 46 32 3 14 C
17 30 0 27 0 9 944 205 D
42 32 1 10 26 49 44 87 E
21 17 34 28 35 12 355 883 F
16 10 18 25 2 0 73 150 G
我尝试使用公共列合并功能term
但没有工作,然后我找到了解决办法
cbindPad <- function(...){
args <- list(...)
n <- sapply(args,nrow)
mx <- max(n)
pad <- function(x, mx){
if (nrow(x) < mx){
nms <- colnames(x)
padTemp <- matrix(NA, mx - nrow(x), ncol(x))
colnames(padTemp) <- nms
if (ncol(x)==0) {
return(padTemp)
} else {
return(rbind(x,padTemp))
}
}
else{
return(x)
}
}
rs <- lapply(args,pad,mx)
return(do.call(cbind,rs))
}
但这并没有工作。
答
使用merge
。请注意,公共列有不同的名称:type
对于df1
和term
对于df2
,因此您应该通过by.x
和by.y
参数将此信息传递到merge
函数。还设置了all=TRUE
。
> merge(df1, df2, by.x="type", by.y="term", all=TRUE)
type x y X1 X2 X3 X4 X5 X6
1 A 10 417 NA NA NA NA NA NA
2 B 2 575 9 28 3 34 5 39
3 C 3 14 43 7 39 41 46 32
4 D 944 205 17 30 0 27 0 9
5 E 44 87 42 32 1 10 26 49
6 F 355 883 21 17 34 28 35 12
7 G 73 150 16 10 18 25 2 0
对不起,我实际上重命名保留相同的列名我想我们可以使用'by.x =“type”,by.y =“type”'它确实有效。必须等待接受为答案:) –
@ Null-Hypothesis,当公共列具有相同的名称时,可以使用'by = type'并去掉by.x = type'和'by.y = type'。见'?merge' –