web-dev-qa-db-ja.com

空のデータフレームでデータフレームをバインドする-cbind.fill?

plyrの_rbind.fill_(Hadleyのcbindパッケージ内)のアナログを探していると思います。見ましたが_cbind.fill_はありません。

私がしたいことは次のとおりです:

_#set these just for this example
one_option <- TRUE
diff_option <- TRUE

return_df <- data.frame()

if (one_option) {
    #do a bunch of calculations, produce a data.frame, for simplicity the following small_df
    small_df <- data.frame(a=1, b=2)
    return_df <- cbind(return_df,small_df)
}

if (diff_option) {
    #do a bunch of calculations, produce a data.frame, for simplicity the following small2_df
    small2_df <- data.frame(l="hi there", m=44)
    return_df <- cbind(return_df,small2_df)
}

return_df
_

当然のことながら、これはエラーを生成します:

_Error in data.frame(..., check.names = FALSE) : 
arguments imply differing number of rows: 0, 1
_

私の現在の修正はreturn_df <- data.frame()return_df <- data.frame(dummy=1)で置き換えることで、コードが機能します。次に、最後に_return_df_からダミーを削除します。ダミーを追加して上記のコードを実行すると、

_      dummy a b        l  m
1     1 1 2 hi there 44
_

次に、ダミーを取り除く必要があります。例:

_> return_df[,2:ncol(return_df)]
  a b        l  m
1 1 2 hi there 44
_

これを行う簡単な方法が欠けていると私は確信しています。

編集:私はcbind.fillを探していないと思います。これは、NA値がcbindの後に作成されることを意味しますが、これは私が望むものではありません。

40
Xu Wang

これがバインドの塗りつぶしです。

cbind.fill <- function(...){
    nm <- list(...) 
    nm <- lapply(nm, as.matrix)
    n <- max(sapply(nm, nrow)) 
    do.call(cbind, lapply(nm, function (x) 
        rbind(x, matrix(, n-nrow(x), ncol(x))))) 
}

試してみよう:

x<-matrix(1:10,5,2)
y<-matrix(1:16, 4,4)
z<-matrix(1:12, 2,6)

cbind.fill(x,y)
cbind.fill(x,y,z)
cbind.fill(mtcars, mtcars[1:10,])

これをどこかから盗んだと思います。

ここからストールを編集: [〜#〜] link [〜#〜]

47
Tyler Rinker

私はタイラーの解決策が直接であり、ここで最高だと思いますが、私はすでに持っているrbind.fill()を使用して別の方法を提供します。

require(plyr) # requires plyr for rbind.fill()
cbind.fill <- function(...) {                                                                                                                                                       
  transpoted <- lapply(list(...),t)                                                                                                                                                 
  transpoted_dataframe <- lapply(transpoted, as.data.frame)                                                                                                                         
  return (data.frame(t(rbind.fill(transpoted_dataframe))))                                                                                                                          
} 
12
Max

rowr::cbind.fillの使用

rowr::cbind.fill(df1,df2,fill = NA)
   A B
1  1 1
2  2 2
3  3 3
4  4 4
5  5 5
6 NA 6
5
YOBEN_S

qpcRパッケージのcbind.naがそれを行うことができます。

    install.packages("qpcR")
    library(qpcR)
    qpcR:::cbind.na(1, 1:7)
1
Rasmus Larsen

タイラーの答えを修正することをお勧めします。私の関数では、タイラーのソリューションで発生するように列名を失うことなく、ベクトルを使用したdata.framesおよび/または行列のcbind- ingを許可しています

cbind.fill <- function(...){
  nm <- list(...) 
  dfdetect <- grepl("data.frame|matrix", unlist(lapply(nm, function(cl) paste(class(cl), collapse = " ") )))
  # first cbind vectors together 
  vec <- data.frame(nm[!dfdetect])
  n <- max(sapply(nm[dfdetect], nrow)) 
  vec <- data.frame(lapply(vec, function(x) rep(x, n)))
  if (nrow(vec) > 0) nm <- c(nm[dfdetect], list(vec))
  nm <- lapply(nm, as.data.frame)

  do.call(cbind, lapply(nm, function (df1) 
    rbind(df1, as.data.frame(matrix(NA, ncol = ncol(df1), nrow = n-nrow(df1), dimnames = list(NULL, names(df1))))) )) 
}

cbind.fill(data.frame(idx = numeric()), matrix(0, ncol = 2), 
           data.frame(qwe = 1:3, rty = letters[1:3]), type = "GOOD", mark = "K-5")
#       idx V1 V2 qwe rty type mark
#     1  NA  0  0   1   a GOOD  K-5
#     2  NA NA NA   2   b GOOD  K-5
#     3  NA NA NA   3   c GOOD  K-5
0
inscaven

空のデータフレームに列を追加したいときは、最初にrbindを、後でcbindをするだけのトリックを見つけました。

    newdf <- data.frame()
    # add the first column
    newdf <- rbind(newdf,data.frame("col1"=c("row1"=1,"row2"=2)))
    # add the second column
    newdf <- cbind(newdf,data.frame("col2"=c("row1"=3,"row2"=4)))
    # add more columns
    newdf <- cbind(newdf,data.frame("col3"=c("row1"=5,"row2"=6)))
    # result
    #     col1 col2 col3
    #row1    1    3    5
    #row2    2    4    6

理由はわかりませんが、うまくいきました。

0
zz z

id列を追加してから、mergeを使用できます。

df1 <- mtcars[1:5, 1:2]
#                    mpg cyl id
# Mazda RX4         21.0   6  1
# Mazda RX4 Wag     21.0   6  2
# Datsun 710        22.8   4  3
# Hornet 4 Drive    21.4   6  4
# Hornet Sportabout 18.7   8  5

df2 <- mtcars[6:7, 3:4]
#            disp  hp
# Valiant     225 105
# Duster 360  360 245

#Add id column then merge
df1$id <- seq(nrow(df1)) 
df2$id <- seq(nrow(df2)) 

merge(df1, df2, by = "id", all.x = TRUE, check.names = FALSE)
#   id  mpg cyl disp  hp
# 1  1 21.0   6  225 105
# 2  2 21.0   6  360 245
# 3  3 22.8   4   NA  NA
# 4  4 21.4   6   NA  NA
# 5  5 18.7   8   NA  NA
0
zx8754