web-dev-qa-db-ja.com

Rの複数のデータフレームで同じ機能

私はRを初めて使用するので、これは非常に単純な質問です。私は欲しいものに似たものをたくさん見つけましたが、それだけではありません。基本的に複数のデータフレームがあり、それらすべてで同じ関数を実行したいだけです。 forループは機能する可能性がありますが、データフレームを呼び出すように適切に設定する方法がわかりません。また、Rを使用したラップアプローチが最も好ましいようです。これが重複した質問である場合は、お詫び申し上げます。どんな助けでも大歓迎です!

これが私の単純化された例です:2つのデータフレーム:df1、df2

df1
start stop ID
0     10   x
10    20   y
20    30   z

df2
start stop ID
0     10   a
10    20   b
20    30   c

私が欲しいのは、両方のdfの開始と停止の平均を持つ4番目の列です

df1
start stop ID  Avg
0     10   x    5 
10    20   y    15
20    30   z    25

私はこれで一度に1つのデータフレームを行うことができます:

df1$Avg <- rowMeans(subset(df1, select = c(start, stop)), na.rm = TRUE)

しかし、私はそれをすべてのデータフレームで実行したいと思います。

13
user3272284

データフレームのリストを作成し、lapplyを使用してそれらすべてに関数を適用します。

df.list <- list(df1,df2,...)
res <- lapply(df.list, function(x) rowMeans(subset(x, select = c(start, stop)), na.rm = TRUE))
# to keep the original data.frame also
res <- lapply(df.list, function(x) cbind(x,"rowmean"=rowMeans(subset(x, select = c(start, stop)), na.rm = TRUE)))

その後、lapplyは各データフレームにxとして順次フィードします。

15
JeremyS

それらをリストに入れ、リストに対してrowMeansを実行します。

df1 <- data.frame(x = rep(3, 5), y = seq(1, 5, 1), ID = letters[1:5])
df2 <- data.frame(x = rep(5, 5), y = seq(2, 6, 1), ID = letters[6:10])

lapply(list(df1, df2), function(w) { w$Avg <- rowMeans(w[1:2]); w })

 [[1]]
   x y ID Avg
 1 3 1  a 2.0
 2 3 2  b 2.5
 3 3 3  c 3.0
 4 3 4  d 3.5
 5 3 5  e 4.0

 [[2]]
   x y ID Avg
 1 5 2  f 3.5
 2 5 3  g 4.0
 3 5 4  h 4.5
 4 5 5  i 5.0
 5 5 6  j 5.5
6
Rich Scriven

同じファイルにすべての出力が必要な場合は、これが役立つことがあります。

 df1 <- data.frame(x = rep(3, 5), y = seq(1, 5, 1), ID = letters[1:5])
 df2 <- data.frame(x = rep(5, 5), y = seq(2, 6, 1), ID = letters[6:10])

 z=list(df1,df2)
 df=NULL
 for (i in z) {
 i$Avg=(i$x+i$y)/2
 df<-rbind(df,i)
 print (df)
 }

 > df
   x y ID Avg
1  3 1  a 2.0
2  3 2  b 2.5
3  3 3  c 3.0
4  3 4  d 3.5
5  3 5  e 4.0
6  5 2  f 3.5
7  5 3  g 4.0
8  5 4  h 4.5
9  5 5  i 5.0
10 5 6  j 5.5
3
user3117837