web-dev-qa-db-ja.com

混合要素を持つリストから要素を抽出する方法

次の要素を含むRのリストがあります。

[[812]]
[1] ""             "668"          "12345_s_at" "667"          "4.899777748" 
[6] "49.53333333"  "10.10930207"  "1.598228663"  "5.087437057" 

[[813]]
[1] ""            "376"         "6789_at"  "375"         "4.899655078"
[6] "136.3333333" "27.82508792" "2.20223398"  "5.087437057"

[[814]]
[1] ""             "19265"        "12351_s_at" "19264"        "4.897730912" 
[6] "889.3666667"  "181.5874908"  "1.846451572"  "5.087437057" 

位置814の3番目の要素を抽出したい場合、list_elem[[814]][3]のようなものでそれらにアクセスできることを知っています。たとえば、12345_s_atなど、すべてのリストの3番目の要素を抽出する必要がありそれらを後から別のリストと比較できるように、ベクトルまたはリストに入れたいです。以下は私のコードです:

elem<-(c(listdata))
lp<-length(elem)
for (i in 1:lp)
{
    newlist<-c(listdata[[i]][3]) ###maybe to put in a vector
    print(newlist)
 }

結果を印刷すると、3番目の要素が取得されますが、次のようになります。

  [1] "1417365_a_at"
  [1] "1416336_s_at"
  [1] "1416044_at"
  [1] "1451201_s_at"

NAを返すため、newlist[3]のようなインデックスを使用してそれらをトラバースすることはできません。私の間違いはどこですか?

24
Layla

各リスト要素の3番目の要素を抽出する場合は、次の操作を実行できます。

List <- list(c(1:3), c(4:6), c(7:9))
lapply(List, '[[', 3)  # This returns a list with only the third element
unlist(lapply(List, '[[', 3)) # This returns a vector with the third element

あなたの例を使用して、あなたができる@GSeeコメントを考慮に入れて:

yourList <- list(c("","668","12345_s_at","667", "4.899777748","49.53333333",
       "10.10930207", "1.598228663","5.087437057"),
     c("","376", "6789_at",  "375",  "4.899655078","136.3333333",
       "27.82508792", "2.20223398",  "5.087437057"),
     c("", "19265", "12351_s_at", "19264", "4.897730912",
       "889.3666667", "181.5874908","1.846451572","5.087437057" ))

sapply(yourList, '[[', 3)
[1] "12345_s_at" "6789_at"    "12351_s_at"

次回、データセットの一部でdputを使用してデータを提供できるため、問題を簡単に再現できます。

44
Jilber Urbina

purrrを使用すると、要素を抽出し、データ型の一貫性を確保できます。

_library(purrr)

listdata <- list(c("","668","12345_s_at","667", "4.899777748","49.53333333",
       "10.10930207", "1.598228663","5.087437057"),
     c("","376", "6789_at",  "375",  "4.899655078","136.3333333",
       "27.82508792", "2.20223398",  "5.087437057"),
     c("", "19265", "12351_s_at", "19264", "4.897730912",
       "889.3666667", "181.5874908","1.846451572","5.087437057" ))

map_chr(listdata, 3)
## [1] "12345_s_at" "6789_at"    "12351_s_at"
_

型の一貫性を強制する他の_map__関数と、map_df()狂気を終わらせるのに役立つdo.call(rbind, …)があります。

10
hrbrmstr

質問に入力したコードを使用したい場合、以下が修正されます。

listdata <- list(c("","668","12345_s_at","667", "4.899777748","49.53333333",
       "10.10930207", "1.598228663","5.087437057"),
     c("","376", "6789_at",  "375",  "4.899655078","136.3333333",
       "27.82508792", "2.20223398",  "5.087437057"),
     c("", "19265", "12351_s_at", "19264", "4.897730912",
       "889.3666667", "181.5874908","1.846451572","5.087437057" ))

v <- character() #creates empty character vector
list_len <- length(listdata)
for(i in 1:list_len)
    v <- c(v, listdata[[i]][3]) #fills the vector with list elements (not efficient, but works fine)

print(v)
[1] "12345_s_at" "6789_at"    "12351_s_at"
1
Marco Demaio