web-dev-qa-db-ja.com

Rの組み込みデータセットのリストを取得するにはどうすればよいですか?

誰かが組み込みデータセットとその依存パッケージのリストを取得する方法を助けてくれますか?

32
mockash

Rに含まれるデータセットを見つける方法はいくつかあります。

1:data()を使用すると、ロードされたすべてのパッケージのデータセットのリストが表示されます(datasetsパッケージのデータセットだけでなく)。データセットはパッケージごとに並べられます

2:data(package = .packages(all.available = TRUE))を使用すると、コンピューターで利用可能なパッケージ(つまり、ロードされていないパッケージ)のすべてのデータセットのリストが表示されます。

data(package = "packagename")を使用すると、その特定のパッケージのデータセットが提供されるため、data(package = "plyr")plyrパッケージ内のデータセットを提供します


データセットがどのパッケージにあるかを知りたい場合(例:acmeデータセット)、次のことができます:

dat <- as.data.frame(data(package = .packages(all.available = TRUE))$results)
dat[dat$Item=="acme", c(1,3,4)]

与えるもの:

    Package Item                  Title
107    boot acme Monthly Excess Returns
38
Jaap

使用可能なデータセットの構造を知る必要があることも多いので、 misc packagedataStrを作成しました。

dataStr <- function(package="datasets", ...)
  {
  d <- data(package=package, envir=new.env(), ...)$results[,"Item"]
  d <- sapply(strsplit(d, split=" ", fixed=TRUE), "[", 1)
  d <- d[order(tolower(d))]
  for(x in d){ message(x, ":  ", class(get(x))); message(str(get(x)))}
  }
dataStr()

コンソールの出力は非常に長いことに注意してください。

これは出力のタイプです。

[...]

warpbreaks:  data.frame
'data.frame':   54 obs. of  3 variables:
 $ breaks : num  26 30 54 25 70 52 51 26 67 18 ...
 $ wool   : Factor w/ 2 levels "A","B": 1 1 1 1 1 1 1 1 1 1 ...
 $ tension: Factor w/ 3 levels "L","M","H": 1 1 1 1 1 1 1 1 1 2 ...

WorldPhones:  matrix
 num [1:7, 1:7] 45939 60423 64721 68484 71799 ...
 - attr(*, "dimnames")=List of 2
  ..$ : chr [1:7] "1951" "1956" "1957" "1958" ...
  ..$ : chr [1:7] "N.Amer" "Europe" "Asia" "S.Amer" ...

WWWusage:  ts
 Time-Series [1:100] from 1 to 100: 88 84 85 85 84 85 83 85 88 89 ...

Edit:より有益な出力を取得し、アンロードされたパッケージまたは検索パス上のすべてのパッケージに使用するには、修正されたオンラインバージョンを使用してください

source("https://raw.githubusercontent.com/brry/berryFunctions/master/R/dataStr.R")
2

以下は、Vincent Arel-Bundock教授が管理している包括的なRパッケージデータセットリストです。 https://vincentarelbundock.github.io/Rdatasets/

Rdatasetsは、統計ソフトウェア環境Rおよびその一部のアドオンパッケージと共に配布されていた1200以上のデータセットのコレクションです。目標は、これらのデータを教育および統計ソフトウェア開発のためにより広くアクセス可能にすることです。

2
Ayşe Nur

走る

help(package = "datasets")

r Studioコンソールで、利用可能なすべてのデータセットを右側の整頓された[ヘルプ]タブで取得します。

0
Igor Micev