web-dev-qa-db-ja.com

Rの箱ひげ図の下位および上位の四分位数

私が持っています

_X=c(20 ,18, 34, 45, 30, 51, 63, 52, 29, 36, 27, 24)
_

boxplotを使用して、quantile(X,0.25)quantile(X,0.75)をプロットしようとしていますが、これは実際にはRの箱ひげ図の同じ下四分位数と同じ上四分位数ではありません

_boxplot(X)
abline(h=quantile(X,0.25),col="red",lty=2)
abline(h=quantile(X,0.75),col="red",lty=2)
_

enter image description here 理由を知っていますか?

8
Math

ボックスの値はヒンジと呼ばれ、四分位数(quantile(x, c(0.25, .075))によって計算される)と一致する場合がありますが、計算方法は異なります。

?boxplot.statsから:

2つの「ヒンジ」は、第1と第3の四分位数のバージョンです。つまり、quantile(x、c(1,3)/ 4)に近くなります。ヒンジは、奇数n(n <-length(x))の四分位数に等しく、偶数nの場合は異なります。四分位数はn %% 4 == 1(n = 1 mod 4)の観測値に等しいだけですが、ヒンジはn %% 4 == 2(n = 2 mod 4)の場合も同様で、2つの真ん中にあります。そうでなければ観察。

値が奇数の観測値と一致することを確認するには、次のコードを試してください。

set.seed(1234)
x <- rnorm(9)

boxplot(x)
abline(h=quantile(x, c(0.25, 0.75)), col="red")

enter image description here

11
lmo

quantileではなくboxplotではtype =引数を使用して、サンプル変位値を計算する方法を指定できます。ただし、CRANにはRパッケージ qboxplot があり、これにはqboxplotとも呼ばれる関数(したがってqboxplot::qboxplot)が含まれており、 qtype =引数を使用した変位値の計算方法。

0
Thomas Farrar