web-dev-qa-db-ja.com

箱ひげ図にウィスカの端を置く

boxplot関数が自動的に与えるように、ひげの端に垂直線を配置したいと思います。

40
user1762299

ヒントがありますが、@ Rolandによって実装されていないため、stat_boxplotを使用してこれを実装できます。 _boxplotを2回呼び出すトリックは、呼び出しの1つに対してgeomerrorbarに設定することです。

Rはペンと紙のアプローチを使用するため、最初にエラーバーを実装してから、従来のボックスプロットを上に描画することをお勧めします。

@Rolandのダミーデータdfを使用する

ggplot(df, aes(x=cond, y = value))  + 
 stat_boxplot(geom ='errorbar') + 
 geom_boxplot() # shorthand for  stat_boxplot(geom='boxplot')

enter image description here

stat_boxplot?stat_boxplot)のヘルプは、data.frameに計算され保存されたさまざまな値の詳細を示します。

53
mnel

ウィスカの行のサイズを変更するには、関数内で引数width = 0.5を使用できます:stat_boxplot

set.seed(42)
df <- data.frame(cond = factor(rep(c("A", "B"), each = 500)), 
                 value = c(rnorm(500, mean = 1, sd = 0.2), 
                           rnorm(500, mean = 1.5, sd = 0.1))) 

library(ggplot2)
ggplot(df, aes(x = cond, y = value)) +
       stat_boxplot(geom = "errorbar", width = 0.5) +  
       geom_boxplot() 

enter image description here

23
mpalanco

ウィスカの終了を計算するためにstat_boxplotを使用することは可能かもしれませんが、私はggplot2ウィザードでは十分ではないので、そのためにベース関数を使用します。

set.seed(42)
df <- data.frame(cond = factor( rep(c("A","B"), each=500) ), 
                 value = c(rnorm(500,mean=1,sd=0.2),rnorm(500, mean=1.5,sd=0.1)))


whisk <- function(df,cond_col=1,val_col=2) {
  require(reshape2)
  condname <- names(df)[cond_col]
  names(df)[cond_col] <- "cond" 
  names(df)[val_col] <- "value"
  b <- boxplot(value~cond,data=df,plot=FALSE)
  df2 <- cbind(as.data.frame(b$stats),c("min","lq","m","uq","max"))
  names(df2) <- c(levels(df$cond),"pos")
  df2 <- melt(df2,id="pos",variable.name="cond")
  df2 <- dcast(df2,cond~pos)  
  names(df2)[1] <- condname
  df2
}



library(ggplot2)

plot1 <- ggplot(df, aes(x=cond)) 
plot1 <- plot1 + geom_errorbar(aes(ymin=min,ymax=max),data=whisk(df),width = 0.5)
plot1 <- plot1 + geom_boxplot(aes(y=value))
plot1

boxplot with horizontal at whisker ends

7
Roland