web-dev-qa-db-ja.com

ファセットラベルを変更する方法

次のggplotコマンドを使用しました。

ggplot(survey, aes(x = age)) + stat_bin(aes(n = nrow(h3), y = ..count.. / n), binwidth = 10)
  + scale_y_continuous(formatter = "percent", breaks = c(0, 0.1, 0.2))
  + facet_grid(hospital ~ .)
  + theme(panel.background = theme_blank())

生産する

alt text

facetラベルを変更しますが、長すぎて見えるため、より短いもの(Hosp 1Hosp 2...など)に変更します。 amp屈(グラフの高さを増やすことはオプションではありません。ドキュメント内のスペースが大きすぎます)。 facet_grid ヘルプページを見ましたが、どうすればよいかわかりません。

199

基になる因子レベル名を次のように変更します。

# Using the Iris data
> i <- iris
> levels(i$Species)
[1] "setosa"     "versicolor" "virginica" 
> levels(i$Species) <- c("S", "Ve", "Vi")
> ggplot(i, aes(Petal.Length)) + stat_bin() + facet_grid(Species ~ .)
111
Vince

データの編集を回避するソリューションは次のとおりです。

レベルがcontrol, test1, test2であるデータフレームのgroup部分がプロットのファセットであるとし、それらの値で名前が付けられたリストを作成します。

hospital_names <- list(
  'Hospital#1'="Some Hospital",
  'Hospital#2'="Another Hospital",
  'Hospital#3'="Hospital Number 3",
  'Hospital#4'="The Other Hospital"
)

次に、「labeller」関数を作成し、facet_grid呼び出しにプッシュします。

hospital_labeller <- function(variable,value){
  return(hospital_names[value])
}

ggplot(survey,aes(x=age)) + stat_bin(aes(n=nrow(h3),y=..count../n), binwidth=10)
 + facet_grid(hospital ~ ., labeller=hospital_labeller)
 ...

これは、データフレームのレベルを使用してhospital_namesリストにインデックスを付け、リストの値(正しい名前)を返します。


これは、ファセット変数が1つしかない場合にのみ機能することに注意してください。 2つのファセットがある場合、ラベラー関数はファセットごとに異なる名前ベクトルを返す必要があります。次のような方法でこれを行うことができます。

plot_labeller <- function(variable,value){
  if (variable=='facet1') {
    return(facet1_names[value])
  } else {
    return(facet2_names[value])
  }
}

ここで、facet1_namesおよびfacet2_namesは、ファセットインデックス名(「Hostpital#1」など)でインデックス付けされた名前の事前定義リストです。


Edit:上記の方法は、ラベル作成者が知らない変数/値の組み合わせを渡すと失敗します。次のように、未知の変数に対してフェールセーフを追加できます。

plot_labeller <- function(variable,value){
  if (variable=='facet1') {
    return(facet1_names[value])
  } else if (variable=='facet2') {
    return(facet2_names[value])
  } else {
    return(as.character(value))
  }
}

ファセットとマージン= TRUEでggplotのstrip.textラベルを変更する方法 から適応された回答


編集:警告:このメソッドを使用してcharacter列でファセットを作成する場合、間違ったラベルを取得している可能性があります。 このバグレポート をご覧ください。 ggplot2の最近のバージョンで修正されました。

260
naught101

@ naught101によって与えられたものの精神にある別のソリューションがありますが、シンプルであり、最新バージョンのggplot2に警告をスローしません。

基本的に、最初に名前付き文字ベクトルを作成します

hospital_names <- c(
                    `Hospital#1` = "Some Hospital",
                    `Hospital#2` = "Another Hospital",
                    `Hospital#3` = "Hospital Number 3",
                    `Hospital#4` = "The Other Hospital"
                    )

そして、@ naught101で指定されたコードの最後の行を

... + facet_grid(hospital ~ ., labeller = as_labeller(hospital_names))

お役に立てれば。

182
mbiron

Ggplot2バージョン2.2.1を使用してfacet_grid(yfacet~xfacet)でどのように実行したかを以下に示します。

facet_grid(
    yfacet~xfacet,
    labeller = labeller(
        yfacet = c(`0` = "an y label", `1` = "another y label"),
        xfacet = c(`10` = "an x label", `20` = "another x label")
    )
)

これにはas_labeller()の呼び出しが含まれていないことに注意してください。これは私がしばらく苦労したものです。

このアプローチは、ヘルプページの最後の例 ラベル付け機能への強制 に触発されています。

23
bovender

hospitalroomの2つのファセットがあるが、1つだけの名前を変更する場合は、次を使用できます。

facet_grid( hospital ~ room, labeller = labeller(hospital = as_labeller(hospital_names)))

(naught101の答えのように)ベクトルベースのアプローチを使用して2つのファセットの名前を変更するには、次のようにします。

facet_grid( hospital ~ room, labeller = labeller(hospital = as_labeller(hospital_names),
                                                 room = as_labeller(room_names)))
22
domi

このソリューションは@domiに非常に近いものですが、最初の4文字と最後の数字を取得して名前を短くするように設計されています。

library(ggplot2)

# simulate some data
xy <- data.frame(hospital = rep(paste("Hospital #", 1:3, sep = ""), each = 30),
                 value = rnorm(90))

shortener <- function(string) {
  abb <- substr(string, start = 1, stop = 4) # fetch only first 4 strings
  num <- gsub("^.*(\\d{1})$", "\\1", string) # using regular expression, fetch last number
  out <- paste(abb, num) # put everything together
  out
}

ggplot(xy, aes(x = value)) +
  theme_bw() +
  geom_histogram() +
  facet_grid(hospital ~ ., labeller = labeller(hospital = shortener))

enter image description here

8
Roman Luštrik

このソリューションは、ggplotが実際に変数に含まれるよりも少ない要因を示す場合にはうまく機能しないことに注意してください(たとえば、サブセット化した場合に発生する可能性があります)。

 library(ggplot2)
 labeli <- function(variable, value){
  names_li <- list("versicolor"="versi", "virginica"="virg")
  return(names_li[value])
 }

 dat <- subset(iris,Species!="setosa")
 ggplot(dat, aes(Petal.Length)) + stat_bin() + facet_grid(Species ~ ., labeller=labeli)

単純な解決策(names_liにすべての未使用の因子を追加するのは面倒な場合があります)は、元のデータセットまたはlabbeler関数のいずれかでdroplevels()を使用して未使用の因子を削除することです。

labeli2 <- function(variable, value){
  value <- droplevels(value)
  names_li <- list("versicolor"="versi", "virginica"="virg")
  return(names_li[value])
}

dat <- subset(iris,Species!="setosa")
ggplot(dat, aes(Petal.Length)) + stat_bin() + facet_grid(Species ~ ., labeller=labeli2)
8
Matifou

facet_wrapfacet_gridは、引数としてifelseからの入力も受け入れます。したがって、ファセットに使用される変数が論理的な場合、解決策は非常に簡単です。

facet_wrap(~ifelse(variable, "Label if true", "Label if false"))

変数にさらにカテゴリがある場合、ifelseステートメントは nested である必要があります。

副作用として、ggplot呼び出し内でグループの作成をファセットすることもできます。

5
lillemets

引数としてvariable, valueを使用したラベラー関数の定義は機能しません。また、式を使用する場合は、関数の引数がdata.frameであるため、lapplyを使用する必要があり、単にarr[val]を使用することはできません。

このコードは機能しました:

libary(latex2exp)
library(ggplot2)
arr <- list('virginica'=TeX("x_1"), "versicolor"=TeX("x_2"), "setosa"=TeX("x_3"))
mylabel <- function(val) { return(lapply(val, function(x) arr[x])) }
ggplot(iris, aes(x=Sepal.Length, y=Sepal.Width)) + geom_line() + facet_wrap(~Species, labeller=mylabel)
3
reox

数学記号、上付き文字、下付き文字、括弧/括弧などを解析する@domiに似た別のソリューションを追加します。

library(tidyverse)
theme_set(theme_bw(base_size = 18))

### create separate name vectors
# run `demo(plotmath)` for more examples of mathematical annotation in R
am_names <- c(
  `0` = "delta^{15}*N-NO[3]^-{}",
  `1` = "sqrt(x,y)"
)

# use `scriptstyle` to reduce the size of the parentheses &
# `bgroup` to make adding `)` possible 
cyl_names <- c(
  `4` = 'scriptstyle(bgroup("", a, ")"))~T~-~5*"%"',
  `6` = 'scriptstyle(bgroup("", b, ")"))~T~+~10~degree*C',
  `8` = 'scriptstyle(bgroup("", c, ")"))~T~+~30*"%"'
)

ggplot(mtcars, aes(wt, mpg)) + 
  geom_jitter() +
  facet_grid(am ~ cyl,
             labeller = labeller(am  = as_labeller(am_names,  label_parsed),
                                 cyl = as_labeller(cyl_names, label_parsed))
             ) +
  geom_text(x = 4, y = 25, size = 4, Nudge_y = 1,
            parse = TRUE, check_overlap = TRUE,
            label = as.character(expression(paste("Log"["10"], bgroup("(", frac("x", "y"), ")")))))

### OR create new variables then assign labels directly
# reverse facet orders just for fun
mtcars <- mtcars %>% 
  mutate(am2  = factor(am,  labels = am_names),
         cyl2 = factor(cyl, labels = rev(cyl_names), levels = rev(attr(cyl_names, "names")))
  )

ggplot(mtcars, aes(wt, mpg)) + 
  geom_jitter() +
  facet_grid(am2 ~ cyl2,
             labeller = label_parsed) +
  annotate("text", x = 4, y = 30, size = 5,
           parse = TRUE, 
           label = as.character(expression(paste("speed [", m * s^{-1}, "]"))))

reprexパッケージ (v0.2.1.9000)によって2019-03-30に作成

3
Tung

他のすべてのソリューションはこれを行うのに本当に役立つと思いますが、さらに別の方法があります。

私が想定し:

  • dplyrパッケージをインストールしました。これには、便利なmutateコマンドがあります。
  • データセットの名前はsurveyです。

    調査%>%mutate(Hosp1 = Hospital1、Hosp2 = Hospital2、........)

このコマンドを使用すると、列の名前を変更できますが、他のすべての列は保持されます。

次に、同じfacet_wrapを実行します。これで問題ありません。

3
son520804

投稿にコメントすることはまだ許可されていないので、これを Vinceの回答 および son520804の回答 の補遺として個別に投稿しています。クレジットは彼らに行きます。

Son520804:

アイリスデータの使用:

私が想定し:
dplyrパッケージをインストールしました。これには便利なmutateコマンドがあり、データセットの名前はsurveyです。 survey %>% mutate(Hosp1 = Hospital1, Hosp2 = Hospital2,........)このコマンドは、列の名前を変更するのに役立ちますが、他のすべての列は保持されます。次に、同じfacet_wrapを実行します。これで問題ありません。

虹彩のVinceの例とson520804の部分コードを使用して、mutate関数を使用してこれを行い、元のデータセットに触れることなく簡単な解決策を達成しました。トリックは、代用名ベクトルを作成し、パイプ内でmutate()を使用してファセット名を一時的に修正することです。

i <- iris

levels(i$Species)
[1] "setosa"     "versicolor" "virginica"

new_names <- c(
  rep("Bristle-pointed iris", 50), 
  rep("Poison flag iris",50), 
  rep("Virginia iris", 50))

i %>% mutate(Species=new_names) %>% 
ggplot(aes(Petal.Length))+
    stat_bin()+
    facet_grid(Species ~ .)

この例では、i $ Speciesのレベルがnew_namesベクトルに含まれる対応する共通名に一時的に変更されていることがわかります。含む行

mutate(Species=new_names) %>%

簡単に削除して、元の名前を明らかにすることができます。

注意事項:これは、new_nameベクトルが正しく設定されていない場合、名前にエラーを簡単に引き起こす可能性があります。おそらく、変数文字列を置き換えるために別の関数を使用する方がはるかにきれいです。元のデータセットの順序と一致させるには、new_nameベクトルをさまざまな方法で繰り返す必要がある場合があることに注意してください。これが正しく達成されていることをダブルチェックおよびトリプルチェックしてください。

3

基になるデータを変更せずに変更する最も簡単な方法は次のとおりです。

1)as_labeller関数を使用してオブジェクトを作成します各デフォルト値にバック目盛りを追加

hum.names <- as_labeller(c(`50` = "RH% 50", `60` = "RH% 60",`70` = "RH% 70", `80` = "RH% 80",`90` = "RH% 90", `100` = "RH% 100")) #Necesarry to put RH% into the facet labels

2)GGplotに追加します。

ggplot(dataframe, aes(x=Temperature.C,y=fit))+geom_line()+ facet_wrap(~Humidity.RH., nrow=2,labeller=hum.names)
2
Leinfloyd

基になるデータを変更せずに同じ目標を達成する別の方法があります。

ggplot(transform(survey, survey = factor(survey,
        labels = c("Hosp 1", "Hosp 2", "Hosp 3", "Hosp 4"))), aes(x = age)) +
  stat_bin(aes(n = nrow(h3),y=..count../n), binwidth = 10) +
  scale_y_continuous(formatter = "percent", breaks = c(0, 0.1, 0.2)) +
  facet_grid(hospital ~ .) +
  opts(panel.background = theme_blank())

上記で行ったことは、元のデータフレーム内の因子のラベルを変更することであり、それが元のコードと比較した唯一の違いです。

2
ytu

Naught101の答えを拡張するだけ-クレジットは彼に行きます

plot_labeller <- function(variable,value, facetVar1='<name-of-1st-facetting-var>', var1NamesMapping=<pass-list-of-name-mappings-here>, facetVar2='', var2NamesMapping=list() )
{
  #print (variable)
  #print (value)
  if (variable==facetVar1) 
    {
      value <- as.character(value)
      return(var1NamesMapping[value])
    } 
  else if (variable==facetVar2) 
    {
      value <- as.character(value)
      return(var2NamesMapping[value])
    } 
  else 
    {
      return(as.character(value))
    }
}

あなたがしなければならないことは、名前から名前へのマッピングでリストを作成することです

clusteringDistance_names <- list(
  '100'="100",
  '200'="200",
  '300'="300",
  '400'="400",
  '600'="500"
)

新しいデフォルト引数でplot_labeller()を再定義します:

plot_labeller <- function(variable,value, facetVar1='clusteringDistance', var1NamesMapping=clusteringDistance_names, facetVar2='', var1NamesMapping=list() )

その後:

ggplot() + 
  facet_grid(clusteringDistance ~ . , labeller=plot_labeller) 

または、必要なラベル変更ごとに専用の関数を作成できます。

2
user4786271

これは私のために働いています。

因子を定義する:

hospitals.factor<- factor( c("H0","H1","H2") )

そして、ggplot()で使用します:

facet_grid( hospitals.factor[hospital] ~ . )
1
Hernán Castelo

Hospitalベクトルの特定のレベルを変更しようとしましたか?

levels(survey$hospital)[levels(survey$hospital) == "Hospital #1"] <- "Hosp 1"
levels(survey$hospital)[levels(survey$hospital) == "Hospital #2"] <- "Hosp 2"
levels(survey$hospital)[levels(survey$hospital) == "Hospital #3"] <- "Hosp 3"
1
philiporlando