web-dev-qa-db-ja.com

重複する2つ以上のデータポイントの視覚化(ggplot R)

色分けされたデータポイントを含む散布図があります。 2つ以上のデータポイントが重なる場合、色の1つだけが表示されます(凡例の最初の方)。これらの各データポイントはアイテムを表し、スケール上の各ポイントに該当するアイテムを示す必要があります。 R(v.3.3.1)を使用しています。散布図の各ポイントに複数のアイテムがあることを私がどのように示すことができるかについて、誰かが何か提案がありますか?前もって感謝します。

pdf('pedplot.pdf', height = 6, width = 10)
p3 <- ggplot(data=e4, aes(x=e4$domain, y=e4$ped)) + geom_point(aes(color = 
    e4$Database_acronym), size = 3, shape = 17) + 
    labs(x = "Domains", y = "Proportion of Elements per Domain", color = "Data 
    Sources") +
  theme(axis.text.x = element_text(angle = 90, hjust = 1)) 
p3 dev.off();
6
Cate

前述のジッタリングとは別に、またはそれに加えて here、 ポイントを部分的に透明にすることも検討できます。

linecolors <- c("#714C02", "#01587A", "#024E37")
fillcolors <- c("#9D6C06", "#077DAA", "#026D4E")

# partially transparent points by setting `alpha = 0.5`
ggplot(mpg, aes(displ, cty, colour = drv, fill = drv)) +
  geom_point(position=position_jitter(h=0.1, w=0.1),
             shape = 21, alpha = 0.5, size = 3) +
  scale_color_manual(values=linecolors) +
  scale_fill_manual(values=fillcolors) +
  theme_bw()

enter image description here

8
Claus Wilke

ポイントをジッターさせることができます。つまり、少しノイズを追加してオーバーラップを削除します(おそらく最も一般的に使用されるオプションです)。別のオプションは、マーカーを互いの上にプロットしたときにマーカーが表示されるように選択したさまざまなマーカー形状(および小さなサイズ調整)を使用することです。これは、マーカータイプが2つまたは3つしかない場合に機能します。 3番目のオプションは、各色のサイズを変更することです。これも、2色または3色のサイズの場合にのみ可能ですが、サイズの違いはわかりにくいかもしれません。同じ座標の同じ色の複数のポイントを使用できる場合、ジッター(上記の3つのオプションの中で)だけがそれを明らかにします。いずれにせよ、ここに各アプローチの例を示します。

dat = data.frame(x=1:5, y=rep(1:5,3), group=rep(LETTERS[1:3],each=5))
theme_set(theme_bw())

# Jitter
set.seed(3)
ggplot(dat, aes(x,y, colour=group)) +
  geom_point(size=3, position=position_jitter(h=0.15,w=0.15))

# Vary the marker size
ggplot(dat, aes(x,y, colour=group,size=group)) +
  geom_point() +
  scale_color_manual(values=c("red","blue","orange")) +
  scale_size_manual(values=c(5,3,1))

# Vary the marker shape (plus a small size adjustment)
ggplot(dat, aes(x,y, colour=group, size=group, shape=group)) +
  geom_point(stroke=1.5) +
  scale_colour_manual(values=(c("black", "green", "orange"))) +
  scale_shape_manual(values=c(19,17,4)) +
  scale_size_manual(values=c(4,3,3))

enter image description here

5
eipi10

geom_point(aes(color = e4$Database_acronym), position = "jitter", size = 3, shape = 17)を試してください。

これにより、散布図にランダムな変化が少し追加され、過剰なプロットが防止されます。

0
tifu