web-dev-qa-db-ja.com

データをグループ化し、複数のラインをプロット

このデータセットのRに複数の行をプロットしたい:(x = Year、y = Value)

School_ID   Year    Value
A           1998    5
B           1998    10
C           1999    15
A           2000    7
B           2005    15

各学校には異なる年のデータがあります。学校ごとに1行が必要です。

20
dani

いくつかのデータを作成しましょう:

dd = data.frame(School_ID = c("A", "B", "C", "A", "B"),
  Year = c(1998, 1998, 1999, 2000, 2005),
  Value = c(5, 10, 15, 7, 15))

次に、ベースグラフィックスでプロットを作成するために、1つのグループの初期プロットを作成します。

plot(dd$Year[dd$School_ID=="A"], dd$Value[dd$School_ID=="A"], type="b",
     xlim=range(dd$Year), ylim=range(dd$Value))

次に、行を繰り返し追加します。

lines(dd$Year[dd$School_ID=="B"], dd$Value[dd$School_ID=="B"], col=2, type="b")
lines(dd$Year[dd$School_ID=="C"], dd$Value[dd$School_ID=="C"], col=3, type="b")

type="b"を使用して、ポイントとラインを表示しました。

代替、ggplot2を使用:

require(ggplot2)
##The values Year, Value, School_ID are
##inherited by the geoms
ggplot(dd, aes(Year, Value,colour=School_ID)) + 
    geom_line() + 
    geom_point()
28
csgillespie

これは、あなたの望むことですか? _group = School_id_が必要で、ggplot2に各学校の個別の行をプロットするように指示します。 1998年から2005年までのすべての年を水平軸に含める場合は、x = factor(year)factorを削除します

_  library(ggplot2)

df = read.table(text = "School_id Year Value 
 A           1998    5
 B           1998    10
 C           1999    15
 A           2000    7
 B           2005    15", sep = "", header = TRUE)

ggplot(data = df, aes(x = factor(Year), y = Value, color = School_id)) +       
  geom_line(aes(group = School_id)) + geom_point()
_
14
Sandy Muspratt

ベースRのプロット関数はグループ化をサポートしていないため、グループを1つずつ表示する必要があります。 GGPLOTはグループ化をうまく処理します。また、個別のグループをプロットできるTrellis XYPLOTを見ることをお勧めします。

これは、Trellisを使用して基本的なグループ化されたラインプロットを作成する方法です。

library(lattice)
rm(list = ls())     # clear objects  
graphics.off()      # close graphics windows   

test = data.frame(x =  rep(1:3, each = 2),
                  group =  rep(c("Group 1","Group 2"),3),
                  y=   c(22,8,11,4,7,5)
                 )
xyplot(y~x,
       type="b",
       group=group,
       data=test,
       auto.key =list(
         points = FALSE, 
         columns=2,
         lines = TRUE)
)
4
Max C