web-dev-qa-db-ja.com

ベクトル内のxの値を持つ要素の数を数える

数のベクトルがあります。

numbers <- c(4,23,4,23,5,43,54,56,657,67,67,435,
         453,435,324,34,456,56,567,65,34,435)

x がベクトルに現れる回数をRにカウントさせるにはどうすればいいですか?

353
RQuestions

table()を使えます。

> a <- table(numbers)
> a
numbers
  4   5  23  34  43  54  56  65  67 324 435 453 456 567 657 
  2   1   2   2   1   1   2   1   2   1   3   1   1   1   1 

それからあなたはそれをサブセット化することができます:

> a[names(a)==435]
435 
  3

あるいは、それを使って作業する方が快適な場合は、data.frameに変換します。

> as.data.frame(table(numbers))
   numbers Freq
1        4    2
2        5    1
3       23    2
4       34    2
...
446
Shane

最も直接的な方法はsum(numbers == x)です。

numbers == xは、xが発生するすべての位置でTRUEとなる論理ベクトルを作成します。sumingの場合、論理ベクトルはTRUEに1、FALSEから0に変換されます。

ただし、浮動小数点数には、sum(abs(numbers - x) < 1e-6)のようなものを使用することをお勧めします。

236
hadley

私はおそらくこのようなことをするだろう

length(which(numbers==x))

しかし、本当に、もっと良い方法は

table(numbers)
48
Jesse

plyrパッケージからのcount(numbers)もあります。私の意見ではtableよりずっと便利です。

35
geotheory

私の推奨する解決策は値(ラベル、あなたの例ではrle)とその値が順番に現れた回数を表す長さを返すxを使うことです。

rlesortを組み合わせることで、任意の値が出現した回数を数えるための非常に速い方法があります。これは、より複雑な問題に役立ちます。

例:

> numbers <- c(4,23,4,23,5,43,54,56,657,67,67,435,453,435,324,34,456,56,567,65,34,435)
> a <- rle(sort(numbers))
> a
  Run Length Encoding
    lengths: int [1:15] 2 1 2 2 1 1 2 1 2 1 ...
    values : num [1:15] 4 5 23 34 43 54 56 65 67 324 ...

必要な値が表示されない場合、または後でその値を保存する必要がある場合は、adata.frameにします。

> b <- data.frame(number=a$values, n=a$lengths)
> b
    values n
 1       4 2
 2       5 1
 3      23 2
 4      34 2
 5      43 1
 6      54 1
 7      56 2
 8      65 1
 9      67 2
 10    324 1
 11    435 3
 12    453 1
 13    456 1
 14    567 1
 15    657 1

1つの値の頻度ではなくすべての値の頻度を知りたいということはめったにありません。また、rleがそれらをすべてカウントして格納するための最も簡単な方法のようです。

31
JBecker

そのためのRの標準関数があります

tabulate(numbers)

16
Sergej Andrejev
numbers <- c(4,23,4,23,5,43,54,56,657,67,67,435 453,435,324,34,456,56,567,65,34,435)

> length(grep(435, numbers))
[1] 3


> length(which(435 == numbers))
[1] 3


> require(plyr)
> df = count(numbers)
> df[df$x == 435, ] 
     x freq
11 435    3


> sum(435 == numbers)
[1] 3


> sum(grepl(435, numbers))
[1] 3


> sum(435 == numbers)
[1] 3


> tabulate(numbers)[435]
[1] 3


> table(numbers)['435']
435 
  3 


> length(subset(numbers, numbers=='435')) 
[1] 3
9
ishandutta2007

これは速くて汚い方法の1つです。

x <- 23
length(subset(numbers, numbers==x))
8
JD Long

その後の出現回数を数えたい場合は、sapply関数を利用できます。

index<-sapply(1:length(numbers),function(x)sum(numbers[1:x]==numbers[x]))
cbind(numbers, index)

出力:

        numbers index
 [1,]       4     1
 [2,]      23     1
 [3,]       4     2
 [4,]      23     2
 [5,]       5     1
 [6,]      43     1
 [7,]      54     1
 [8,]      56     1
 [9,]     657     1
[10,]      67     1
[11,]      67     2
[12,]     435     1
[13,]     453     1
[14,]     435     2
[15,]     324     1
[16,]      34     1
[17,]     456     1
[18,]      56     2
[19,]     567     1
[20,]      65     1
[21,]      34     2
[22,]     435     3
8
Berny

次の行であなたが望むものに番号を変えることができます

length(which(numbers == 4))

namesと比較せずにtableを使う:

numbers <- c(4,23,4,23,5,43,54,56,657,67,67,435)
x <- 67
numbertable <- table(numbers)
numbertable[as.character(x)]
#67 
# 2 

tableは、異なる要素の数を数回使用しているときに便利です。カウントが1つだけ必要な場合は、sum(numbers == x)を使用してください。

3
pomber

もう1つ便利な方法があります。

numbers <- c(4,23,4,23,5,43,54,56,657,67,67,435,453,435,324,34,456,56,567,65,34,435)
(s<-summary (as.factor(numbers)))

これはデータセットを因子に変換し、そしてsummary()はコントロールの合計(ユニークな値のカウント)を与えます。

出力は以下のとおりです。

4   5  23  34  43  54  56  65  67 324 435 453 456 567 657 
2   1   2   2   1   1   2   1   2   1   3   1   1   1   1 

必要に応じてこれをデータフレームとして保存できます。

as.data.frame(cbind(数=名前、Freq = s)、stringsAsFactors = F、row.names = 1:長さ)

ここでrow.namesは行名の名前変更に使われています。 row.namesを使用せずに、sの列名が新しいデータフレームの行名として使用されます。

出力は以下のとおりです。

     Number Freq
1       4    2
2       5    1
3      23    2
4      34    2
5      43    1
6      54    1
7      56    2
8      65    1
9      67    2
10    324    1
11    435    3
12    453    1
13    456    1
14    567    1
15    657    1
2
Akash

特定の要素を数える方法はいくつかあります

library(plyr)
numbers =c(4,23,4,23,5,43,54,56,657,67,67,435,453,435,7,65,34,435)

print(length(which(numbers==435)))

#Sum counts number of TRUE's in a vector 
print(sum(numbers==435))
print(sum(c(TRUE, FALSE, TRUE)))

#count is present in plyr library 
#o/p of count is a DataFrame, freq is 1 of the columns of data frame
print(count(numbers[numbers==435]))
print(count(numbers[numbers==435])[['freq']])
1
Therii

これはouterを使って等式の行列を取得し、続いてrowSumsを取得することで、明らかな意味で実行できます。
同じデータセット内にカウントとnumbersを含めるために、まずdata.frameが作成されます。入力と出力を別々にしたい場合は、このステップは不要です。

df <- data.frame(No = numbers)
df$count <- rowSums(outer(df$No, df$No, FUN = `==`))
0
GWD