なぜこれらの数は等しくないのですか？

Question

次のコードは明らかに間違っています。どうしたの？

i <- 0.1 i <- i + 0.05 i ## [1] 0.15 if(i==0.15) cat("i equals 0.15") else cat("i does not equal 0.15") ## i does not equal 0.15

Brian Diggs · Accepted Answer

一般的な（言語に依存しない）理由

すべての数値を IEEE浮動小数点演算（ほとんどすべてのコンピューターが10進数を表現してそれらを使用して計算するために使用する標準）で正確に表すことができるわけではないため、常に期待どおりの結果が得られるとは限りません。これは特に当てはまります。単純な有限小数（0.1や0.05など）の一部の値はコンピューターで正確に表現されないため、それらの算術結果は、「既知の」回答。

これはコンピューター計算の既知の制限であり、いくつかの場所で説明されています。

R FAQには専用の質問があります。 R FAQ 7.31
パトリック・バーンズのRインフェルノこの問題に最初の「円」を捧げます（9ページ以降）
David Goldberg、「すべてのコンピューター科学者が浮動小数点演算について知っておくべきこと」ACM Computing Surveys23、1（1991-03）、5-48 doi> 10.1145/103162.10316 （改訂版も利用可能）
浮動小数点ガイド-すべてのプログラマーが浮動小数点演算について知っておくべきこと
.30000000000000004.com プログラミング言語間で浮動小数点演算を比較します
を含むいくつかのスタックオーバーフローの質問
- なぜ浮動小数点数が不正確なのですか？
- 10進数を正確に2進数で表現できないのはなぜですか
- 浮動小数点演算は壊れていますか？
- 「浮動小数点が不正確」の正規複製（この問題の正規回答に関するメタディスカッション）

スカラーの比較

Rのこれに対する標準的な解決策は、 == ではなく、 all.equal 関数を使用することです。むしろ、all.equalは、相違がある場合に多くの詳細を提供するため、isTRUE(all.equal(...))。

if(isTRUE(all.equal(i,0.15))) cat("i equals 0.15") else cat("i does not equal 0.15")

利回り

i equals 0.15

all.equalの代わりに==を使用するいくつかの例（最後の例は、これが正しく違いを示すことを示すことになっています）。

0.1+0.05==0.15 #[1] FALSE isTRUE(all.equal(0.1+0.05, 0.15)) #[1] TRUE 1-0.1-0.1-0.1==0.7 #[1] FALSE isTRUE(all.equal(1-0.1-0.1-0.1, 0.7)) #[1] TRUE 0.3/0.1 == 3 #[1] FALSE isTRUE(all.equal(0.3/0.1, 3)) #[1] TRUE 0.1+0.1==0.15 #[1] FALSE isTRUE(all.equal(0.1+0.1, 0.15)) #[1] FALSE

同様の質問への回答：から直接コピーされた詳細

発生した問題は、ほとんどの場合、浮動小数点が小数を正確に表現できないため、完全一致が失敗することが頻繁に見つかることです。

あなたが言うとき、Rはわずかにあります：

1.1-0.2 #[1] 0.9 0.9 #[1] 0.9

実際に10進数で考えていることを確認できます。

sprintf("%.54f",1.1-0.2) #[1] "0.900000000000000133226762955018784850835800170898437500" sprintf("%.54f",0.9) #[1] "0.900000000000000022204460492503130808472633361816406250"

これらの数字は異なることがわかりますが、表現は少し扱いにくいです。それらをバイナリ（16進、同等）で見ると、より明確な画像が得られます。

sprintf("%a",0.9) #[1] "0x1.ccccccccccccdp-1" sprintf("%a",1.1-0.2) #[1] "0x1.ccccccccccccep-1" sprintf("%a",1.1-0.2-0.9) #[1] "0x1p-53"

これらは2^-53だけ異なることがわかります。これは、この数値が、値が1に近い2つの数値の表現可能な最小の差であるため重要です。

Rの machine フィールドを調べることで、この最小の表現可能な数がどのコンピューターであるかを知ることができます。

 ?.Machine #.... #double.eps the smallest positive floating-point number x #such that 1 + x != 1. It equals base^ulp.digits if either #base is 2 or rounding is 0; otherwise, it is #(base^ulp.digits) / 2. Normally 2.220446e-16. #.... .Machine$double.eps #[1] 2.220446e-16 sprintf("%a",.Machine$double.eps) #[1] "0x1p-52"

この事実を使用して、差が浮動小数点で表現可能な最小数に近いことをチェックする「ほぼ等しい」関数を作成できます。実際、これはすでに存在します：all.equal。

?all.equal #.... #all.equal(x,y) is a utility to compare R objects x and y testing ‘near equality’. #.... #all.equal(target, current, # tolerance = .Machine$double.eps ^ 0.5, # scale = NULL, check.attributes = TRUE, ...) #....

したがって、all.equal関数は、実際には、数値間の差が2つの仮数間の最小差の平方根であることを確認しています。

このアルゴリズムは、非正規化と呼ばれる非常に小さな数の近くで少しおかしくなりますが、それについて心配する必要はありません。

ベクトルの比較

上記の説明では、2つの単一の値の比較を想定しています。 Rでは、スカラーはなく、ベクトルだけであり、暗黙的なベクトル化は言語の強みです。ベクトルの値を要素ごとに比較するために、以前の原則は保持されますが、実装はわずかに異なります。 ==はベクトル化され（要素ごとの比較を行います）、all.equalはベクトル全体を単一のエンティティとして比較します。

前の例を使用する

a <- c(0.1+0.05, 1-0.1-0.1-0.1, 0.3/0.1, 0.1+0.1) b <- c(0.15, 0.7, 3, 0.15)

==は「期待される」結果を与えず、all.equalは要素ごとに実行しません

a==b #[1] FALSE FALSE FALSE FALSE all.equal(a,b) #[1] "Mean relative difference: 0.01234568" isTRUE(all.equal(a,b)) #[1] FALSE

むしろ、2つのベクトルをループするバージョンを使用する必要があります

mapply(function(x, y) {isTRUE(all.equal(x, y))}, a, b) #[1] TRUE TRUE TRUE FALSE

これの機能的なバージョンが必要な場合、それを書くことができます

elementwise.all.equal <- Vectorize(function(x, y) {isTRUE(all.equal(x, y))})

ちょうどとして呼び出すことができます

elementwise.all.equal(a, b) #[1] TRUE TRUE TRUE FALSE

あるいは、all.equalをさらに多くの関数呼び出しでラップする代わりに、関連するall.equal.numericの内部を複製し、暗黙的なベクトル化を使用できます。

tolerance = .Machine$double.eps^0.5 # this is the default tolerance used in all.equal, # but you can pick a different tolerance to match your needs abs(a - b) < tolerance #[1] TRUE TRUE TRUE FALSE

これはdplyr::nearがとるアプローチです。

これは、浮動小数点数の2つのベクトルが（ペアワイズ）等しいかどうかを比較する安全な方法です。これは==を使用するよりも安全です。

dplyr::near(a, b) #[1] TRUE TRUE TRUE FALSE

Tyler Rinker · Answer

ブライアンのコメント（これが理由です）に追加すると、代わりにall.equalを使用してこれを克服できます。

# i <- 0.1 # i <- i + 0.05 # i #if(all.equal(i, .15)) cat("i equals 0.15
") else cat("i does not equal 0.15
") #i equals 0.15

ここでのジョシュアの警告は、更新されたコードです（ジョシュアに感謝します）：

 i <- 0.1 i <- i + 0.05 i if(isTRUE(all.equal(i, .15))) { #code was getting sloppy &went to multiple lines cat("i equals 0.15
") } else { cat("i does not equal 0.15
") } #i equals 0.15

Hillary Sanders · Answer

これはハックですが、簡単です：

if(round(i, 10)==0.15) cat("i equals 0.15") else cat("i does not equal 0.15")

sbha · Answer

dplyr::near()は、浮動小数点数の2つのベクトルが等しいかどうかをテストするためのオプションです。これは docs の例です：

sqrt(2) ^ 2 == 2 #> [1] FALSE library(dplyr) near(sqrt(2) ^ 2, 2) #> [1] TRUE

この関数には、調整可能なtol = .Machine$double.eps^0.5公差パラメータが組み込まれています。デフォルトのパラメーターは、all.equal()のデフォルトと同じです。

Elias EstatisticsEU · Answer

同様の問題がありました。次のソリューションを使用しました。

@不等間隔のカットに関する解決策を見つけました。 @ Rでラウンド関数を使用しました。オプションを2桁に設定しても、問題は解決しませんでした。

options(digits = 2) cbind( seq( from = 1, to = 9, by = 1 ), cut( seq( from = 1, to = 9, by = 1), c( 0, 3, 6, 9 ) ), seq( from = 0.1, to = 0.9, by = 0.1 ), cut( seq( from = 0.1, to = 0.9, by = 0.1), c( 0, 0.3, 0.6, 0.9 )), seq( from = 0.01, to = 0.09, by = 0.01 ), cut( seq( from = 0.01, to = 0.09, by = 0.01), c( 0, 0.03, 0.06, 0.09 )) )

オプションに基づいた不等間隔の出力（桁= 2）：

 [,1] [,2] [,3] [,4] [,5] [,6] [1,] 1 1 0.1 1 0.01 1 [2,] 2 1 0.2 1 0.02 1 [3,] 3 1 0.3 2 0.03 1 [4,] 4 2 0.4 2 0.04 2 [5,] 5 2 0.5 2 0.05 2 [6,] 6 2 0.6 2 0.06 3 [7,] 7 3 0.7 3 0.07 3 [8,] 8 3 0.8 3 0.08 3 [9,] 9 3 0.9 3 0.09 3 options(digits = 200) cbind( seq( from = 1, to = 9, by = 1 ), cut( round(seq( from = 1, to = 9, by = 1), 2), c( 0, 3, 6, 9 ) ), seq( from = 0.1, to = 0.9, by = 0.1 ), cut( round(seq( from = 0.1, to = 0.9, by = 0.1), 2), c( 0, 0.3, 0.6, 0.9 )), seq( from = 0.01, to = 0.09, by = 0.01 ), cut( round(seq( from = 0.01, to = 0.09, by = 0.01), 2), c( 0, 0.03, 0.06, 0.09 )) )

ラウンド関数に基づく等カット間隔の出力：

 [,1] [,2] [,3] [,4] [,5] [,6] [1,] 1 1 0.1 1 0.01 1 [2,] 2 1 0.2 1 0.02 1 [3,] 3 1 0.3 1 0.03 1 [4,] 4 2 0.4 2 0.04 2 [5,] 5 2 0.5 2 0.05 2 [6,] 6 2 0.6 2 0.06 2 [7,] 7 3 0.7 3 0.07 3 [8,] 8 3 0.8 3 0.08 3 [9,] 9 3 0.9 3 0.09 3

Erdogan CEVHER · Answer

倍精度演算における一般化された比較（ "<="、 "> ="、 "="）：

a <= b：の比較

IsSmallerOrEqual <- function(a,b) { # Control the existence of "Mean relative difference..." in all.equal; # if exists, it results in character, not logical: if ( class(all.equal(a, b)) == "logical" && (a<b | all.equal(a, b))) { return(TRUE) } else if (a < b) { return(TRUE) } else { return(FALSE) } } IsSmallerOrEqual(abs(-2-(-2.2)), 0.2) # TRUE IsSmallerOrEqual(abs(-2-(-2.2)), 0.3) # TRUE IsSmallerOrEqual(abs(-2-(-2.2)), 0.1) # FALSE IsSmallerOrEqual(3,3); IsSmallerOrEqual(3,4); IsSmallerOrEqual(4,3) # TRUE; TRUE; FALSE

a> = bの比較：

IsBiggerOrEqual <- function(a,b) { # Control the existence of "Mean relative difference..." in all.equal; # if exists, it results in character, not logical: if ( class(all.equal(a, b)) == "logical" && (a>b | all.equal(a, b))) { return(TRUE) } else if (a > b) { return(TRUE) } else { return(FALSE) } } IsBiggerOrEqual(3,3); IsBiggerOrEqual(4,3); IsBiggerOrEqual(3,4) # TRUE; TRUE; FALSE

a = bの比較：

IsEqual <- function(a,b) { # Control the existence of "Mean relative difference..." in all.equal; # if exists, it results in character, not logical: if ( class(all.equal(a, b)) == "logical" ) { return(TRUE) } else { return(FALSE) } } IsEqual(0.1+0.05,0.15) # TRUE