web-dev-qa-db-ja.com

Pythonで正規累積分布関数の逆数を計算する方法は?

Pythonの正規分布の累積分布関数(CDF)の逆数を計算するにはどうすればよいですか?

どのライブラリを使用する必要がありますか?おそらくシシー?

52
Yueyoum

NORMSINV (コメントに記載)は、標準正規分布のCDFの逆です。 scipyを使用すると、 scipy.stats.norm オブジェクトのppfメソッドでこれを計算できます。頭字語ppf%ポイント関数 を表し、これは 分位数関数 .

In [20]: from scipy.stats import norm

In [21]: norm.ppf(0.95)
Out[21]: 1.6448536269514722

CDFの逆であることを確認します。

In [34]: norm.cdf(norm.ppf(0.95))
Out[34]: 0.94999999999999996

デフォルトでは、norm.ppfはmean = 0とstddev = 1を使用します。これは「標準」正規分布です。 loc引数とscale引数をそれぞれ指定することにより、異なる平均値と標準偏差を使用できます。

In [35]: norm.ppf(0.95, loc=10, scale=2)
Out[35]: 13.289707253902945

scipy.stats.normのソースコードを見ると、ppfメソッドが最終的に scipy.special.ndtri を呼び出していることがわかります。したがって、標準正規分布のCDFの逆数を計算するには、その関数を直接使用できます。

In [43]: from scipy.special import ndtri

In [44]: ndtri(0.95)
Out[44]: 1.6448536269514722
96
# given random variable X (house price) with population muy = 60, sigma = 40
import scipy as sc
import scipy.stats as sct
sc.version.full_version # 0.15.1

#a. Find P(X<50)
sct.norm.cdf(x=50,loc=60,scale=40) # 0.4012936743170763

#b. Find P(X>=50)
sct.norm.sf(x=50,loc=60,scale=40) # 0.5987063256829237

#c. Find P(60<=X<=80)
sct.norm.cdf(x=80,loc=60,scale=40) - sct.norm.cdf(x=60,loc=60,scale=40)

#d. how much top most 5% expensive house cost at least? or find x where P(X>=x) = 0.05
sct.norm.isf(q=0.05,loc=60,scale=40)

#e. how much top most 5% cheapest house cost at least? or find x where P(X<=x) = 0.05
sct.norm.ppf(q=0.05,loc=60,scale=40)
10

Python 3.8以降、標準ライブラリは NormalDist モジュールの一部として statistics オブジェクトを提供します。

逆累積分布関数inv_cdf- cdf )の逆で、分位関数としても知られていますまたはパーセント関数特定のmeanmu)および標準偏差sigma):

from statistics import NormalDist

NormalDist(mu=10, sigma=2).inv_cdf(0.95)
# 13.289707253902943

これは、標準正規分布mu = 0およびsigma = 1)で簡略化できます:

NormalDist().inv_cdf(0.95)
# 1.6448536269514715
2
Xavier Guihot