web-dev-qa-db-ja.com

Pythonヒストグラムで対数ビンを持つ方法

私の知る限り、ヒストグラム関数のオプションLog = Trueはy軸のみを参照します。

P.hist(d,bins=50,log=True,alpha=0.5,color='b',histtype='step')

Log10でビンを等間隔にする必要があります。これを行うことができるものはありますか?

70
Brian

logspace()を使用して幾何学的シーケンスを作成し、それをbinsパラメーターに渡します。そして、xaxisのスケールを対数スケールに設定します。

import pylab as pl
import numpy as np

data = np.random.normal(size=10000)
pl.hist(data, bins=np.logspace(np.log10(0.1),np.log10(1.0), 50))
pl.gca().set_xscale("log")
pl.show()

enter image description here

113
HYRY

最も直接的な方法は、以下のように、制限のlog10を計算し、線形間隔のビンを計算してから、10の累乗に戻すことで逆変換することです。

import pylab as pl
import numpy as np

data = np.random.normal(size=10000)

MIN, MAX = .01, 10.0

pl.figure()
pl.hist(data, bins = 10 ** np.linspace(np.log10(MIN), np.log10(MAX), 50))
pl.gca().set_xscale("log")
pl.show()

log10 spaced bins

18
Nimar

次のコードは、ログスケールでbins='auto'を使用する方法を示しています。

import numpy as np
import matplotlib.pyplot as plt

data = 10**np.random.normal(size=500)

_, bins = np.histogram(np.log10(data + 1), bins='auto')
plt.hist(data, bins=10**bins);
plt.gca().set_xscale("log")

chart

10
N. McA.

述べられたことに加えて、これをpandas dataframesで実行すると同様に機能します:

some_column_hist = dataframe['some_column'].plot(bins=np.logspace(-2, np.log10(max_value), 100), kind='hist', loglog=True, xlim=(0,max_value))

ビンの正規化に問題がある可能性があることに注意してください。各ビンは前のものよりも大きいため、プロットする前に周波数を正規化するためにそのサイズで分割する必要があり、私のソリューションもHYRYのソリューションもこれを考慮していないようです。

ソース: https://arxiv.org/pdf/cond-mat/0412004.pdf

0
Alaa Moussawi