web-dev-qa-db-ja.com

非常に大きい値と非常に小さい値の両方を持つデータに最適なグラフ

私は統計分析プロジェクトに取り組んでおり、非常に大きい値と非常に小さい値の両方を持つデータを表示するために棒グラフまたは列グラフを描画する必要があります。たとえばのように:

Number       |        Count
----------------------------
1            |     12
2            |     100
3            |     1
4            |     610
5            |     50

ここでの問題は、一部の行の値が非常に大きくなる可能性があり、単純な棒グラフまたは列グラフに描画すると、これらの数本の棒が実際にグラフ全体を占め、最小値がユーザーにほとんど見えなくなることです。ユーザーがデータにさらに情報を表示するためにそれらにカーソルを合わせるため、これらの小さなバーを表示する必要があります。

円グラフや折れ線グラフなどの最も一般的なチャート/グラフでは、最大値が非常に小さい値を支配し、ほとんど見えないという同じ問題があるようです。

単純なテーブルを作成してそこに値をダンプできることは知っていますが、これはエレガントな解決策ではなく、率直に言って、とてもきれいに見えません。

では、この問題のないグラフを作成するためにどのようなソリューションを採用できると思いますか?この状況に最適なグラフは何でしょうか?小さなデータポイントと大きなデータポイントの両方を明確に示すことができる限り、任意のグラフやチャートを自由に使用できます。

ありがとうございました。

3
CobaltBabyBear

あまりにも分散しているデータに対してうまく機能するタイプのデータがないということです。したがって、ソリューションはグラフのタイプではなく、データへの対数スケールの適用に依存します(表示する元のデータではなく、datavisコンポーネントにフィードするデータ)。ログスケールは、分散を排除します。これが同様の質問に対する私の詳細な回答であり、それがどのように機能し、どのように実行されるかを図で示しています。 プロパティ間に大きなギャップがあるプロパティのグラフ

グラフ(a)にログスケールをデータに適用(b) enter image description here

対数スケールを使用すると、必要なグラフの種類を選択できます。テーブルで作業している場合は、頭の上からヒートマップを提案します。リストの場合、棒グラフの方が適しています。ただし、バブルダイアグラムまたは円グラフを使用することもできます。実際には、データとその組織が要求するすべてのものを使用できます。

ヒートマップ: enter image description here

4
Zoe K

データの両方の列が必要ですか?そうでなければ、非線形バブルチャートは次のように機能します 20th Century Death bubble chart

1
Julia Rezsnyak

それらを何らかの形または形のドットの山として表す

enter image description here

0
Alex Debkaliuk