web-dev-qa-db-ja.com

チャートで「その他」を表示する必要があるしきい値を理解するにはどうすればよいですか?

私は最近、プロジェクトの1つに視覚化を追加することを決定し、それらを視覚化するにはデータポイントが多すぎてすべてが重要ではないことに気付きました。視覚化されているさまざまなデータがたくさんあるため(円グラフとして、別のグラフに切り替えるオプションがあります)、「その他」をオプションとして追加することは理にかなっていると判断しました。ここで問題があります。「その他」が現れるしきい値をどのように定義すればよいですか?特定のパーセンテージを下回るすべてのアイテムの合計のようにする必要がありますか、データポイントの数を確認する必要がありますか、それとも2つの組み合わせが最も効果的ですか?

データの例は次のようになります。

Item  | Number of entries
-------------------------
Ex. 1 | 100
Ex. 2 |  50
Ex. 3 |  10
...   | ...
Ex.N-4|   1
Ex.N-3|   1
Ex.N-2|   1
Ex.N-1|   1
Ex. N |   1

ビューアのコンテキストでは、必要に応じてEx. Nエントリをグループ化してメインエントリをハイライトするために、それらを犠牲にすることは通常問題ありません。

2
d33tah

スライス/データをどのように区別していますか?私は円グラフでは色に基づいたキーであると想定しています(つまり、推測です)。色だけに依存すること以上の標準的なアドバイスは悪いですが、人々は7つ(+または-2)の異なる色を区別するのに苦労しています。したがって、上位6つの選択肢が独自のカテゴリになり、7番目の選択肢が「その他」になります。

http://www.scribblelive.com/blog/2012/03/29/maximum-elements-for-visualization-types/

https://eagereyes.org/techniques/pie-charts

1
mgraham

そして、それらを視覚化するにはデータポイントが多すぎて、すべてが重要ではないことがわかりました。

申し訳ありませんが、間違いだと思います。チャートの外れ値は、ショーを盗んだり、新しい思考の道を示したりするものです。

便宜上データセットを自己編集する以外にも、自己責任で行う必要があります。別の種類のグラフに変更するだけです。バブルまたは散布の方が適している場合があります。

視聴者のコンテキストでは、Exを犠牲にすることは一般的に問題ありません。メインエントリを強調表示するために、必要に応じてグループ化してNエントリ

私は自分のためだけに話すことができます(n = 1のビューアとして)が、n-#が1000であってもそれぞれを確認したいのですが、バブル/散布図が最善の策だと思います。もう一度試してみます私のポイントを正当化する:あなたのn-1 = 1ポイントの1つが時間の経過とともに増加する場合、たとえば、現在はn-1 = 3です。それをグループ化することで、それに気付く能力を失います。

もちろん、2つのグラフを表示するように選択することもできます。完全なデータセットと、最も多くのエントリを含む編集済みの要約されたグラフです。正確にするには、グループ化/しきい値のスキームに注意する必要があります。

しきい値については、同様の属性、この場合はエントリ数でグループ化します。

最後に、私は知識を持っていると思うかもしれませんが、定量的情報の表示の歴史(Tufteを参照)と自分の経験(私は金融株価チャートを作成するために使用していました)間違いを引き起こすことになります。

1
Keno