
大規模なデータベースクエリの最適化(2500万行以上、max()およびGROUP BYを使用)

私はPostgres 9.3.5を使用していて、データベースに大きなテーブルがあります。現在、2,500万行を超えており、急速に大きくなる傾向があります。次のような簡単なクエリを使用して、特定の行(各_unit_id_ sに最新の_unit_timestamp_のみを含む)を選択しようとしています。

_SELECT unit_id, max(unit_timestamp) AS latest_timestamp FROM all_units GROUP BY unit_id;

インデックスがない場合、このクエリの実行には約35秒かかります。インデックスが定義されている場合(CREATE INDEX partial_idx ON all_units (unit_id, unit_timestamp DESC);)、クエリ時間は約(わずか)19秒に短縮されます。



_CREATE TABLE "all_units" (
"unit_id" int4 NOT NULL,
"unit_timestamp" timestamp(6) NOT NULL,
"lon" float4,
"lat" float4,
"speed" float4,
"status" varchar(255) COLLATE "default"
ALTER TABLE "all_units" ADD PRIMARY KEY ("unit_id", "unit_timestamp");


HashAggregate  (cost=663998.38..664069.73 rows=7135 width=12) (actual time=84715.050..84732.021 rows=11094 loops=1)
  Buffers: shared hit=192 read=286819
  ->  Seq Scan on ais_sorted  (cost=0.00..538335.92 rows=25132492 width=12) (actual time=0.608..41264.196 rows=25132492 loops=1)
        Buffers: shared hit=192 read=286819
Total runtime: 84746.501 ms


クエリはテーブル全体(またはインデックス全体)をスキャンするように強制されます。すべての行couldは別の個別の単位です。プロセスを大幅に短縮する唯一の方法は、使用可能なすべての単位を含む個別のテーブルです。これは、 _all_units_。


  • 再帰CTE
  • 相関サブクエリ


_(unit_id, unit_timestamp)_の主キーの暗黙的なインデックスのみが必要な場合、このクエリは暗黙的な_JOIN LATERAL_を使用してトリックを実行する必要があります。

_SELECT u.unit_id, a.max_ts
FROM unit u
  , (SELECT unit_timestamp AS max_ts
     FROM   all_units
     WHERE  unit_id = u.unit_id
     ORDER  BY unit_timestamp DESC
     LIMIT  1
     ) a;


_SELECT u.unit_id
    , (SELECT unit_timestamp
       FROM   all_units
       WHERE  unit_id = u.unit_id
       ORDER  BY unit_timestamp DESC
       LIMIT  1) AS max_ts
FROM unit u;




テーブルは_tends to get even larger rapidly_なので、 マテリアライズドビュー はおそらくオプションではありません。

別の可能なクエリ手法として_DISTINCT ON_もありますが、元のクエリよりも速くなることはほとんどないため、探しているのはnot the answerです。詳細はこちら:



CREATE INDEX partial_idx ON all_units (unit_id, unit_timestamp DESC);

実際には 部分インデックス ではなく、冗長でもあります。 Postgresは実質的に同じ速度で逆方向にインデックスをスキャンできます。PKは適切に機能します。 Dropこの追加のインデックス。



_CREATE TABLE all_units (
unit_timestamp timestamp,
unit_id int4,
lon     float4,
lat     float4,
speed   float4,
status  varchar(255),   -- might be improved.
PRIMARY KEY (unit_id, unit_timestamp)
  • timestamp(6)はあまり意味がありませんが、実質的には timestamp と実質的に同じであり、すでに最大で6桁の小数部を節約しています。

  • 最初の2列の位置を切り替えて、4バイトのパディングを節約しました。これは、2500万行で最大100 MBになります(正確な結果はstatusによって異なります)。小さいテーブルは通常、すべてに対して高速です。

  • statusがフリーテキストではなく、ある種の標準化されたメモである場合は、もっと安いものに置き換えることができます。 Postgresのvarchar(255)の詳細


サーバーを構成する必要があります。ほとんどの設定は控えめなデフォルトのようです。数百万行のインストールの場合、_shared_buffers_または_work_mem_で1 MBが低いように見えます。また、RAMが十分にある現代のシステムでは、_random_pare_cost = 4_は高すぎます。マニュアルとPostgres Wikiから始めます。