web-dev-qa-db-ja.com

postgresqlの移動平均

Postgresql9.1データベースに次のテーブルがあります。

select * from ro;
date       |  shop_id | amount 
-----------+----------+--------
2013-02-07 |     1001 |      3
2013-01-31 |     1001 |      2
2013-01-24 |     1001 |      1
2013-01-17 |     1001 |      5
2013-02-10 |     1001 |     10
2013-02-03 |     1001 |      4
2012-12-27 |     1001 |      6
2012-12-20 |     1001 |      8
2012-12-13 |     1001 |      4
2012-12-06 |     1001 |      3
2012-10-29 |     1001 |      3

現在の木曜日を含めずに、過去3木曜日とデータを比較する移動平均を取得しようとしています。これが私の質問です:

select date, shop_id, amount, extract(dow from date),
avg(amount) OVER (PARTITION BY extract(dow from date) ORDER BY date DESC
                      ROWS BETWEEN 0 PRECEDING AND 2 FOLLOWING)                          
from ro
where extract(dow from date) = 4

これは与えられた結果です

date       |  shop_id | amount | date_part |        avg         
-----------+----------+--------+-----------+--------------------
2013-02-07 |     1001 |      3 |         4 | 2.0000000000000000
2013-01-31 |     1001 |      2 |         4 | 2.6666666666666667
2013-01-24 |     1001 |      1 |         4 | 4.0000000000000000
2013-01-17 |     1001 |      5 |         4 | 6.3333333333333333
2012-12-27 |     1001 |      6 |         4 | 6.0000000000000000
2012-12-20 |     1001 |      8 |         4 | 5.0000000000000000
2012-12-13 |     1001 |      4 |         4 | 3.5000000000000000
2012-12-06 |     1001 |      3 |         4 | 3.0000000000000000

私が期待する

date       |  shop_id | amount | date_part |        avg         
-----------+----------+--------+-----------+--------------------
2013-02-07 |     1001 |      3 |         4 | 2.6666666666666667
2013-01-31 |     1001 |      2 |         4 | 4.0000000000000000
2013-01-24 |     1001 |      1 |         4 | 6.3333333333333333
2013-01-17 |     1001 |      5 |         4 | 6.0000000000000000
2012-12-27 |     1001 |      6 |         4 | 5.0000000000000000
2012-12-20 |     1001 |      8 |         4 |
2012-12-13 |     1001 |      4 |         4 |
2012-12-06 |     1001 |      3 |         4 |
24
Glicious

SQLフィドル

select
    "date",
    shop_id,
    amount,
    extract(dow from date),
    case when
        row_number() over (order by date) > 3
        then
            avg(amount) OVER (
                ORDER BY date DESC
                ROWS BETWEEN 1 following AND 3 FOLLOWING
            )
        else null end
from (
    select *
    from ro
    where extract(dow from date) = 4
) s

OPのクエリの問題点は、フレームの仕様です。

ROWS BETWEEN 0 PRECEDING AND 2 FOLLOWING

それ以外は、私のクエリは、高価なウィンドウ関数を適用する前に木曜日をフィルタリングすることにより、不要なコンピューティングを回避します。

Shop_idでパーティション分割する必要がある場合は、明らかにpartition by shop_idを両方の関数avgrow_numberに追加します。

18
Clodoaldo Neto

より良い答えは次のようになると思います。

SELECT date, shop_id, amount, 
    extract(dow from date) AS dow,
    CASE WHEN count(amount) OVER w = 3 
        THEN avg(amount) OVER w END AS average_amt             
FROM ro
WHERE extract(dow from date) = 4 
WINDOW w AS (ORDER BY date DESC ROWS BETWEEN 1 FOLLOWING AND 3 FOLLOWING)

ウィンドウ内の行数をチェックするために同じウィンドウを使用する方がクリーンだと思いますおよび平均を取ります。 (これにより、元の回答に見られるように、2つのウィンドウ集計も保存されます。)

「私のクエリは、高価なウィンドウ関数を適用する前に木曜日をフィルタリングすることで不要なコンピューティングを回避する」という以前の回答の主張に関して、これはOPによって提案されたクエリと私のクエリにも当てはまり、どちらかにEXPLAINを追加します。ショー。

9
Ian Gow