web-dev-qa-db-ja.com

EXISTS vs JOINとEXISTS句の使用

以下にコードサンプルを示します。

CREATE TABLE #titles(
    title_id       varchar(20),
    title          varchar(80)       NOT NULL,
    type           char(12)          NOT NULL,
    pub_id         char(4)               NULL,
    price          money                 NULL,
    advance        money                 NULL,
    royalty        int                   NULL,
    ytd_sales      int                   NULL,
    notes          varchar(200)          NULL,
    pubdate        datetime          NOT NULL
 )
 GO

 insert #titles values ('1', 'Secrets',   'popular_comp', '1389', $20.00, $8000.00, 10, 4095,'Note 1','06/12/94')
 insert #titles values ('2', 'The',       'business',     '1389', $19.99, $5000.00, 10, 4095,'Note 2','06/12/91')
 insert #titles values ('3', 'Emotional', 'psychology',   '0736', $7.99,  $4000.00, 10, 3336,'Note 3','06/12/91')
 insert #titles values ('4', 'Prolonged', 'psychology',   '0736', $19.99, $2000.00, 10, 4072,'Note 4','06/12/91')
 insert #titles values ('5', 'With',      'business',     '1389', $11.95, $5000.00, 10, 3876,'Note 5','06/09/91')
 insert #titles values ('6', 'Valley',    'mod_cook',     '0877', $19.99, $0.00,    12, 2032,'Note 6','06/09/91')
 insert #titles values ('7', 'Any?',      'trad_cook',    '0877', $14.99, $8000.00, 10, 4095,'Note 7','06/12/91')
 insert #titles values ('8', 'Fifty',     'trad_cook',    '0877', $11.95, $4000.00, 14, 1509,'Note 8','06/12/91')
 GO


CREATE TABLE #sales(
    stor_id        char(4)           NOT NULL,
    ord_num        varchar(20)       NOT NULL,
    ord_date       datetime          NOT NULL,
    qty            smallint          NOT NULL,
    payterms       varchar(12)       NOT NULL,
    title_id       varchar(80)
)
 GO
insert #sales values('1', 'QA7442.3', '09/13/94', 75, 'ON Billing','1')
insert #sales values('2', 'D4482',    '09/14/94', 10, 'Net 60',    '1')
insert #sales values('3', 'N914008',  '09/14/94', 20, 'Net 30',    '2')
insert #sales values('4', 'N914014',  '09/14/94', 25, 'Net 30',    '3')
insert #sales values('5', '423LL922', '09/14/94', 15, 'ON Billing','3')
insert #sales values('6', '423LL930', '09/14/94', 10, 'ON Billing','2')


SELECT    title, price
FROM      #titles
WHERE     EXISTS
(SELECT   *
FROM      #sales
WHERE     #sales.title_id = #titles.title_id
AND       qty >30)


    SELECT    t.title, t.price
    FROM     #titles t
    inner join #sales s on t.title_id = s.title_id
    where s.qty >30 

同じ結果をもたらす上記2つのクエリの違いは何ですか?また、EXISTSキーワードの目的と正確に使用する場所を知りたいですか?

48
satyajit

EXISTSはブール値を返すために使用され、JOINは他のテーブル全体を返します

EXISTSは、サブクエリが結果を返すかどうかをテストするためにのみ使用され、すぐに短絡します。 JOINは、リレーションが存在する別のテーブルの追加フィールドと組み合わせて結果セットを拡張するために使用されます。

あなたの例では、クエリはシンボリックに同等です。

一般に、次の場合にEXISTSを使用します。

  • 関連テーブルからデータを返す必要はありません
  • 関連テーブルに重複があります(値が繰り返されると、JOINが行を重複させる可能性があります)
  • 存在を確認したい(LEFT OUTER JOIN...NULL条件の代わりに使用)

適切なインデックスがある場合、ほとんどの場合、EXISTSJOINと同じように動作します。例外は非常に複雑なサブクエリです。通常、EXISTSを使用した方が高速です。

JOINキーにインデックスが付けられていない場合は、EXISTSを使用した方が高速かもしれませんが、特定の状況をテストする必要があります。

JOIN構文は読みやすく、通常どおり明確になります。

99
JNK
  • EXISTSは準結合です
  • JOINは参加です

したがって、3行と5行が一致します

  • JOINは15行を与えます
  • EXISTSは3行を与えます

結果は、他の人が言及した「短絡」効果であり、JOINでDISTINCTを使用する必要はありません。 EXISTSは、1:n関係のn側に行の存在を探す場合、ほとんど常に高速です。

38
gbn

EXISTSは、主にショートカットに使用されます。基本的にオプティマイザーは条件が真になるとすぐに救済されるため、テーブル全体をスキャンする必要はないかもしれません(SQL Serverの最新バージョンでは、この最適化はIN()でも発生しますが、そうではありませんでした常に真実)。この動作はクエリごとに異なる可能性があり、場合によっては、結合によってオプティマイザが実際にジョブを実行する機会が増えることがあります。だから、「これはEXISTSを使用すべきときであり、そうすべきではないとき」と言うのは難しいと思います。

とはいえ、この場合、テーブル間は本質的に1対1で一致するため、パフォーマンスの違いはほとんど見られず、オプティマイザーは同様の、または同一のプランを作成する可能性があります。各タイトルに50,000行を追加するときに、salesテーブルでjoin/existsを比較すると、何か異なるものが表示される場合があります(重複、集計、あなたが持っているものを削除するために結合クエリを変更する必要はありません)。

10
Aaron Bertrand

他の行と相互作用する方法に基づいて除外したい行がある場合、existが最も有用であることがわかります。

例えば、

SELECT * 
  FROM TABLE a
 WHERE a.val IN (1,2,3)
   AND NOT EXISTS(SELECT NULL
                    FROM TABLE b
                   WHERE b.id = a.id
                     AND b.val NOT IN (1, 2, 3))

この場合、同じIDを持つが無効なaレコードを持つことに基づいて、bクエリの行を除外しています。

これは、実際には 私が職場で抱えていた生産上の問題 に由来しています。クエリは、アプリケーションではなくクエリの除外ロジックのほとんどを移動し、ロード時間を24秒以上から2秒未満に短縮しました。 :-)

3
corsiKa