web-dev-qa-db-ja.com

T-SQL-条件が満たされるまでテーブルをループする最も効率的な方法は何ですか

T-SQLの領域でプログラミングタスクを取得しました。

タスク:

  1. 人々はエレベーターに乗りたいと思っています。
  2. 列に並んでいる順番で順番が決まります。
  3. エレベーターの最大容量は1000ポンド以下です。
  4. エレベーターが重くなる前にエレベーターに入ることができる最後の人の名前を返してください!
  5. 戻り型はテーブルでなければなりません

enter image description here

質問:この問題を解決する最も効率的な方法は何ですか?ループが正しい場合、改善の余地はありますか?

私はループと#一時テーブルを使用しました、ここで私の解決策:

set rowcount 0
-- THE SOURCE TABLE "LINE" HAS THE SAME SCHEMA AS #RESULT AND #TEMP
use Northwind
go

declare @sum int
declare @curr int
set @sum = 0
declare @id int

IF OBJECT_ID('tempdb..#temp','u') IS NOT NULL
    DROP TABLE #temp

IF OBJECT_ID('tempdb..#result','u') IS NOT NULL
    DROP TABLE #result

create table #result( 
    id int not null,
    [name] varchar(255) not null,
    weight int not null,
    turn int not null
)

create table #temp( 
    id int not null,
    [name] varchar(255) not null,
    weight int not null,
    turn int not null
)

INSERT into #temp SELECT * FROM line order by turn

 WHILE EXISTS (SELECT 1 FROM #temp)
  BEGIN
   -- Get the top record
   SELECT TOP 1 @curr =  r.weight  FROM  #temp r order by turn  
   SELECT TOP 1 @id =  r.id  FROM  #temp r order by turn

    --print @curr
    print @sum

    IF(@sum + @curr <= 1000)
    BEGIN
    print 'entering........ again'
    --print @curr
      set @sum = @sum + @curr
      --print @sum
      INSERT INTO #result SELECT * FROM  #temp where [id] = @id  --id, [name], turn
      DELETE FROM #temp WHERE id = @id
    END
     ELSE
    BEGIN    
    print 'breaaaking.-----'
      BREAK
    END 
  END

   SELECT TOP 1 [name] FROM #result r order by r.turn desc 

ここでは、テストにNorthwindを使用したテーブルの作成スクリプトを示します。

USE [Northwind]
GO

/****** Object:  Table [dbo].[line]    Script Date: 28.05.2018 21:56:18 ******/
SET ANSI_NULLS ON
GO

SET QUOTED_IDENTIFIER ON
GO

CREATE TABLE [dbo].[line](
    [id] [int] NOT NULL,
    [name] [varchar](255) NOT NULL,
    [weight] [int] NOT NULL,
    [turn] [int] NOT NULL,
PRIMARY KEY CLUSTERED 
(
    [id] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY],
UNIQUE NONCLUSTERED 
(
    [turn] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
) ON [PRIMARY]

GO

ALTER TABLE [dbo].[line]  WITH CHECK ADD CHECK  (([weight]>(0)))
GO

INSERT INTO [dbo].[line]
    ([id], [name], [weight], [turn])
VALUES
    (5, 'gary', 800, 1),
    (3, 'jo', 350, 2),
    (6, 'thomas', 400, 3),
    (2, 'will', 200, 4),
    (4, 'mark', 175, 5),
    (1, 'james', 100, 6)
;
10
Legends

一般的にループを回避するようにしてください。これらは通常、セットベースのソリューションよりも効率が悪く、読みにくくなります。

以下はかなり効率的です。

キールックアップを回避するために、名前と重みの列がインデックスで_INCLUDE-_ dである場合はさらにそうです。

turnの順序で一意のインデックスをスキャンし、Weight列の現在の合計を計算できます。次に、同じ順序付け基準でLEADを使用して、現在の合計を確認できます。次の行になります。

これが1000を超えるかNULL(次の行がないことを示す)である最初の行を見つけるとすぐに、スキャンを停止できます。

_WITH T1
     AS (SELECT *,
                SUM(Weight) OVER (ORDER BY turn ROWS UNBOUNDED PRECEDING) AS cume_weight
         FROM   [dbo].[line]),
     T2
     AS (SELECT LEAD(cume_weight) OVER (ORDER BY turn) AS next_cume_weight,
                *
         FROM   T1)
SELECT TOP 1 name
FROM   T2
WHERE  next_cume_weight > 1000
        OR next_cume_weight IS NULL
ORDER  BY turn 
_

実行計画

enter image description here

実際には、厳密に必要な場所の前の数行を読み取るようです。ウィンドウスプールとストリームの各集計ペアが原因で、さらに2行が読み取られるようです。

質問のサンプルデータの場合、理想的にはインデックススキャンから2行を読み取るだけで十分ですが、実際には6行を読み取りますが、これは重大な効率の問題ではなく、テーブルに行が追加されても低下しません( このデモ

この問題に関心のある人は、各演算子によって出力された行を含む画像(_query_trace_column_values_拡張イベントによって示される)を以下に示します。行は_row_id_の順序で出力されます(_47_から始まる)インデックススキャンによって読み取られ、TOPの_113_で終了する最初の行

下の画像をクリックして大きくするか、代わりに フローをわかりやすくするためのアニメーションバージョン を参照してください。

右側のストリーム集合体が最初の行を放出した時点でアニメーションを一時停止します(ゲイリーの場合-ターン= 1)。異なるWindowCount(Joの場合-ターン= 2)で最初の行を受け取るのを待っていたことは明らかです。そして、ウィンドウスプールは、別のturnを持つ次の行を読み取るまで、最初の「Jo」行を解放しません(トーマスの場合-ターン= 3)

したがって、ウィンドウスプールとストリームの集計の両方により、追加の行が読み取られ、プランにはこれらの行が4つあるため、4つの行が追加されます。

enter image description here

上記の列の説明は次のとおりです(info here に基づいて)

  • NodeName:インデックススキャン、NodeId:15、ColumnName:idインデックスでカバーされるベーステーブル列
  • NodeName:Index Scan、NodeId:15、ColumnName:turnベーステーブルの列がインデックスでカバーされています
  • NodeName:Clustered Index Seek、NodeId:17、ColumnName:weightルックアップから取得されたベーステーブル列
  • NodeName:クラスタ化インデックスシーク、NodeId:17、ColumnName:nameルックアップから取得されたベーステーブル列
  • NodeName:Segment、NodeId:13、ColumnName:Segment1010新しいグループの開始時に1を返し、それ以外の場合はnullを返します。 SUMに_Partition By_がないため、最初の行だけが1になります
  • NodeName:シーケンスプロジェクト、NodeId:12、ColumnName:RowNumber1009row_number() Segment1010フラグで示されるグループ内。すべての行が同じグループにあるため、これは1から6までの昇順の整数です。_rows between 5 preceding and 2 following_のような場合に右フレーム行をフィルタリングするために使用されます。 (またはLEAD以降)
  • NodeName:Segment、NodeId:11、ColumnName:Segment1011新しいグループの開始時に1を返し、それ以外の場合はnullを返します。 SUMに_Partition By_がないため、最初の行だけが1になります(Segment1010と同じ)
  • NodeName:ウィンドウスプール、NodeId:10、ColumnName:WindowCount1012ウィンドウフレームに属する行をグループ化する属性。このウィンドウスプールは、_UNBOUNDED PRECEDING_の「高速トラック」ケースを使用しています。ソース行ごとに2行を発行する場所。 1つは累積値を持ち、もう1つは詳細値を持ちます。 _query_trace_column_values_によって公開される行に目に見える違いはありませんが、実際には累積列があると思います。
  • NodeName:Stream Aggregate、NodeId:9、ColumnName:Expr1004Count(*)計画に従ってWindowCount1012によってグループ化されましたが、実際には実行中のカウント
  • NodeName:Stream Aggregate、NodeId:9、ColumnName:Expr1005SUM(weight)計画に従ってWindowCount1012によってグループ化されますが、実際には実行中の重みの合計(つまり、_cume_weight_)
  • NodeName:Segment、NodeId:7、ColumnName:Expr1002CASE WHEN [Expr1004]=(0) THEN NULL ELSE [Expr1005] END-COUNT(*)がどのように見えるか確認しない0になるため、常に合計が実行されます(_cume_weight_)
  • NodeName:Segment、NodeId:7、ColumnName:Segment1013LEADに_partition by_がないため、最初の行は1になります。すべて残りはnullになります
  • NodeName:シーケンスプロジェクト、NodeId:6、ColumnName:RowNumber1006row_number() Segment1013フラグで示されるグループ内。すべての行が同じグループにあるため、これは1から4までの昇順の整数です
  • NodeName:Segment、NodeId:4、ColumnName:BottomRowNumber1008RowNumber1006 + 1 LEADには次の単一行が必要なので
  • NodeName:Segment、NodeId:4、ColumnName:TopRowNumber1007RowNumber1006 + 1 LEADには次の単一行が必要なので
  • NodeName:Segment、NodeId:4、ColumnName:Segment1014LEADに_partition by_がないため、最初の行は1になります。すべて残りはヌルになります
  • NodeName:Window Spool、NodeId:3、ColumnName:WindowCount1015前の行番号を使用してウィンドウフレームに属する行をグループ化する属性。 LEADのウィンドウフレームには最大2行(現在の行と次の行)があります
  • NodeName:Stream Aggregate、NodeId:2、ColumnName:Expr1003LAST_VALUE([Expr1002]) for LEAD(cume_weight)
16
Martin Smith

好奇心と同じように(質問がT-SQLを示しているため)、SQLCLRを使用してこの問題を効率的に解決することもできます。

アイデアは、turnが1000を超えるまで(または行がなくなるまで)、weightの順序で一度に1行ずつ読み取り、最後に読み取ったnameを返すことです。

ソースコードは:

using Microsoft.SqlServer.Server;
using System.Data;
using System.Data.SqlClient;
using System.Data.SqlTypes;

public partial class UserDefinedFunctions
{
    [SqlFunction(DataAccess = DataAccessKind.Read,
        SystemDataAccess = SystemDataAccessKind.None,
        IsDeterministic = true, IsPrecise = true)]
    [return: SqlFacet(IsFixedLength = false, IsNullable = true, MaxSize = 255)]
    public static SqlString Elevator()
    {
        const string query =
            @"SELECT L.[name], L.[weight]
            FROM dbo.line AS L
            ORDER BY L.turn;";

        using (var con = new SqlConnection("context connection = true"))
        {
            con.Open();
            using (var cmd = new SqlCommand(query, con))
            {
                var rdr = cmd.ExecuteReader(CommandBehavior.SingleResult);
                var name = SqlString.Null;
                var total = 0;

                while (rdr.Read() && (total += rdr.GetInt32(1)) <= 1000)
                {
                    name = rdr.GetSqlString(0);
                }
                return name;
            }
        }
    }
}

コンパイルされたアセンブリとT-SQL関数:

CREATE Assembly Elevator AUTHORIZATION [dbo]
FROM 
WITH PERMISSION_SET = SAFE;
GO
CREATE FUNCTION dbo.Elevator ()
RETURNS nvarchar(255)
AS EXTERNAL NAME Elevator.UserDefinedFunctions.Elevator;

結果を得る:

SELECT dbo.Elevator();
6
Paul White 9

Martin Smith's solution からのわずかな変化

SELECT top 1 name
FROM (
    SELECT id, name, weight, turn
         , SUM(weight) OVER (ORDER BY turn) AS cumulative_weight
    FROM line                               
) as T
WHERE cumulative_weight <= 1000
ORDER BY turn DESC 

RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROWはデフォルトのウィンドウフレームなので、宣言しませんでした。

次の累積重みの代わりに、現在の累積重みの述語が使用されます。

私はどのプランもチェックしていないので、その点で違いがあるかどうかわかりません。

1
Lennart

自分自身に対して結合を行うことができます:

select 
    a.id, a.turn, a.game, 
    coalesce(sum(b.weight), 0) as cumulative_weight
from
    table a
left join 
    table b
on
    a.turn > b.turn
group by
    a.id, a.turn, a.game ;

この種のものは、行ごとの選択を引き起こすため、あまり効率的ではありません。しかし、少なくともそれは単一のステートメントとして表現されています。

SQLで完全に実行する必要がない場合は、すべての行を選択してループし、行を重ねていくだけです。

一時テーブルを使用せずに、ストアドプロシージャで同じことを行うこともできます。変数に合計と最後の行の名前を保持するだけです。

0
Ewan