web-dev-qa-db-ja.com

SSDTデータフローのバッチ処理はどのように処理されますか?

SSDTはData Flowタスクのバッチ処理をどのように処理しますか?

SSDTを使用して約1GBのCSVをSQLServerに解析しています。

データフローにはFlat Fileソースがあり、これはOLE DB宛先(ステージングテーブル)に移動します。次にSPが実行されます) SQLタスクを使用します。

解析されるCSVには、要約テーブルと、要約テーブルへの外部キー参照を持つ子テーブルが含まれます。そのため、CSVにはサマリーテーブルの重複したIDが含まれます(したがって、子行ごとに1行あります)。単一のサマリーIDが2つのバッチに分割された場合、データが失われます-SPは、「ステージング中のIDが子テーブルから削除され、ステージングから再挿入」のようなものになります。子テーブル」。以前は、ベンダーが子データの一意のIDをエクスポートしていなかったため、これを行う必要がありました。現在はエクスポートされているため、マージステートメントを使用できます。

だが。 Data Flowタスクがバッチ処理されているかどうかを知りたいのですが、バッチ処理されている場合はどうすればよいですか?

2
Zach Smith

質問の下のコメントで述べたように、この質問への回答はこの投稿に含まれています: http://blogs.lobsterpot.com.au/2011/02/17/the-ssis-tuning-tip-that -みんな-ミス/

つまり、そのバッチ処理はデフォルトで実行されます(バッチあたり10,000行)。

0
Zach Smith