web-dev-qa-db-ja.com

統合データウェアハウスと分散データウェアハウスの違いは何ですか?

これらの明確な定義や説明は見つかりません。どちらも分散型のようです。フェデレーテッドDWHでは、データは分散され、単一のリポジトリに統合されず、分散ソースからアクセスされるようです。

分散型DWH実装では、データは1つの中央リポジトリに統合されます。

これら2つの実装の違いを説明してください。

9
LifeH2O

分散型データウェアハウスは、本質的には、個々の地域またはビジネスユニットによって維持されているが、中央で利用可能になっているデータウェアハウスのコレクションです。これらは同じ物理サーバー上にある、レポートツールを共有する、または他の方法で組織全体で利用できるようにすることができます。また、マスターデータ管理などの集中型コンポーネントがある場合もあります。これは通常、集中化されたデータウェアハウスが特定のサイズの組織を超えて扱いにくくなるために行われます。データウェアハウスは変更に対応する必要があり、応答が速すぎる場合は、個々の部門が独自のソリューションの構築を開始します。

これは投資銀行で見ることができます。この場合、ビジネス全体に集中型のウェアハウスを構築するのではなく、特定の要件(特定の規制イニシアチブやある種の財務報告など)を満たすためにデータウェアハウスを実行する傾向があります。大規模な銀行の規模の企業は、完全に集中化されたEDWの要件を妥当な時間内に実行するには複雑すぎます。

連合データウェアハウスは、分散データウェアハウス全体にマスター統合レイヤーを追加します。すべての部門に汎用MIプラットフォームを提供するのではなく、企業全体またはグループレベルのレポートのためにビジネス全体の主要なメトリックを統合することを目的としているため、通常、これはデータの狭い垂直スライスのみを収容します。部門は、独自のEDWまたはMIシステムを作成する必要がありますが、中央の統合レイヤーに入力するために必要なデータセットを提供する必要があります。

このアーキテクチャは、両方の長所を提供します。中央管理は、組織全体のメトリックを確認でき、部門はM.I.彼らのニーズを満たすためのソリューション。中央管理では、部門のシステムによって提供されるフィードとして、アナリティクスとMIに必要なデータ要件を課すだけで済みます。特定の部門についてより詳細なレポートまたは分析が必要な場合は、部門システムによってこれを提供できます。

以下のリンク先の記事では、フェデレーテッドデータウェアハウスについて詳しく説明しています。

http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/

この記事では、データウェアハウスのトポロジについてさらに詳しく説明します。

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2