web-dev-qa-db-ja.com

巨大なウェブサイトには複数のグローバルアップリンクがありますか?

たとえば、Googleには500を超えるIPアドレスがありますが、データセンターは約20しかありません。どうすればいいの。

私が読んだところによると、典型的な(巨大な)データセンターには、1つのグローバルアップリンク、ルーター、およびメインスイッチがあります。各クラスターはメインスイッチに接続されています。クラスターには、各ノードが接続されている別のスイッチがあります(そのアップリンクがメインスイッチに先行します)。これは正しいです?

Webサイトが巨大なクラスターで実行されており、アップロード速度がボトルネックである場合、1つのクラスターに対して2つ以上のアップリンクを実行できますか?

また、1つのサイトに複数のデータセンターがある場合、各センターにアップロードするようにFTPや他の同様のアプリケーションを構成できますか?

3
alecwhardy

_For example, Google has over 500 IP address, yet only around 20 data-centers. How can this be._

あなたはインターネットがどのように機能するかについて根本的な誤解を持っているようです。 1つのデータセンターには多くのサーバーがあり、通常は多くのIPアドレスがあります。
IPアドレスは住所とは異なり、移動できます( [〜#〜] bgp [〜#〜] の魔法を使って)


From what I have read, a typical (huge) data-center will have 1 global uplink, a router, and a main switch. Each cluster is hooked up to the main switch. In the cluster is another switch (its uplink leads the the main switch) which each node is connected to. Is this correct?

あなたが読んだものはひどく間違っています。ホスティングする価値のあるデータセンターには、複数のアップリンクがあります(複数のプロバイダーへの複数の物理接続-トランジットを購入するネットワークまたはピア)。

コアスイッチとルーターは通常、少なくともフェイルオーバーペアの冗長性を備えて構成されています。
アクセススイッチ(サーバーが接続するもの)は、他の方法で冗長になる場合があります(2つの一般的なスイッチは、各サーバーがコアに戻る別々のパスを持つ2つの別々のアクセススイッチに接続するか、それぞれ2つのサーバーが接続されているコアに戻る個別のパスを持つ個別のアクセススイッチへ)


_If a website is running off a huge cluster and the upload speed is the bottleneck, can you have 2 or more uplinks running to one cluster?_

この質問は、インターネットトラフィックがどのように流れるかという文脈では意味がありません。ルーティングについての理解を深める必要があります。短いバージョン「トラフィックはAからBへの最短パスをたどります。そのパスが混雑していると、トラフィックが遅くなります。」 -渋滞を回避するためにトラフィックを再ルーティングするために実行できる魔法のことがもっとあります。

エンドポイントサーバーに関しては、 トランクまたはボンド イーサネット接続を使用して、個々のサーバーにデータセンター内の帯域幅を増やす方法があります。ボトルネックは通常インターネットのどこかにあるため、これは速度を上げるのに役立たないことがよくあります...

また、Wordクラスターを悪用しています(クラスターの種類が重要です)。


_Also, IF you have multiple data-centers for one site, can you configure FTP and other similar applications to upload to each center?_

簡単な答え:いいえ。
長い答え: 分散ファイルシステム 、リモートサイトミラーリング(レプリケーション)、および一般的な地理的冗長性を調べてください。

12
voretaq7

データセンターの運用方法について、どのようにしてこれらの結論に達するのだろうか。

非常に小規模なデータセンターでない限り、AS番号用に2つ以上のNOCへの複数のアップリンクがあり、独自のBGPサービスを実行する場合と実行しない場合があります。

大規模なデータセンターには通常、バックボーンNOCまたはピア交換を分離するための複数の冗長リンク(つまり、4つ以上の物理接続)があります。

巨大なデータセンターについて話しているとき(グーグルは確かにそうですが)、それらは通常NOCであるか、バックボーンへの直接(最短パス)アップリンクを持つようにピア交換内に同じ場所に配置されます。

これは、個々のサーバーやサービスの実行方法やインターネットへの表示方法とはまったく関係ありません。

また、Googleが自社のデータセンター間で大量のダークファイバー(直接の非インターネット接続)を採用していることも覚えているようです。これにより、冗長性が追加され、サイト間のスループットが向上します。

11
adaptr

Google画像検索でデータセンターのトポロジを確認すると、この結論に至った経緯を簡単に確認できます。ほとんどの例は小規模なデータセンター向けです。それらは、グーグル、マイクロソフト、またはヤフーの規模のトポロジーとほとんど共通点がありません。

データセンターの内部ビューの良い例を次に示します(これは、単一のGoogle、Microsoft、またはYahoo DCの規模にさえ近くありません)。

enter image description here

そして、前の図の「キャンパスコア」の境界に潜んでいる可能性のあるものの例を次に示します(ラベルは無視してください。これは説明のためだけです)。

enter image description here

ネットワークトポロジは、router-switch-serverよりもはるかに複雑になる可能性があります。それはあなたがやろうとしていることに依存します。

5
Joseph Kern