web-dev-qa-db-ja.com

データ取得時間-AmazonGlacier

Amazon Glacier FAQ ページには、AmazonGlacierからデータを取得するために必要な時間について説明しているいくつかのポイントが含まれています。例えば:

標準の検索では、数時間以内に任意のアーカイブにアクセスできます。標準の取得は通常3〜5時間以内に完了します...

...一括取得は、通常5〜12時間以内に完了します。

他のストレージクラスと比較して、Amazon Glacierからデータを取得するのになぜこれほど時間がかかるのですか?

1
an0o0nym

私はこれを Glacier Wiki Page で見つけました:

ZDNetによると、個人の電子メールによると、Glacierは「安価なコモディティハードウェアコンポーネント」で実行されています。 2012年、ZDNetは、元Amazonの従業員が、Glacierはカスタムロジックボードに接続されたカスタムの低RPMハードドライブに基づいており、ラックのドライブの一部のみが一度にフルスピードで回転できると述べたと述べています。 (同様のテクノロジーがFacebookでも使用されています。)

AmazonがGlacierをテープバックアップサービス(オンプレミスとクラウドベースの両方)の直接の競合相手として位置付けているため、Glacierストレージに使用される基盤となるハードウェアはテープベースであるという信念がユーザーの間であります。 この混乱は、Glacierのアーカイブ取得の遅延(アーカイブが利用可能になるまでに3〜5時間)がテープベースのシステムと同様であり、頻繁なデータ取得を妨げる価格設定モデルがあるという事実によって悪化します。

レジスターは、GlacierがLTO-6テープを備えたSpectraT-Finityテープライブラリで実行されていると主張しました。他の人は、オフラインのシングル磁気記録ハードドライブ、多層ブルーレイ光ディスク、または代替の独自のストレージ技術を使用してAmazonを推測しています。

2
an0o0nym

なぜそんなに時間がかかるのですか?それが設計されている方法だからです。

Amazon Glacierは、「データアーカイブと長期バックアップ」のための低コストで低アクセスのストレージサービスとして特別に設計されています。データに定期的にすぐにアクセスしたい場合は、AmazonS3のような高コストのインスタントアクセスストレージサービスが必要です。

また、「氷河」と呼ばれ、氷河が速いことで知られていないことにも注意してください。

彼らはテープドライブなどを使用していると思いますが、特定の技術的側面についてコメントすることも、AmazonのWebページでその情報を見つけることもできません。

2
hymie

Amazon Glacierには、取得とダウンロードの2つの段階があります。これは、頻繁な検索を必要としない長期保存用に作成されました。 クラウドバックアップ など。取得リクエストには通常3〜5時間かかり、その後、データは顧客がダウンロードできるようにステージング領域に配置されます。取得したデータは24時間ステージングされるため、その期間内にデータをダウンロードすることが重要です。ダウンロード時間は帯域幅によって異なります。長い時間の理由は、Amazonがより頻繁なデータアクセスを目的とした他のストレージオプションよりもGlacierの価格を低く設定しているためです。

ただし、Glacierではさまざまなタイプのデータ取得を利用できます。必要に応じて、迅速な検索を利用できるため、1〜5分でデータをはるかに高速に利用できます。このタイプは、標準のGlacierデータ検索よりもコストがかかります。 AWSにはFAQと、さまざまなタイプの取得に関する追加の詳細があります: https://aws.Amazon.com/glacier/faqs/

1
Adir Akerman