web-dev-qa-db-ja.com

テープへのハード書き込みエラーの許容レベルは?

テープのハード書き込みエラーの許容レベルはどれくらいですか?具体的には、HP LTO-2メディアで許容できるものは何ですか?それは難しい数のエラーですか、エラーに対する使用時間の比率ですか、それともまったく別のものですか?

さらなる背景

Backup Exec 11dを使用して1つのLTO-2ドライブを備えたMSL6000ライブラリを使用しています(現時点では)。 Backup Execは、ほとんどのドライブで常にいくつかのソフトエラーを表示しますが、一部のドライブではハードエラーが表示され始めています。バックアップは即時検証で行われ、検証はまだ失敗していないので、今すぐ心配する理由はありません。

ドライブのデューティサイクル(250,000時間)はわかりますが、特定のテープをいつ廃棄する必要があるかについての明確な数値は見つからないようです。

メディアをローテーションするためのベストプラクティスがあれば、それも聞いてみたいです。また、間もなくLTO-4メディアに移行するため、そこでのエラーについての考えも役立ちます。

編集して追加:

すべてのテープにハードエラーがあるわけではありません。私が見ているもののアイデアを与えるために:

Tape    Hours in Use    Hard Errors
A       142             11
B       255             0
C       159             2

私のテープの大部分はBとCのようなものです。Aは外れ値です。

ここで、ある種のベストプラクティスを探しています。テープはOKを確認しています。復元したいときにテープを失敗させたくはありませんが、不要な場合は、いくつかのエラーでテープを投げたくありません。

4
CC.

これらのエラー率は、私の経験からするとまだ本当に低いです。 LTO ECC仕様から:

LTO-Ultriumで使用されるECC(エラー訂正コード)は、読み取り操作で8つのトラックの1つが失われ、残りのトラックのバイトの最大1%が破損した場合でも、データの信頼性の高い回復を保証するのに十分強力です。

私が働いていたショップでは、テープをローテーションから削除する前に、テープがライブラリを循環する回数に関するガイドラインを設定しました(通常、これは少なくとも20回または30回でした)。また、四半期に1回テープのサンプルを復元し、データのmd5sumを検証して、バックアップシステム全体が正しく機能していることを確認しました。

表示されているエラー率に加えて、テープの寿命にとってより重要な変数がいくつかあります。

  • テープが長期間保管される環境(おそらく最も重要)
  • 環境内の変更の数(おそらく、ライブラリからストレージにローテーションされるとき)
  • テープが使用された回数(読み取りと書き込みの両方)
  • テープの時代
  • データの重要性(本当に重要なものの複数のバックアップを実行することは理にかなっているかもしれません)

これは通常、メディアライフサイクル管理と呼ばれ、実際にエンタープライズソフトウェアスイートを作成してそれに対処する企業が多数あります。あなたがあなたの店で役に立つと思うアイデアがあるかどうか見るためにそれらのいくつかを調査する価値があるかもしれません。一例:

http://www.spectralogic.com/index.cfm?fuseaction=products.displayContent&CatID=1852

1
polynomial