web-dev-qa-db-ja.com

HGST Helium Ultrastar 8TB 7200 RPM S.M.A.R.T. 12Gb / sエンタープライズドライブの最高温度SAS温度は?

RAMモジュールとCPUの上にある、フェースプレート12 * 3.5 "ドライブベイ+ 4 * 3.5"ミッドボディトレイ付きの新しいDell R730xd 2Uサーバーを受け取りました。16*差し込みましたHGST Helium 8Tb 7200 RPM SAS 12Gb/sドライブで、2 * 8 * 8TbRAID6ボリュームのバックグラウンド初期化を開始しました。

Smartctlを使用してドライブの温度を照会します。フロントドライブは33Cから37Cの範囲で涼しいと予想されますが、ミッドボディドライブ#14..17は45C、46C、51C、54Cです。後者が最も懸念されるのは過熱です。 Initはほんの数時間続いていました。

iDRACは、吸気が22C、排気が44Cであることを報告します。ファンは〜4.3k RPMで回転します。ふたが外れている場合、15,000回転します。

熱画像は、#17が47℃のケース温度で最も高温であることを示しています。

特定のドライブに何かがあるのか​​、それともドライブの場所に関するものなのかはまだわかりません-VDを削除し、2つのドライブの場所を交換することで確認します-この投稿を観察結果で更新します。

製造仕様によると、通常の動作環境Tは最大60°Cです( リンク

私の考えでは、温度の上昇はドライブの寿命に影響します。

ただし、古いR720xdの2つのフレックスベイリアドライブは15kRPMで、常に約55℃で、3年以上経ってもまだ生きています。

さらに、私は彼らの立場についてHGSTのサポートを要請しました。

Serverfaultに関する別のトピックはGoogleの調査を示しており、Tは数年後の要因であると述べています。 ( リンク

UPD1(20151102):製造元は迅速に回答しました:「このドライブは5〜60°Cの温度で動作できます。ドライブは通常50°C未満で動作するはずです。55°Cの安定した温度で動作している場合、通常より少し高温で動作しています。しかし、それでも安全な範囲にあります。」

UPD2:#14と#17の場所を入れ替えました-過熱は場所によって異なり、右側(前から後ろに見える)は左側よりも暖かく、#17席の前の#14はトップ56Cを示し、前の#17は# 14席は40-45℃で涼しかった。 iDRAC->ハードウェア->ファン->セットアップ->ファン速度オフセットを「低ファン速度オフセット(+ 23%)」に調整すると(6.8kRPMアイドリング対4.4kRPMデフォルト、RAID初期化を実行)、#14と#17の最高温度になりました49Cと54Cから40Cと47Cへ。ファンを15kRPMに設定すると(デフォルトの反応をサードパーティのPCIカードに設定することで-私は1つ持っています)、追加の+ 120Wの電力使用量(340W対230W)を犠牲にして温度を34Cと39Cにします。

もちろん、私はデルが承認したディスクを使用していません。現在、このサーバー用にデルが提供している8Tbドライブはありません。6TbSASは1台あたり$ 830です。8TbヘリウムSAS、$ 498で購入できます。 -RAID TBコストは138ドルから62ドルです。後で、Dell-firmwared(およびLifecycle Controllerでサポート)が冷却との通信が改善され、LCを介してファームウェアの更新を取得していることに気付きました。

私にとってもう1つの嬉しい驚きは、#14と#17を交換してもRAIDの再構築には至らなかったということです。コントローラーは、ログにWordを入力せずに、新しい場所でディスクを取得しただけです。

UPD 20160426:HGST 8T 12G SASまたはSeagate8Tb 12G SASを搭載した12 + 4のR730xdを複数展開したところ、#14は#17よりも約10C低いことがわかりました。 40〜47Cの範囲にするための部分的な解決策は、iDRACのファン速度設定を+ 30%に上げることです。

4
kuz8

55〜60℃未満であれば問題ありません。とにかく、機械的なドライブにとって本当に危険なのは、繰り返される熱エクスカーションであり、ドライブが高温になり、急速に冷却されます。同様に危険なのは、繰り返されるスピン/スピンオフサイクルです。

EEAAが述べているように、それがDellからサポートされているセットアップである場合は、恐れることはありません。

4
shodanshok

これを、Googleの研究よりも新しく、その方法論にある程度の厳密さがあるように思われる、より関連性の高い研究へのポインタとして追加します。

ストレージポッドの人々であるBackblazeは、 ドライブモデルによる故障率と温度の分析 を実行しましたが、ほとんどの場合、相関関係はありません。 3つのモデル(2つのSeagate BarracudasとHitachi Hitachi Deskstar)では、相関関係は統計的に有意です(有意性のしきい値は何であるかはわかりませんが、医学的に標準的な95%と推測しています)。そして、それらのケースの1つでは、それは非常に強力です。

私が完全に再現した彼らの結論は、

全体として、動作温度と故障率の間に相関関係はありません。唯一の例外は、Seagate Barracuda 1.5TBドライブです。これらのドライブは、暖かくするとわずかに故障します。

ドライブを許容動作温度範囲内で十分に実行している限り、ドライブを低温に保つことは重要ではありません。

ですから、あなたの場合、特に問題はなかったと思います。 (免責事項:私はBackblazeとは関係ありません。)

2
MadHatter

サーバーメーカーは、信頼性が高く、含まれている可能性のあるサードパーティコンポーネントの仕様内で動作するようにシステムを設計するために、lotの資金を投入しました。デルは、これらのドライブの寿命が短いと予想される場合、これらのドライブを保証しません。

これがサポートされている構成であるとデルが言った場合、心配する必要はありません。現代のギアはロット 10〜15年前のギアよりも高温に耐性があります。 RAIDがあり、デュアルドライブ障害から保護されています。私見では、このサーバーの熱管理を推測する以外のことに時間を費やす必要があります。

1
EEAA