web-dev-qa-db-ja.com

小規模企業向けのフォールトトレラントサーバー構造

私は、ばかげたハードウェアの問題に悩まされている中小企業のために何をすべきかを理解しようとしています。現在、このビジネスは5台または6台のデスクトップマシンで実行されています。サーバーインフラストラクチャは整備されていません。その上、私はこれを装飾していませんが、今年の年初来で4つのハードウェア障害が発生しており、狂気に直面しています。

スモールビジネスサーバーを設置するという概念(彼らはマイクロソフトのショップです)についてはすでに彼らと話し合っており、彼らはその考えを受け入れています。また、System Center Essentialsで足を濡らして、物事を監視する予定です。次に、このサーバーが引き続き使用可能であることを確認することに重点が置かれます。

また、 この他の高可用性スレッドを読んだばかりです。 そのスレッドの人と同じように、私はITに非常に慣れておらず、代わりにプログラミングのバックグラウンドを持っています。

いくつかのアイデアが思い浮かびます:

  • ホットスワップを使用した単純なRAID-5 編集: とホットスペア
  • 2台の安価なサーバーマシンを入手し、ホットマイグレーションで1台の仮想化サーバーを実行するように構成します(読んだことがありますが、残念ながらSBS StandardとSCEがこれをサポートするかどうかわかりません)
  • フェイルオーバークラスタリング?私は他のスレッドからこの用語を取得しましたが、過去にこれにさらされたことはありません。

これに関しては、ベストプラクティスはありますか?事業主はダウンタイムを恐れるようになっているので、これのために少しポケットを掘り進んでいますが、私はこれらの経験がなく、私を一方の方向に導きます。

あなたの知恵に感謝します!

編集: 彼らが経験した問題についてさらに詳細を提供するために、それは不可解な失敗の奇妙な組み合わせでした。

  • シャーシのスイッチをオンにするとシステムの電源がオンになりません。マザーボードにはスイッチが搭載されていたため、一時的な解決策が提供されましたが、ケースを切り替えても問題は解決しませんでした。その後、マザーボードを切り替えても問題は解決しませんでした。
  • 2台の同一のマシンでRAID-1アレイのドライブ障害が発生し、両方のマシンが5か月以内に組み立てられました。
  • 起動失敗の問題:raid-1の1つのシステムがまったく起動に失敗します。残念ながら、元のエラーメッセージを書き留めていませんでしたが、メモに、Windowsの修復と回復の「起動オプションの保存に失敗しました」がサポートされている このスレッド につながったとありますそれがハードウェア関連の問題だったという私の疑い。

編集: また、マシンはホームオフィスのコレクションで実行されているため、住宅グレードの電気が使用されています。これは、私が認めた以上の要因かもしれないと思います。ただし、マシンはすべて、床ではなく机(文字通りデスクトップ!)で実行されます。ほこりっぽさは関係ないと思います。

6
bwerks

まず第一に、SCEは5〜6台のデスクトップマシンにとってはやり過ぎです。 WSUSはおそらくより良いオプションであり、無料です。

あなたは正確に何が失敗したかについて多くを語っていません。それは機械の一部でしたか?これはほこりっぽい環境ですか?私の主なサポート環境は、約10台のサーバー(仮想化を含まない)を持つ約40人のユーザーです。デルのマシン(Optiplex)を購入し、過去5年間に多分4つのハードウェア障害が発生しました。したがって、ワークステーションに表示されているものは正常ではありません。

サーバー用の適切なサーバールーム/場所がありますか(少なくとも、ほこりが多くなく、冷却されていますか?)

ホットスワップを使用したRAID-5は、このサーバーを使用するための安価な方法であり、ハードドライブの障害に対するある程度の保護を提供します。また、冗長電源(安価)とUPSを追加します。

  • サーバークラスのハードウェア
  • ハードドライブへのレイド(編集して追加)保証対象のほとんどのドライブは一晩で使用できるため、ホットスペアを利用できるようにするのはおそらくやり過ぎです。たとえば、RAID-5に3台のドライブがある場合、1台のドライブを失い、新しいドライブが到着するまで大丈夫です。ただし、1台を超えるドライブを失うと、どのように見ても失敗します。
  • 冗長電源
  • 適切な保証(たとえば、デルでは、翌営業日を取得し、どのサーバーでも1日のダウンタイムが発生する可能性があるため、ハードドライブを保持します。)
  • バックアップソリューション

フェイルオーバークラスタリング?あなたは、そのような小さな環境にとって、費用がかかり、複雑な領域に入り始めています。このような小さな環境では、稼働時間は重要ですが、物事をできるだけシンプルに保つ必要があることを覚えておくことも重要です。 -)

ワークステーションについては、問題に対処してください(これについてはあまり明確にされていません)。おそらく、ベースイメージが含まれている「追加の」ワークステーションを購入することができます。このワークステーションは、WSUSからのすべての更新を取得し、ワークステーションの1つが停止した場合にスワップアウトマシンとして使用できます(これが私たちの仕事です)。 。また、保証部品が到着するまで、死ぬ最も一般的な部品(電源、RAM、ハードドライブ)を交換するために交換できる部品がたくさんあります。

バックアップ。優れたバックアップの代わりとなる冗長性はありません。ここには多くのオプションがあります。このような小さな環境では、オフサイトの処理と自動化を同時に合理的なコストで行う多くの(Mozy、Carboniteが頭に浮かぶ)有線ソリューションを見ることができます。また、テープソリューションを導入し、IronMountainなどのサービスを使用してテープをオフサイトに保管することもできます。 何をするにしても、テープを持ち帰らないでください!特に貴重な情報(SS#など)がある場合は。)

5
GregD

私の経験から、SBSには独自の問題があります。特にクラスター化などで設置する場合は、このような小さなお店にはメンテナンスの手間がかかりすぎます。

適切な小さなサーバー、4つのディスク、RAID(5 | 10 | 6)、pci-e RAIDコントローラー、基本的なファイルサーバー、ups(tomtomに感謝)をセットアップします。

ほんの数人宛のメールは、おそらく外部プロバイダーによって処理するのが最適です。

VPNやActiveDirectoryなどが必要になるため、SCEや同様の過剰な状況には近づかないでください。これらすべてを設定することは大きな努力であり、おそらく顧客の最善の利益にはなりません。

あなたの小さな顧客をシンプルでありながら効率的で信頼できる解決策に導くことによって、あなたは彼らとあなた自身を幸せにするでしょう。

イベントログを調べるように指導し、ディスクの警告をチェックする簡単なスクリプトを提供します。必要に応じて定期的に訪問し、ログを確認してください。一度に1つずつ問題に対処します。

2
Posipiet

これは主にハードウェアの問題ではありません。 USVを入手-今すぐ。オンラインのもの(つまり、電気をフィルタリングするもの)。

その上、私はこれを装飾していませんが、今年の累計で4つのハードウェア障害が発生しています。

これはコミカルであり、非常にまれです。あるいは、たとえば、変動するパワーや、サーバーがそれほどうまく処理できなかったものに基づいています。これは正常ではなく、「ただ」起こる可能性は非常に低いです。宝くじのように低く勝ちます。私は同様の動作を見てきましたが、CRAP電源または...スパイクのある不安定な電源に基づいており、部分的に家庭で誘導されています(火花が見える非常に悪いスイッチのおかげで、ライトをオンにするとサーバーが停止します)。

  • SCEは必要ありません。 WSUSで十分です。
  • SBSは、稼働時間に必要なものを実際にはサポートしていませんが、仮想化プラットフォームで実行してみることができます。 Hyper-Vで実行されます...デモ目的で実行している人を知っています。
1
TomTom

いくつかの追加の洞察:

  • RAID-5 +ホットスペアの代わりにRAID-6を使用します。 RAID-6では、ディスク間でパリティが2倍になるため、2つのディスクに同時に障害が発生する可能性があります。または、RAID-5を使用して、DRバックアップを実行します
  • サーバーボックス内の冗長性(ディスク、電源、冷却)に最初に焦点を当てる
  • サーバーボックスのプレミアムサポートサービスを購入し、応答時間SLAハードウェア障害の場合(クラスターソリューションよりもはるかに安価))
  • いくつかの(良い)オンラインUPSを購入する
  • DoubleTake Availabilityなど、レプリケーションに基づく可用性ソリューションを実装します。非常に安価なWindowsSBS用に調整されたDoubleTakeAvailabilityのバージョンがあります。これを行うには2台のサーバーが必要ですが、ハードウェア障害が発生した場合のダウンタイムは10分未満に短縮されます。
1
ThiagoH

サーバーがどのような問題を解決するのかわかりません。

4台のマシンすべてが同じベンダーからのものであり、場所に異常がない場合(非常に高い湿度/ほこり、静電気、雷、または非常に信頼性の低い電力)、新しいハードウェアベンダーが必要です。デル、HP、IBMが所有者の悪い面に立ち向かうために何をしたとしても、少なくともハードウェアの観点からは、これらのマシンのサプライヤはもっと悪いです。ウォルマートで見つけることができる最も安いマシンを購入すると、信頼性が向上します。

それは完全にベンダーのせいではないかもしれません-誰かが特定のハードウェアを指定したり、非常に低スペックのギアを主張したりするかもしれません-しかし、彼らはまだ悪い構成のマシンを作ることを拒否するか、悪いものを置き換えるために何か英雄的なことをしたはずですマシン。

Dell/HP/Lenovoから中途半端なPCを購入する(または現在のサプライヤの尻を蹴って販売内容をサポートする)か、有料のDropboxアカウント(またはbox.net、NetDocuments)にサインアップすることをお勧めします。 )ファイルを共有し、ISPまたはGoogleにメールとWebサービスを処理させる。

[*はい、「クラウド」サービスは理論的には独自のサーバーを所有するよりも安全性が低くなりますが、これが多数のホームオフィスで実行されている場合、それらの家のいずれかが盗難にあった場合、または誰かの家族が従業員が家にいないときや休暇中にインターネットからランダムな悪意のあるソフトウェアを実行するための作業機。ダウンタイムの最大の危険性は、クラウドプロバイダーのダウンタイムではなく、コンシューマーグレードのネット接続から発生します。]

信頼性が必要な場合は、より複雑で高価なハードウェア/ソフトウェアではなく、より少ないハードウェアとより単純なハードウェアが必要なようです。

0
gbroiles