関連記事で説明したように、多くのIT管理者は、分散サーバールームおよびリモート配線クローゼットで予想外の事態によって発生するダウンタイムを繰り返し経験しています。 これらの体験談を分析すると、1つの共通点が浮かび上がります。それは情報不足が人為的ミスにつながり、ダウンタイムが発生しているということです。

次の統計情報について考えてみましょう。

  • IDC(米国のハイテク関連専門調査会社インターナショナル データ コーポレーション)の推定によると、米国だけで290万のサーバールームと配線クローゼットがあります。
  • Uptime Institute(データセンターのパフォーマンスと効率性向上を目的にデータセンターの設計・構築・運用の研究・教育・コンサルティングを提供する団体)によると、報告されたデータセンターの停電の70%以上で、直接的な原因は人為的ミスです。
高くつくダウンタイムの回避に必要な情報を提供するモニタリングシステムを設計しましょう。 リモートサーバールームでの人為的ミスの発生を抑えることを主目的とするシステムでは、ビデオ監視、センサー、高機能ラックコンセント、モニタリングおよびオートメーションソフトウェアの4つの主要構成要素を検討する必要があります。

ビデオ監視とセンサー

拡張可能なモニタリングおよびオートメーションシステムは、重要なアラートと監視ビデオを収集、整理、および配信できます。 電源、冷却、ラックの前後、および環境をモニタリングすることにより、これらのシステムは欠陥通知を即座に行い、状況のすばやい評価を可能にし、ITシステムの可用性に悪影響を与えかねない重要なインフラの問題を解決します。

ビデオ監視システムをモーションセンサーに接続することにより、動きが検知されるたびに、カメラがそのエリア全体を撮影して映像を権限のある管理者に送信します。その結果、管理者は、下請け業者がライブサーバーを収縮包装するなどの状況をすばやく修正できるようになります。

カメラ管理システムでは一般的にサーバールームまたはリモート配線クローゼットに入室する施設担当者、ベンダー、セキュリティ担当者、警備員などを追跡することができます。 管理者はシステムにリモートログインし、室内のスタッフの行動を観察することもできます。 管理者が入室者に指示や警告を与えるためのスピーカーを備えたシステムもあります。

自動制御ラックコンセント

ラックマウント型PDUとも呼ばれる自動制御ラックコンセントは、ラックの背面内側に取り付けられる細長い電気コンセントです。 このデバイスにより、ユーザーはロックされた機器への電力をリモートからリサイクルして、各コンセントの電源をオンまたはオフにする順序を設定したり、初めに電源を投入する機器をあらかじめ設定し、その機器に依存する他の機器が適切に機能するようにしたりできます。

モニタリングシステムは、自動制御ラックコンセントにより実際の電力消費を測定し、新しい機器の設置場所を決定するために必要な情報を管理者に提供して、過負荷を防止します。

モニタリングおよびオートメーションソフトウェア

管理およびオートメーションシステムは、次に示す、人為的ミスによるダウンタイムを抑制するための膨大なデータを管理者に提供します。
  • しきい値を超えた場合の、Eメール、携帯メール、電話など、ユーザーが選択した方法によるアラームと通知。
  • サーバーからバッテリーまであらゆる機器の状態チェック。 1個のバッテリーの障害が、その企業にとって危機的な損失につながる場合もあることを肝に銘じてください。 バッテリーを1個または2個交換するコストは、クローゼットまたはサーバーのクラッシュを引き起こす障害と比較すると微々たるものです。
  • 分析結果の報告: モニタリングシステムが集めたデータは、カスタマイズされたレポートに変換され、IT管理者によって確認されます。 このようなレポートは、温度変動、誰がどのラックにどれくらいいたか、特定のUPSにかかっている負荷の量などの状況を管理者に警告します。
  • 大規模構成: 管理者は、熱心すぎる清掃員からラックを保護するなどの目的で、50台のラックのドアを一斉にロックするなど、中央モニタリングおよびオートメーションシステムに登録されたすべてのデバイスに対し、大量変更命令を出すことができます。
  • 制御: 詳細なモニタリングおよびオートメーション システム データは、問題発生時に必要な状況把握のため、適切な情報を管理者に提供する手助けをします。 例えば、システムは電力パスと物理的な機器の関連性・依存性をマッピングし、問題の原因特定に役立てることができます。 また、ラックベースの機器における特定のデバイス障害の結果を図示し、ビジネス影響の特定に役立てるシステムもあります。
環境制御、アラート、および履歴データの蓄積は、ストレスおよびダウンタイムのより少ない環境の構築に役立ちます。 より詳しい内容については、APC by Schneider Electricのホワイトペーパー『How Monitoring Systems Reduce Human Error in Distributed Server Rooms and Remote Wiring Closets』をダウンロードしてください。