Як пояснювалося раніше в нашому дописі на подібну тему, численні керівники з ІТ пригадують аварії у віддалених серверних і комутаційних вузлах, зумовлені непередбаченими, проте, радше, типовими подіями. Аналіз цих аварій виявляє дещо спільне: брак інформації призводить до помилки персоналу, а та — до позапланового простою.

Розгляньмо трохи статистики:

  • за даними IDC, у США 2,9 млн. серверних і комутаційних вузлів.
  • Інститут безперебійності повідомляє, що понад 70 % виходів з ладу в ЦОД безпосередньо зумовлені помилками персоналу.
Щоб уникнути простоїв, які спричиняють втрати, належить спроектувати систему моніторингу, яка надає потрібну інформацію. Найперша роль цієї системи — звести до мінімуму помилки персоналу в віддалених серверних. Для цього вона мусить мати чотири основні складники: відеоспостереження, давачі, «інтелектуальні» блоки розеток, програмні засоби для моніторингу й автоматизації.

Відеоспостереження й давачі

Масштабовна система моніторингу й автоматизації може нагромаджувати, організовувати та розповсюджувати важливі попереджувальні сигнали й записи відеоспостереження. Контроль живлення, охолодження, спостереження з фасаду й тилу стояків, заміри параметрів середовища забезпечують оперативне генерування такими системами сигналів про відмови, дозволяють швидко оцінювати ситуацію й реагувати на істотні події в інфраструктурі, що можуть негативно позначитися на експлуатаційній готовності ІТ комплексу.

До системи відеоспостереження можуть приєднуватися давачі руху. Щойно буде виявлено рух, камера вмикатиметься, панорамуватиме ділянку й пересилатиме відеозапис уповноваженому адміністраторові, здатному швидко відреагувати на ситуацію, наприклад, на те, що хтось пакує в самозатяжну плівку сервери, що діють.

Система керування камерами зазвичай дозволяє відстежувати персонал об’єкту, постачальників, служби безпеки, наглядачів та інших відвідувачів серверної або віддаленого комутаційного вузла. Адміністратор може, при потребі, зайти до системи дистанційно й спостерігати за діями осіб, що знаходяться в приміщенні. Деякі системи обладнані гучномовцями, через які адміністратор може давати відвідувачам настанови або попередження.

«Інтелектуальні» блоки розеток

«Інтелектуальні» блоки розеток або стоякові БРЖ — це довгі розмножувачі, змонтовані на тильній панелі стояка всередині. Ці пристрої дозволяють дистанційно вимикати й повторно вмикати живлення заблокованого пристрою, налаштовувати послідовність ввімкнення та вимкнення живлення в кожній розетці, визначати, які елементи апаратури вмикати першими, щоб інші елементи, залежні від них, діяли штатно.

Система моніторингу запобігає перевантаженням шляхом вимірювання фактичного споживання енергії через розетки «інтелектуального» блоку. Адміністратори отримують від неї інформацію, потрібну, щоб вирішити, де встановлювати нове устаткування.

Програмні засоби моніторингу й автоматизації

Система керування й автоматизації постачає адміністраторам великі об'єми даних, призначених для зменшення простоїв через помилки персоналу, зокрема:
  • Тривожні сигнали й сигнали про перевищення граничних даних — електронною поштою, СМС, телефоном чи в інший обраний користувачем спосіб.
  • Результати перевірки стану технічних засобів — від серверів до акумуляторів. Слід пам’ятати, що вихід з ладу акумулятора може призвести до вимкнення відповідальної апаратури. Вартість заміни акумулятора чи двох мінімальна, порівняно з відмовою, через яку виходить з ладу сервер чи цілий комутаційний вузол.
  • Звітність і аналітика: Нагромаджені системою моніторингу дані можна перетворити в адаптивні звіти, які подаються адміністраторові ІТ до перегляду. Звіти можуть попередити адміністратора про небажані ситуації, наприклад, коливання температури, показати, хто й як довго перебував біля того чи іншого стояка, наскільки завантажене те чи інше ДБЖ.
  • Пакетне налаштовування: Адміністратори можуть передавати в пакетному режимі команди на змінення на всі пристрої, профілі яких зберігаються в центральній системі моніторингу й автоматизації, наприклад, одночасно замкнути двері на 50 стояках, щоб уберегти їх від надміру ретельних прибиральників.
  • Керування: Система моніторингу й автоматизації з належним рівнем деталізації даних дає адміністраторам інформацію, необхідну, щоб перебрати на себе керування в разі порушень штатного режиму. Наприклад, система може співставити зв’язки й залежності в схемі живлення й технічних засобах, що допоможе виявити причину порушення. Вона може також проілюструвати наслідки виходи з ладу того чи іншого пристрою на змонтоване в стояку устаткування, що корисно для вивчення критичності впливу окремих елементів на діяльність у цілому.
Краща регульованість параметрів середовища, більше сигналів та ретроспективних даних допоможуть знизити рівень стресу в робочому середовищі — а значить, і кількість простоїв. Докладніше — в аналітичній доповіді APC by Schneider Electric «Як за допомогою системи моніторингу запобігти помилкам персоналу в розподілених серверних та віддалених комутаційних вузлах».