Egy korábbi bejegyzésben körüljártuk, hogy sok informatikai vezető megtapasztalja, milyen az osztott szerverszobák és a távoli hálózati szekrények leállása, melyet akár váratlan, de legtöbbször mindennapos események okoznak. A hallott történeteket megvizsgálva egy közös pontot találunk: a tájékoztatás hiányát, ami emberi hibához vezet, az pedig leálláshoz.

Néhány statisztika:

  • Az IDC becslése szerint csak az Egyesült Államokban 2,9 millió szerverszoba és hálózati helyiség működik.
  • Az Uptime Institute szerint az ismert adatközponti áramszünetek több mint 70%-ánál az emberi hiba a közvetlen kiváltó ok.
A költséges leállás elkerülése érdekében érdemes felügyeleti rendszert kidolgozni, amely begyűjti a szükséges adatokat. Ha a rendszer elsődleges feladata, hogy csökkentse az emberi hibák számát a távoli szerverszobákban, mindenképpen rendelkeznie kell a következő négy összetevővel: videofelügyelet, érzékelők, intelligens rackaljzatok, felügyeleti és automatizálási szoftver.

Videofelügyelet és érzékelők

A skálázható felügyeleti és automatizálási rendszerek mentik, rendszerezik és továbbküldik a releváns riasztásokat és felügyeleti videókat. Azzal, hogy figyelik az energiaellátást, a hűtést, a rackek elejét és hátulját, illetve a környezetet, a rendszerek azonnal jelzik a hibákat. Így gyorsan értékelhető a helyzet, és elháríthatók az infrastruktúrát érintő kritikus események, amelyek egyébként veszélyeztetnék az informatikai rendszer elérhetőségét.

A videofelügyeleti rendszerek összekapcsolhatók a mozgásérzékelőkkel úgy, hogy mozgás érzékelésekor a berendezés beindítja a kamerát, amely felvételt készít a területről, és a videót elküldi az illetékes munkatársnak. Ő pedig gyorsan intézkedhet, ha például valaki éppen zsugorfóliával csomagolja be a működő szervert.

A kamerás felügyeleti rendszereket általában azzal a céllal üzemeltetik, hogy kövessék az épületben dolgozó munkatársak, a gyártók, a biztonsági személyzet, az őrök és egyéb látogatók mozgását a szerverhelyiségben és a távoli vezérlésű hálózati helyiségben. A távolban dolgozó illetékes munkatárs bármikor bejelentkezhet a rendszerbe, és ellenőrizheti a helyiségben zajló tevékenységet. A rendszerek hangszóróval is felszerelhetők, így a munkatárs utasításokat adhat a helyiségben tartózkodó személynek, vagy éppen figyelmeztetheti őt.

Intelligens rackaljzatok

Intelligens rackaljzatok, más néven rackbe szerelt PDU-k: több elektromos aljzat hosszúkás, vékony alakzatba rendezve és a rack belsejének hátsó részébe szerelve. Segítségükkel a felhasználók távolról átirányíthatják az energiát a lekapcsolt berendezésektől; beállíthatják, hogy az áramellátás milyen szabályok szerint kapcsoljon be és ki az egyes aljzatoknál, és melyik berendezés kapcsoljon be először, így az ettől az egységtől függő többi berendezés megfelelően működik majd.

A felügyeleti rendszerrel elkerülhető a túlterhelés: a rendszer a rack intelligens aljzatain keresztül méri a tényleges energiafogyasztást, így a személyzet a szükséges információk birtokában dönthet az új berendezések helyéről.

Felügyeleti és automatizálási szoftver

A felügyeleti és automatizálási rendszer rengeteg adatot szolgáltat a személyzetnek, így csökkenthető az emberi hiba okozta leállások száma. A rendszer feladatai többek között:
  • A határértékek átlépésekor riasztás és értesítés e-mailben, SMS-ben, telefonon vagy egyéb csatornán, a felhasználó választása szerint.
  • A berendezés állapotának átfogó ellenőrzése a szerverektől az akkumulátorokig. Ne feledje, hogy egyetlen akkumulátor hibája miatt is csökkenhet a kritikus terhelés! Egy vagy két akku cseréjének költsége minimális egy olyan hibához képest, amely a szekrény vagy szerver teljes leállását okozza.
  • Jelentések és elemzések: A felügyeleti rendszer által küldött adatokból egyedi jelentések készíthetők a rendszergazda számára. Ezek a jelentések olyan eseményekre hívhatják fel az informatikusok figyelmét, mint a hőmérséklet-ingadozás, ki mennyi időt töltött a racknél, vagy mekkora a terhelés egy adott szünetmentes áramforrásnál.
  • Tömeges konfigurálás: Az informatikusok tömeges módosítási parancsokat adhatnak ki a központi felügyeleti és automatizálási rendszerhez tartozó összes eszközre vonatkozóan, például lezárhatnak 50 rackajtót egyszerre, ha úgy látják, hogy jobb megóvni azokat a túlbuzgó takarítóktól.
  • Vezérlés: A felügyeleti és automatizálási rendszertől érkező részletes adatok tartalmaznak minden információt, melyre az informatikusoknak szükségük van a problémák megoldásához. A rendszerrel például feltérképezhető az áram útja, valamint a fizikai rendszerben található kapcsolatok és függő viszonyok – mindez segít megtalálni a probléma okát. De jelezheti a rackalapú berendezésben keletkezett eszközhibák következményeit is – ezzel a kritikus üzleti hatások azonosítását könnyíti meg.
A környezet fokozott ellenőrzése, a több riasztás és a több előzményadat kevésbé leterhelt környezetet eredményez – és így a leállás is ritkább. Ha érdekli a téma, töltse le az APC by Schneider Electric „Hogyan csökkentik a felügyeleti rendszerek az emberi hiba lehetőségét az osztott szerverhelyiségekben és a távoli hálózati helyiségekben?” című tanulmányát.