Leállás megakadályozása a szerver- és hálózati szobákban

Egy korábbi bejegyzésben körüljártuk, hogy sok informatikai vezető megtapasztalja, milyen az osztott szerverszobák és a távoli hálózati szekrények leállása, melyet akár váratlan, de legtöbbször mindennapos események okoznak. A hallott történeteket megvizsgálva egy közös pontot találunk: a tájékoztatás hiányát, ami emberi hibához vezet, az pedig leálláshoz.

Néhány statisztika:

  • Az IDC becslése szerint csak az Egyesült Államokban 2,9 millió szerverszoba és hálózati helyiség működik.
  • Az Uptime Institute szerint az ismert adatközponti áramszünetek több mint 70%-ánál az emberi hiba a közvetlen kiváltó ok.
A költséges leállás elkerülése érdekében érdemes felügyeleti rendszert kidolgozni, amely begyűjti a szükséges adatokat. Ha a rendszer elsődleges feladata, hogy csökkentse az emberi hibák számát a távoli szerverszobákban, mindenképpen rendelkeznie kell a következő négy összetevővel: videofelügyelet, érzékelők, intelligens rackaljzatok, felügyeleti és automatizálási szoftver.

Videofelügyelet és érzékelők

A skálázható felügyeleti és automatizálási rendszerek mentik, rendszerezik és továbbküldik a releváns riasztásokat és felügyeleti videókat. Azzal, hogy figyelik az energiaellátást, a hűtést, a rackek elejét és hátulját, illetve a környezetet, a rendszerek azonnal jelzik a hibákat. Így gyorsan értékelhető a helyzet, és elháríthatók az infrastruktúrát érintő kritikus események, amelyek egyébként veszélyeztetnék az informatikai rendszer elérhetőségét.

A videofelügyeleti rendszerek összekapcsolhatók a mozgásérzékelőkkel úgy, hogy mozgás érzékelésekor a berendezés beindítja a kamerát, amely felvételt készít a területről, és a videót elküldi az illetékes munkatársnak. Ő pedig gyorsan intézkedhet, ha például valaki éppen zsugorfóliával csomagolja be a működő szervert.

A kamerás felügyeleti rendszereket általában azzal a céllal üzemeltetik, hogy kövessék az épületben dolgozó munkatársak, a gyártók, a biztonsági személyzet, az őrök és egyéb látogatók mozgását a szerverhelyiségben és a távoli vezérlésű hálózati helyiségben. A távolban dolgozó illetékes munkatárs bármikor bejelentkezhet a rendszerbe, és ellenőrizheti a helyiségben zajló tevékenységet. A rendszerek hangszóróval is felszerelhetők, így a munkatárs utasításokat adhat a helyiségben tartózkodó személynek, vagy éppen figyelmeztetheti őt.

Intelligens rackaljzatok

Intelligens rackaljzatok, más néven rackbe szerelt PDU-k: több elektromos aljzat hosszúkás, vékony alakzatba rendezve és a rack belsejének hátsó részébe szerelve. Segítségükkel a felhasználók távolról átirányíthatják az energiát a lekapcsolt berendezésektől; beállíthatják, hogy az áramellátás milyen szabályok szerint kapcsoljon be és ki az egyes aljzatoknál, és melyik berendezés kapcsoljon be először, így az ettől az egységtől függő többi berendezés megfelelően működik majd.

A felügyeleti rendszerrel elkerülhető a túlterhelés: a rendszer a rack intelligens aljzatain keresztül méri a tényleges energiafogyasztást, így a személyzet a szükséges információk birtokában dönthet az új berendezések helyéről.

Felügyeleti és automatizálási szoftver

A felügyeleti és automatizálási rendszer rengeteg adatot szolgáltat a személyzetnek, így csökkenthető az emberi hiba okozta leállások száma. A rendszer feladatai többek között:
  • A határértékek átlépésekor riasztás és értesítés e-mailben, SMS-ben, telefonon vagy egyéb csatornán, a felhasználó választása szerint.
  • A berendezés állapotának átfogó ellenőrzése a szerverektől az akkumulátorokig. Ne feledje, hogy egyetlen akkumulátor hibája miatt is csökkenhet a kritikus terhelés! Egy vagy két akku cseréjének költsége minimális egy olyan hibához képest, amely a szekrény vagy szerver teljes leállását okozza.
  • Jelentések és elemzések: A felügyeleti rendszer által küldött adatokból egyedi jelentések készíthetők a rendszergazda számára. Ezek a jelentések olyan eseményekre hívhatják fel az informatikusok figyelmét, mint a hőmérséklet-ingadozás, ki mennyi időt töltött a racknél, vagy mekkora a terhelés egy adott szünetmentes áramforrásnál.
  • Tömeges konfigurálás: Az informatikusok tömeges módosítási parancsokat adhatnak ki a központi felügyeleti és automatizálási rendszerhez tartozó összes eszközre vonatkozóan, például lezárhatnak 50 rackajtót egyszerre, ha úgy látják, hogy jobb megóvni azokat a túlbuzgó takarítóktól.
  • Vezérlés: A felügyeleti és automatizálási rendszertől érkező részletes adatok tartalmaznak minden információt, melyre az informatikusoknak szükségük van a problémák megoldásához. A rendszerrel például feltérképezhető az áram útja, valamint a fizikai rendszerben található kapcsolatok és függő viszonyok – mindez segít megtalálni a probléma okát. De jelezheti a rackalapú berendezésben keletkezett eszközhibák következményeit is – ezzel a kritikus üzleti hatások azonosítását könnyíti meg.
A környezet fokozott ellenőrzése, a több riasztás és a több előzményadat kevésbé leterhelt környezetet eredményez – és így a leállás is ritkább. Ha érdekli a téma, töltse le az APC by Schneider Electric „Hogyan csökkentik a felügyeleti rendszerek az emberi hiba lehetőségét az osztott szerverhelyiségekben és a távoli hálózati helyiségekben?” című tanulmányát.
Your browser is out of date and has known security issues. It also may not display all features of this website or other websites. Please upgrade your browser to access all of the features of this website. Internet Explorer 9 or higher is recommended for optimal functionality.

Chat

Do you have questions or need assistance? We’re here to help!