Jak wspominaliśmy już w powiązanym poście, wielu menedżerów IT opowiada o przestojach w rozproszonych serwerowniach i pomieszczeniach sieciowych, których przyczyną są niespodziewane, ale dość typowe zdarzenia. Z analizy tych historii wyłania się jeden wspólny wątek: niedoinformowanie, które prowadzi do błędów ludzkich, a w konsekwencji do przestojów.
Wystarczy spojrzeć na poniższe dane:
- Według szacunków IDC w samych Stanach Zjednoczonych funkcjonuje 2,9 miliona serwerowni i pomieszczeń sieciowych.
- Zgodnie z danymi Uptime Institute bezpośrednią przyczyną ponad 70% awarii zasilania centrów danych jest błąd ludzki.
Nadzór wideo i czujniki
Skalowalne systemy do monitoringu i automatyzacji mogą gromadzić, organizować oraz rozsyłać krytyczne alerty i nagrania wideo z kamer nadzoru. Systemy te monitorują zasilanie i chłodzenie szaf serwerowych oraz ich otoczenia. Generują natychmiastowe powiadomienia i umożliwiają szybką ocenę zdarzeń w infrastrukturze o newralgicznym znaczeniu oraz eliminowanie problemów, które negatywnie wpływają na dostępność systemów IT.
Systemy nadzoru wideo mogą być powiązane z czujnikami ruchu. Po wykryciu ruchu kamera automatycznie dokonuje przeskanowania danego miejsca i wysyła obraz wideo do uprawnionego administratora. W efekcie można szybko zapobiec niebezpiecznym sytuacjom, takim jak pakowanie przez podwykonawców uruchomionych serwerów w folię termokurczliwą.
System zarządzania kamerami zwykle umożliwia śledzenie ruchów pracowników obiektu, dostawców, członków ochrony, dozorców i innych osób odwiedzających serwerownię lub pomieszczenie z okablowaniem. Administrator może zdalnie zalogować się do systemu i obserwować zachowanie każdego, kto znajduje się w nadzorowanej lokalizacji. Niektóre systemy mogą być wyposażone w głośniki, przez które administrator może przekazywać instrukcje lub ostrzeżenia przebywającym w danym pomieszczeniu osobom.
Inteligentne gniazda listew zasilających
Inteligentne gniazda listew zasilających, znanych też jako listwy zasilające do montażu w szafie, to długie, wąskie panele gniazd elektrycznych instalowane w tylnej części szafy. Pozwalają one użytkownikom zdalnie zarządzać zasilaniem sprzętu w zamkniętym pomieszczeniu i konfigurować sekwencję włączania oraz wyłączania zasilania w każdym z gniazd. Zapewniają one odpowiednią kolejność uruchamiania urządzeń i ich prawidłową pracę.
System monitoringu zapobiega przeciążeniom, mierząc faktyczny pobór energii za pomocą inteligentnych gniazd listew zasilających, i przekazuje administratorom informacje potrzebne do podejmowania decyzji o rozmieszczeniu nowego sprzętu.
Oprogramowanie do monitoringu i automatyzacji
System do zarządzania i automatyzacji dostarcza administratorom dane o stanie sprzętu i ogranicza przestoje spowodowane błędem ludzkim za pomocą:
- Ostrzeżeń i powiadomień o przekroczeniu wartości progowych mocy przekazywanych pocztą e-mail, SMS-em, telefonicznie lub dowolną inną metodą wybraną przez użytkownika.
- Raportów o stanie wszystkich urządzeń, od akumulatorów po serwery. Należy pamiętać, że awaria nawet jednego akumulatora może spowodować uszkodzenie newralgicznego obciążenia. Koszt wymiany jednego czy dwóch akumulatorów jest minimalny w porównaniu ze skutkami awarii serwera lub całej infrastruktury.
- Raportowanie wyników analiz: Dane gromadzone przez system monitoringu można przedstawiać w formie spersonalizowanych raportów przeznaczonych dla administratorów IT. Mogą one informować na przykład o wahaniach temperatury, obciążeniu danego zasilacza UPS oraz o tym, kto i jak długo zajmował się daną szafą.
- Konfiguracja masowa: Administratorzy mogą wysyłać polecenia masowo, do wszystkich urządzeń objętych centralnym systemem monitoringu i automatyzacji, na przykład blokując jednocześnie wszystkie 50 par drzwi szaf w celu zabezpieczenia ich przed nadgorliwym personelem sprzątającym.
- Kontrola: Szczegółowe dane z systemu monitoringu i automatyzacji pomagają administratorom przejąć kontrolę w przypadku problemów. System może na przykład prześledzić ścieżkę zasilania oraz zależności między fizycznymi elementami systemu, dzięki czemu zlokalizowanie źródła problemu jest łatwiejsze. Symuluje on również konsekwencje awarii danego urządzenia dla zamontowanego w szafie sprzętu, umożliwiając analizę wpływu takiego zdarzenia na działalność firmy.