Bu konuyla ilgili bir yazıda açıkladığımız gibi, çok sayıda IT yöneticisinin dağıtılmış sunucu odalarında ve uzak kablolama kabinlerinde beklenmedik ancak rutin olaylardan kaynaklanan arıza hikayeleri anlattıklarını duyabilirsiniz. Bu hikayeleri analiz ettiğimizde bir noktada ortaklaştıklarını görürüz: arızalara neden olan insan hatalarının nedeni bilgi eksikliğidir.

Şu istatistikleri değerlendirin:

  • IDC yalnız ABD'de 2,9 milyon sunucu odası ve kablolama kabini bulunduğunu tahmin ediyor.
  • Uptime Institute'e göre, bildirilen veri merkezi arızalarının %70'ten fazlası doğrudan insan hatalarından kaynaklanıyor.
Maliyet yaratan arıza sürelerini önlemek için ihtiyacınız olan bilgileri sağlayacak bir izleme sistemi tasarlayabilirsiniz. Birincil görevi uzak sunucu odalarında gerçekleşecek insan hatalarını sınırlamak olan bir sistem için, bu dört temel bileşeni göz önünde bulundurun: videolu gözetim, sensörler, akıllı kabin prizleri, izleme ve otomasyon yazılımı.

Videolu gözetim ve sensörler

Ölçeklenebilir izleme ve otomasyon sistemleri, kritik uyarıları ve denetim videolarını toplar, düzenler ve dağıtır. Gücü, soğutma sistemini, kabinlerin ön ve arka cephelerini ve ortamı izleyen bu sistemler, anlık arıza bildirimleri oluşturarak durumun hızlıca değerlendirilmesini sağlar ve IT sisteminin kullanılabilirliğini olumsuz etkileyebilecek kritik altyapı olaylarının çözümlenmesini sağlar.

Videolu gözetim sistemleri, bir hareket algılandığında, kamerayı tetikleyerek bu alana çeviren ve videoyu yetkili bir yöneticiye gönderen hareket sensörlerine bağlanabilir; böylece yönetici aksiyon alarak durumu hızlı bir şekilde düzeltebilir.

Bir kamera yönetim sistemi, sunucu odasına ya da uzak kablolama kabinine giren personelin, satıcıların, güvenlik personelinin, sorumluların ve diğer ziyaretçilerin takibinin yapılmasını sağlar. Bir yönetici, uzaktan sisteme giriş yaparak kabinde herhangi biri tarafından gerçekleştirilen tüm eylemleri gözlemleyebilir. Bazı sistemler hoparlörler ile donatılmış olabilir, böylece yönetici talimatlarını ziyaretçiye sesi olarak iletebilir ve sesli uyarılarda bulunabilir.

Akıllı kabin prizleri

Kabine monte PDU'lar olarak da bilinen akıllı kabin prizleri, bir kabinin arka tarafına içeriden monte edilmiş uzun ince elektrik prizi şeritleridir. Cihazlar, kullanıcıların kilitli ekipmanı uzaktan kontrolle yeniden başlatmasını ve her priz için gücün açılıp kapanma sırasını yapılandırmasını sağlar; böylece ekipmanın hangi parçasının ilk olarak açılacağı ve ona bağlı diğer ünitelerin düzgün bir şekilde işleyeceği önceden belirlenebilir.

İzleme sistemi, akıllı kabin prizleri yoluyla gerçek tüketimi ölçerek yöneticilere yeni ekipmanın nereye yerleştirileceği konusunda karar verebilmeleri için ihtiyaç duydukları bilgileri verir ve böylece aşırı yük durumlarını engeller.

İzleme ve otomasyon yazılımı

Bir yönetim ve otomasyon sistemi, yöneticilere insan hatasından kaynaklanan arıza sürelerini azaltacak çok sayıda veri sunar:
  • E-posta, kısa mesaj, telefon görüşmesi yoluyla ya da kullanıcının seçtiği başka birçok yöntemle, eşikler aşıldığında gönderilen alarm ve bildirimler.
  • Sunuculardan bataryalara kadar her şey için donanım durumu kontrolleri. Tek bir bataryadaki arızanın bile kritik yük kayıplarına neden olabileceğini unutmayın. Bir ya da iki bataryanın değiştirilme maliyeti, kabin veya sunucunun çökmesine neden olan bir hataya kıyasla çok daha azdır.
  • Raporlama analitikleri: Bir izleme sistemi tarafından toplanan veriler, IT yöneticilerinin gözden geçirebileceği özelleştirilmiş raporlara dönüştürülebilir. Bu tür raporlar; sıcaklık dalgalanmaları, kim ne kadar zamandır hangi kabinde bulunuyor ve belirli bir UPS üzerinde ne kadar yük var gibi durumlarda yöneticileri uyarabilir.
  • Toplu konfigürasyon: Yöneticiler, örneğin kabinlerin temizlikçiler tarafından gereğinden fazla temizlenmesini önlemek için merkezi izleme ve otomasyon sistemine dahil tüm cihazlar için 50 kabin kapısını bir kerede kilitlemek gibi toplu değişiklik emri verebilir.
  • Kontrol: İzleme ve otomasyon sisteminden gelen ayrıntılı veriler, yöneticilere ortaya çıkan sorunları kontrol altına almaları için gereken bilgileri verir. Örneğin, bir sistem, bir sorunun kaynağını belirlemeye yardımcı olmak için, güç yolu ve fiziksel sistem arasındaki ilişkilerin ve bağımlılıkların bir haritasını çıkarabilir. Bir sistem aynı zamanda, işe olan kritik etkisini belirlemenize yardımcı olmak için, kabin tabanlı ekipmandaki belirli bir cihaz arızasının sonucunda neler olabileceğini gösterebilir.
Ortam üzerinde daha fazla kontrole sahip olmak, daha çok uyarının ve tarihsel verinin olması, ortamda daha az stres oluşmasına ve arıza sürelerinin azalmasına yardımcı olabilir. Daha fazla bilgi edinmek için APC by Schneider Electric'in “İzleme Çözümleri, Dağınık Sunucu Odalarında ve Uzak Kablolama Kabinlerindeki İnsan Hatasını Nasıl Azaltır” başlıklı teknik makaleyi okuyun.