Maksimum Çalışma Süresini Riske Atan 4 Arıza Çeşidi ve Bunlardan Korunmanın Yolları

Maksimum çalışma süresi bir arzulanan bir idealdir. Maksimum çalışma süresi, tesisin planlanmasıyla başlar ve tasarım, yapım, devreye alma, işletim, hata analizi ve yeniden devreye alma gibi tüm aşamalarda devam eden bir süreç olarak kalır.

Veri merkezi operatörleri, havayolları gibi kritik koşullar altında faaliyet gösteren diğer sektörlerden örnek alabilir. Herhangi bir hava trafik olayında, Ulusal Ulaşım Güvenlik Kurulu (NTSB) olayı inceler ve sonunda "çıkarılan dersler" şeklinde bir belge yayınlar. Buradaki ana fikir, gelecekte buna benzer bir olayın tekrar etmesini önlemeye çalışmaktır. Kritik veri merkezlerinde maksimum çalışma sürelerinin sağlanması da şirketlerin benzer bir yaklaşım edinmesini gerektirir.

NTSB, kazaların bir veya daha fazla arıza çeşidi nedeniyle meydana geldiğini söylüyor: tasarım hataları, katastrofik arızalar, bileşik arızalar ve insan hataları. Kritik öneme sahip tesislerdeki arıza süreleri, bu dört çeşit arıza nedeniyle ortaya çıkabilir ve her birinin önlenmesi farklı bir yaklaşım gerektirdiği gibi "çıkarılan dersler" de farklı olacaktır.

1. Tasarım hataları

Tasarım hataları, doğru planlama ile ve yetkili satıcılarla işbirliği yaparak ortadan kaldırılabilir. Sonunu düşünerek başlayın ve gereksinimlerinizi açıkça ve detaylı bir şekilde dile getiren bir tasarım niyet belgesi hazırlayın. Yeni bir yapım, yükseltme veya mevcuttaki kritik bir tesisin işletilmesi olsun, çalışmaların dikkatlice planlanması ve planlananın dikkatlice uygulanması oldukça önemlidir. Bu tarz hataları azaltmak için iyi eğitimli operasyon personeline sahip iyi bir tasarım firması, entegrasyon firması, inşaat firmaları ve devreye alma ekipleri ile çalışılması da büyük önem taşır.

2. Yıkıcı arızalar

Kapsamlı bir bakım ve işletim programı, mümkün olduğunca çok potansiyel sorunun belirlenmesinde ve ortadan kaldırılmasında rol oynayarak yıkıcı arızaları önlemeye yardımcı olabilir. Bakım gerçekleştirilirken hizmetlerde kesinti yaşanmaması için programınızda iyi tanımlanmış bakım zamanları belirlenmiş ve uygun yedekleme dahil edilmiş olmalıdır. Başka bir önemli husus da öngörücü bakımdır. Öngörücü bakım, NTSB'nin "çıkarılan dersler" programında uyguladığı yaklaşıma benzer bir şekilde, her olaydan sonra kapsamlı bir arıza analizi yapılması ve bu analiz sonuçlarının gelecekteki sorunları tahmin edip önlemek için kullanılması demektir. Operasyon ve bakım personeli için kapsamlı bir eğitim programının olması da önemlidir. Bu eğitim, ekipman üreticileri veya kurulumcularla başlamalı, ancak en güncel bilgilerle donatılmalarını sağlamak amacıyla operasyon ve bakım personeline düzenli eğitimler verilmelidir.

3. Bileşik arızalar

Bazen bir arızaya neden olan ve bileşik arıza olarak bilinen birden çok olay gerçekleşir. Detayların gözden kaçırılması bileşik arızaların önde gelen nedenlerinden biridir. Veri merkezinizde bir elektrik kesintisi meydana geldiğinde neler olduğunu düşünün. Jeneratörünüze bir başlatma sinyali gitmeli ve hemen devreye girmelidir. Ancak eğer jeneratörünüzün bataryasını, yakıt ve soğutucu seviyelerini aylarca kontrol etmeyi ihmal ettiyseniz sizi yarı yolda bırakabilir. Benzer şekilde, büyük bir tesisteki küçük sıkıntılar bazen fark edilmez ve kendi başlarına tesiste hiçbir kötü etkiye neden olmasalar da diğer sorunlarla bir araya geldiklerinde bir sistem arızası meydana getirebilirler.

4. İnsan hataları

İnsan hatası kritik tesislerde meydana gelen arızaların önde gelen nedenlerinden biridir. Yukarıda da işaret edildiği gibi eğitim, insan hatalarının meydana gelmesini azaltmaya yardımcı olabilir, ancak bir başka şart da detaylandırılmış prosedür yöntemlerinin (MOP) belirlenmiş olmasıdır. Bu prosedürler, çeşitli bakım fonksiyonlarının nasıl gerçekleştirileceğini detaylı bir şekilde tanımlar ve her seferinde aynı şekilde yapılmasını sağlar. Genellikle tesisi çalışır hale getirmek için acele eden işletmeler, bu prosedürleri geliştirmek, belgelemek ve dağıtmakta başarısız olurlar. Bu prosedürler, tesis tam olarak faaliyete geçmeden önce geliştirilmeli ve test edilmelidir. UPS sistemini bakım baypasına aktarmak için bir prosedür geliştirmeyi beklemek, kaçınılmaza hazırlanma niyetiyle önceden zaman ayırmaktan çok daha pahalıya mal olabilir. Bu prosedürlerin tam olarak uygulanacağından emin olmak için prosedürlerin öncesinde pilot/yardımcı pilot yaklaşımıyla uygulanmış olması gerekir

En iyi uygulamalarla ilgili daha fazla bilgi almak için, Schneider Electric'in Kritik Tesislerdeki Çalışma Süresinin Maksimize Edilmesi başlıklı 7 numaralı tanıtım yazısını okuyabilirsiniz.