4 Typy poruch, které ohrožují maximální provozuschopnost – a jak se jim vyhnout

Maximální doba provozuschopnosti je filozofie. Ta začíná už s plánováním vašeho zařízení a zůstává kontinuálním procesem při každém kroku, od návrhu, výstavby, uvedení do provozu, provozu, analýzy poruch a opětovném uvedení do provozu.

Provozovatelé datových center si mohou vzít příklad z jiných odvětví, které působí v kritických podmínkách, jako jsou například letecké společnosti. Kdykoli se přihodí nějaký druh letecké nehody, úřad National Transportation Safety Board (NTSB) ji vyšetří a nakonec vydá dokument nazvaný „Získané poznatky“. Cílem je zabránit v budoucnu opakování této nehody. Zajištění maximální provozuschopnosti v kritických datových centrech vyžaduje, aby společnosti přijaly podobný postup.

Agentura NTSB říká, že k nehodám dochází v důsledku jednoho nebo více typů poruch: Konstrukční chyby, katastrofální poruchy, sloučené poruchy a poruchy vlivem lidské chyby. Odstávky kritických zařízení lze rovněž přičíst těmto čtyřem typům poruch a každá z nich vyžaduje jiný přístup k prevenci a jiné programy získaných poznatků.

1. Konstrukční chyby

Konstrukční chyby lze odstranit prostřednictvím správného plánování a použitím schopných dodavatelů. Myslete už na začátku na konec a vytvořte dokument koncepce, který jasně a detailně uvádí vaše požadavky. Ať už je to nová instalace, modernizace nebo provoz stávajícího kritického zařízení, je důležité práci pečlivě naplánovat a plán zapracovat. Pro snížení poruchovosti je také důležité mít dobrou projekční kancelář, koordinační firmu, stavební společnosti a tým pro uvedení do provozu spolu s dobře vyškoleným obslužným personálem.

2. Katastrofální poruchy

Komplexní údržba a provozní programy mohou identifikovat a eliminovat co nejvíce potenciálních problémů a pomoci vám vyhnout se katastrofálním selháním. Váš program by měl zahrnovat dobře definovaná okna údržby s vhodnou redundancí vybudovanou tak, aby při provádění údržby nebyl provoz přerušen. Prediktivní údržba je dalším důležitým aspektem, který s sebou nese provedení důkladné analýzy selhání po každém incidentu a využití výsledků pro předvídání a předejití budoucím problémům – stejně jako to dělá úřad NTSB se získanými poznatky. Je také důležité mít komplexní vzdělávací program pro zaměstnance provozu a údržby, který začíná odbornou přípravou od výrobců zařízení nebo montérů, ale pokračuje pravidelným školením za účelem doškolování pracovníků provozu a údržby.

3. Sloučené poruchy

Někdy je porucha výsledkem více událostí, což je situace známá jako sloučené poruchy. U sloučených poruch je hlavní příčinou nedostatečný důraz na detail. Představte si, co se stane, pokud vaše datové centrum potká výpadek proudu. Váš generátor by měl obdržet signál pro spuštění a okamžitě nastartovat. Ale pokud jste několik měsíců zanedbali kontrolu baterie generátoru, doplnění paliva nebo chladící kapaliny, může vás nechat na holičkách. Podobně malé položky ve velkém zařízení jsou někdy ponechány bez povšimnutí a samy o sobě nemají na zařízení žádný negativní vliv, ale mohou se spojit s dalšími problémy a způsobit selhání systému.

4. Poruchy vlivem lidské chyby

Lidská chyba je hlavní příčinou poruch u kritických zařízení. Jak je uvedeno výše, školení může pomoci snížit výskyt selhání lidského faktoru, ale dalším požadavkem jsou podrobné pracovní postupy (MOP). Tyto postupy podrobně určují, jak provádět různé funkce údržby, což zajišťuje, že tyto postupy jsou neustále prováděny stejným způsobem. Příliš často ve spěchu při uvádění zařízení do provozu organizace nevypracuje, nezdokumentuje a nepoužije podrobné pracovní postupy (MOP). Tyto postupy by měly být vypracovány již v rané fázi a otestovány ještě předtím, než je zařízení zcela funkční. Čekání s vývojem postupu pro přemístění záložního zdroje UPS do bypassu údržby by mohlo být mnohem nákladnější, než investovat čas předem na přípravu toho, co je nevyhnutelné. Podrobné pracovní postupy by rovněž měly být vypracovány pro případ zastupování, aby se zajistilo přesné dodržení postupu.

Chcete-li se dozvědět více osvědčených postupů, podívejte se do white paper 7 Schneider Electric, Maximalizace doby provozuschopnosti u kritických zařízení.