Q:
Ako spoločnosti maximalizujú dostupnosť?
A:Udržiavanie prevádzky IT služieb je samozrejme dôležité. Výrobcovia systémov venovali tejto téme veľa premýšľania. Niektoré kritické finančné počítače fungujú nepretržite roky. Na internete je príbeh o počítači Novell Netware 3, ktorý bol po 16 rokoch konečne vypnutý. Pri zvažovaní dostupnosti siete je štandardom dostupnosť „Päť 9 s“ alebo 99, 999%. Dosiahnutie maximálnej doby prevádzkyschopnosti je dôležitým faktorom pri akejkoľvek ponuke služieb IT.
Ako sa dosiahne maximálna doba prevádzkyschopnosti? Kľúčom je dobré riadenie. Medzinárodná organizácia pre normalizáciu (ISO) vytvorila rámec pre správu siete s názvom FCAPS, ktorý znamená:
- Správa porúch
- Správa konfigurácie
- Vedenie účtovníctva
- Riadenie výkonnosti
- Riadenie bezpečnosti
Pomocou tohto modelu sa proaktívne a reaktívne riešia problémy s jednotlivými sieťovými komponentmi. Poruchy sa monitorujú pomocou alarmov a upozornení na udalosti. Zhromažďujú ich agenti protokolov, ako je SNMP (systémový protokol pre správu siete) alebo niektoré iné proprietárne riešenia. Prispôsobiteľné prahy môžu spustiť poplachy a dokonca automaticky vygenerovať lístky, ktoré skončia vo frontoch monitorovacieho personálu v dátových centrách. Veľké dopravné siete môžu mať samostatné oddelenia, ktoré sa zaoberajú základnými, distribučnými alebo prístupovými vrstvami siete. Analýza koreňovej príčiny sa pokúša odhaliť a definovať kritické problémy po významnej udalosti.
Podobné procesy sa používajú na správu systému. Poskytovatelia internetových služieb (ISP) a spravované hostingové centrá zamestnávajú správcov systému na monitorovanie a správu životaschopnosti serverov, úložných systémov alebo iných zariadení. Napríklad jednotlivé procesy na počítačoch so systémom Windows alebo Linux je možné prezerať a riadiť pomocou programov na správu grafického používateľského rozhrania (GUI) rovnakým spôsobom ako sieťové protokoly.
Diaľkový dohľad a konfigurácia sieťových komponentov a systémov poskytujú možnosti v reálnom čase na maximalizáciu doby prevádzky systému. To sa týka zmien konfigurácie, zhromažďovania kľúčových ukazovateľov výkonu alebo implementácie vylepšenia bezpečnosti.
Jedným zo spôsobov, ako sa pozrieť na dostupnosť a robustnosť akéhokoľvek systému, je model, ktorý spoločnosť IBM nazývala RAS: spoľahlivosť, dostupnosť a servisovateľnosť. Na zabezpečenie RAS bolo vyvinutých veľa metód. Patria medzi ne redundancia, zálohovanie údajov, nepretržité napájanie (UPS), komponenty vymeniteľné za chodu a automatické aktualizácie. Plánované zmeny a okná údržby ponúkajú príležitosti na opravu alebo zlepšenie známych problémov bez toho, aby to používateľa obťažovalo.
Nakoniec systémy a siete zlyhajú. Redundancia je jedným z kľúčov k odolnosti systému. To sa môže týkať hardvéru, softvéru alebo údajov. Osoby zodpovedné za zabezpečenie spoľahlivosti v sieti alebo softvérovom systéme budú hľadať to, čo možno považovať za jediné miesto zlyhania (SPOF). Prechádza celá sieť cez jediný prepínač alebo kábel? Prebiehajú všetky procesy na samostatnom serveri? Existuje iba jedna kópia súboru kritických údajov? Bez nadbytočnosti môže spoločnosť - v okamihu - stratiť to, čo mohlo trvať roky, kým sa rozvinie.
Maximalizácia doby prevádzkyschopnosti je „všetko vyššie uvedené“. Osvedčené postupy boli vyvinuté na základe desaťročí skúseností a spolupráce. Neustále sa zavádzajú nové riešenia, ako sú samoliečiace siete, virtualizácia, analýza údajov a vylepšená architektúra. Žiadna jediná metóda neodpovedá na všetky problémy, ktoré sa vyskytujú v zložitých systémoch. Každá spoločnosť sa snaží v rámci životného cyklu zariadenia, ktoré má k dispozícii, čo najefektívnejšie využívať svoje zdroje IT.