Obsah:
Napriek nášmu najväčšiemu úsiliu sa im vyhnúť, IT incidenty sú nevyhnutnou súčasťou práce - a snaha udržať si náskok pred výpadkami, ktoré majú dosah na podnikanie, je len zložitejšia. Systémy sú dnes pevne spojené a stále zložitejšie a s pohyblivejšími časťami prichádzajú ďalšie príležitosti, aby sa veci pokazili.
To je jeden z dôvodov, prečo sa čoraz viac organizácií obracia na mikroservisy kvôli zvýšenej dostupnosti služieb a lepšej odolnosti voči zlyhaniu. Aj keď sú to vynikajúce priestory na prerušenie monolitických aplikácií, môžu tiež potenciálne zvyšovať riziko zlyhania - pokiaľ nie sú navrhnuté výslovne s ohľadom na odolnosť.
Príprava na zlyhanie
Vzhľadom na neodmysliteľnú chaotickú povahu distribuovaných systémov by sa služby nemali vyvíjať len na predvídanie zlyhania, ale v prípade zlyhania by sa mali automaticky obnovovať. To znamená pravidelné spúšťanie porúch, aby sa zabezpečilo, že vaše systémy dokážu zvládnuť chaos bez prerušenia služieb koncovým zákazníkom. A na dosiahnutie tohto cieľa potrebujete schopnosť simulovať produkciu podobnú prevádzke v testovacích prostrediach.