Není nedostupnost jako nedostupnost, aneb jaký je vztah mezi RTO, WRT, MTD, AIW a MTO

Nerozumíte? Není se čemu divit, protože kromě té první zkratky tyhle pojmy skoro nikdo nepoužívá.

A navíc ne každý musí tyto pojmy vnímat úplně stejně a dokonce se v jejich výkladu neshodnou ani organizace provádějící certifikace v oblasti informační bezpečnosti.

Pojďme si tyto pojmy vysvětlit na nějakém jednoduchém příkladu, který by se mohl skutečně stát. Řekneme, že se objevil incident, službu je nutné zastavit a je snaha vyřešit incident v rámci AIW, jenže se zjistí, že incident je natolik závažný, že se to nestihne, protože např. došlo ke kompromitaci serveru a bude nutné spustit DRP, obnovit operační systém z originálních instalačních médií a rovněž i data ze záloh.

Jenže se už promrhal nějaký čas při řešení incidentu, takže je otázka, zda se to stihne dokončit v rámci AIW, ale buďme optimisté. Instalace serveru z originálních médií proběhla úspěšně a nyní se obnovují data ze záloh. Nakonec se vše stihlo v rámci RTO, a nyní se ještě provádí kontroly, zda je vše funkční, což zabere také nějaký čas, to je onen WRT. Jinými slovy pokud to stihneme před uplynutím AIW a dosáhneme SDO, tak je vše v pořádku, v opačném případě se řítíme do krize.

Systém nám běží na náhradním serveru, který není až tak výkonný, takže by se dalo říci, že běží v alternativním módu, ale přesto bylo nakonec v požadovaném čase dosaženo požadovaných parametrů služby, to je ono SDO, takže se dá prohlásit, že DRP proběhl úspěšně. Pokud by však nebylo SDO uvedeném v SLA dosaženo, tak by se ani v případě, že by nebyl překročen AIW, nedalo mluvit o úspěchu.

Nyní tedy systém běží v alternativním módu. Jak dlouho pak systém může v onom alternativním módu běžet, aniž by to mělo nějaký dopad na business, tak to určuje právě ono MTO. Asi už tušíte, co znamenají zkratky, které jsem výše použil. Nicméně oficiální definice mohou být lehce odlišné:

  • Service Level Agreement, zkr. SLA, by měl být dokumentovaný souhlas mezi poskytovatelem a zákazníkem o parametrech služby a způsobu jejich měření. V rámci jedné firmy to pak může být Operation Level Agreement, zkr. OLA mezi businessem a IT.
  • Service Delivery Objective, zkr. SDO je úroveň služeb, které musí být dosaženo v alternativním módu, než bude obnoven plný provoz. V tomto módu je třeba počítat s horší kvalitou, rychlostí, větším množstvím chyb apod.
  • Acceptable Interuption Window, zkr. AIW je maximální doba, po kterou může být systém nedostupný.
  • Recovery Time Objective, zkr. RTO je doba potřebná k obnově systému po havárii, ta může být řádově v sekundách, minutách, hodinách, ale i týdnech, a to podle toho, jaká technologie je použita. RTO by mělo být kratší než AIW. Do RTO se počítá minimálně čas nutný na zprovoznění infrastruktury a systému.
  • Working Recovery Time, zkr. WRT je čas potřebný k dokončení obnovy, např. dat a kontrole jejich integrity, a dále pak konfigurace, běžících služeb apod. WRT může být delší, ale i kratší než RTO, podle toho, co vše je ještě potřeba po obnově systému a dat udělat.
  • Maximum Tolerable Downtime, zkr. MTD je maximální doba tolerovatelného výpadku a dle (ISC)2 je MTD součet RTO a WRT.
  • Maximum Tolerable Outage, zkr. MTO, je doba, po kterou je organizace ochotna pracovat v alternativním módu, alespoň dle ISACA. Je třeba si uvědomit, že tato situace může v případě katastrofy trvat i několik měsíců, takže pak může být MTO výrazně delší než MTD.

Allowable a Tolerable lze považovat za synonyma, takže se můžeme setkat i s pojmem Maximum Allowable Downtime , zkr. MAD a Maximum Allowable Outage, zkr. MAO. Nyní by vám již mělo být vše jasnější, případné nejasnosti snad ozřejmí následující obrázek.

Byť jsou mezi jednotlivými stavy řešení incidentu na první pohled stejně dlouhé intervaly, tak v praxi tomu tak nebývá a přechod mezi jednotlivými stavy se liší případ od případu a organizace od organizace a trvá různě dlouho.

Dle ISACA je v RTO již započtena doba potřebná ke konfiguraci, kontrole systému a plnému obnovení provozu, tedy WRT a tudíž je pojem RTO de facto totéž, co MTD v pojetí (ISC)2.

Z výše uvedených definic rovněž vyplývá, že MTD je totéž co AIW, nicméně o MTD a někdy též MTPD Maximum Tolerable Period of Disruption se hovoří v kontextu přerušení business procesů a to může a bývá zpravidla delší než AIW používané v kontextu systému.

Otázka totiž je, od kdy by se mělo AIW začít počítat. Logicky by to mělo být od okamžiku, kdy k nedostupnosti systému došlo, protože obnova nemusela být započata hned, ale až po nějaké době, co se to řešilo jako incident. AIW by pak z tohoto pohledu nemuselo být totéž co MTD. I tato skutečnost je zachycena na obrázku. AIW1 vs. AIW2, přičemž AIW1 je to AIW, které je nejčastěji myšleno.

Pokud vás tento článek zaujal, můžete odkaz na něj sdílet.


K článku “Není nedostupnost jako nedostupnost, aneb jaký je vztah mezi RTO, WRT, MTD, AIW a MTO” se zde nenachází žádný komentář - buďte první.

Diskuse na tomto webu je moderována. Pod článkem budou zobrazovány jen takové komentáře, které nebudou sloužit k propagaci konkrétní firmy, produktu nebo služby. V případě, že chcete, aby z těchto stránek vedl odkaz na váš web, kontaktujte nás, známe efektivnější způsoby propagace.

Přihlášeným uživatelům se tento formulář nezobrazuje - zaregistrujte se.

Jméno:(požadováno)
E-mail:(požadováno - nebude zobrazen)
Web:

Text vaší reakce: