K書筆記本-Business Continuity and Disaster Recovery Planning(04)

上篇文章中已經將BIA所分析出來的最重要的商業流程找出來了,那接下來呢?與RM的處理方法相同嗎?
如果和RM相同,那幹嘛還搞一個BCP&DRP呢?所以呀!你嘛幫幫忙,都有給你新玩具了,也搞一些新的玩法嘛!!!
BCP&DRP最重要的是讓商業流程能不中斷的永續運作下去,那麼該做的就不會像RM做風險的處理 …

上篇文章中已經將BIA所分析出來的最重要的商業流程找出來了,那接下來呢?與RM的處理方法相同嗎?
如果和RM相同,那幹嘛還搞一個BCP&DRP呢?所以呀!你嘛幫幫忙,都有給你新玩具了,也搞一些新的玩法嘛!!!
BCP&DRP最重要的是讓商業流程能不中斷的永續運作下去,那麼該做的就不會像RM做風險的處理
而是以企業流程的永續及災後的復原策略設定為主要的內容,那麼怎麼設定我們的永續和復原呢?
當然也是有所依據,透過BIA找出了極重要的商業流程,但是總不能說每個單位(unit)都很重要吧!
因此我們會先將這些企業單位做一個排列,依照Critical Processes, Infrastructure, Communications做個基本的排序!

Critical processes是必須排列在第一位,首先,經由BC Team在會議中檢視重要流程的列表後,經由BIA所分析出來的衝擊大小
來進行第一步的排列。再來才以Infrastructure做第二步的排序,重點是以評估已視別出來的重要商業流程所需的最少資源需求
所需資源愈多的,則排列在最前面。Communications則是必須確認,在發生災難時有那些連絡方式可供使用,
而通聯的方式也必須隨著其複雜層度,包括所需的技術、效益(單工、雙工、全雙功)等等,供recovery team做為通聯使用
依照其便利性往下排序,重點在於有什麼可以使用的工具。

但是…就這麼籠統嗎?當然不是,其實這些在之前所提到的RTO(Recovery Time Objective)、RPO(Recovery Point Objective)、
MTD(Maximum Tolerable Downtime),就是一個度量的標準,這三個標準在BS 25999中有詳細的定義
然而在台灣多數的人將RTO與MTD劃上了等號,下面會詳細的說明三者的差異在何處:
RTO是復原時間目標,亦指當系統受到衝擊時造成停機,透過選擇的復原程序或方法進行復原所需的最少時間。(左右了復原政策)
RPO是復原點目標,指每可容許最大的資料損失時間、資料量,來評估多久進行一次備份。(左右了備份政策)
MTD是最大可容許停機時間,意指Owner在衝擊發生後,對於該系統完全停擺可容許多少的時間。(左右啟動DRP的政策)
因為MTD是左右RTO最大的因子,因此在台灣IT人員才會把MTD及RTO劃上等號。

而另一個更重要的重點,選擇任何一種備份備援政策均必須符合成本效並原則,大家應該都還有印象,在前一篇中,我們有提到幾項依據
尤其是在有時間敏感性的系統,是最難選擇備份備援政策的解決方案,最常見的例子,只要老闆提到HA架構
所有的IT都會不約而同的直接說:Cluster架構,但投入一組cluster架構要投入的成本是多少呢?恐怕70萬跑不了!
但是,如果這個系統停機三天都沒有人發現,那麼選擇的備份備援政策就要用到cluster嗎?

一個網站系統尤其是公司入口網站,在IT的眼中,不能停機超過一天,結果在老闆眼中,確認為即使停了一周也沒有FU!
那要以Cluster還是無縫備份備援的軟體來執行,或者是以磁帶備份呢?有沒有個標準呢?
當然有囉,即然是以重要的商業流程的內容來看可容許的停機時間,來斷定這個商業流程可相對應的各項備份備援復原政策
•MTD >= 30 days (不重要 Nonessential)
•MTD <= 7 days (一般 Normal)
•MTD <=  72 hours (重要的 Important)
•MTD <= 24 hours (緊急的 Urgent)
•MTD <=  以分鐘為單位或一小時內 (極重要 Critical)

分等完成之後,當然就要選擇回復的政策、站點,在此部份我們可以大致上分類幾種站點的選擇,請看下表:

建議站點

說明

就緒狀態

成本

對應MTD

Multiple processing / mirrored site

完整的環境、內容及資料

最高等級的可用性(Cluster)

極高

Critical

Mobile site/Trailer

精心設計提供足夠的IT及通訊設備,並且有行動力。

需要不可量的駕駛時間; 必須再載入資料及系統的測試(線上備份的備品)

Urgent

Hot site

完整的供應IT及辦公場所,HVAC,基礎建構及通訊設備

只需花費較短時間去載入資料、測試資料,也許需要供應商或是顧問的協助。(有即時的設備,但需要倒回備份資料)

Urgent

Warm site

有主要的IT設備,少部份的辦公所需資料、及基本建構

需要一天或一周的時間,去投入資料、相關通連設備。(只有設備,需要重新建置備份資料)

Important

Cold site

只有少量的設備及HVAC

需要一周以上的時間去建置IT設備、辦公環境及網通環境。(連設備都沒有需要調貨)

極低

Normal
Nonessential

當然,以上的建置站點是一種需要投入大量成本的方式,有沒有其它辦法來達成相同的處理呢?其實有一種叫做加工協議,
可以透過與同業簽定互惠協定或者是與主要的供應商簽支援服務,或者是結合同業的生產線的租用,也有另一種租用生產線的方式就叫做代工。

以上都是以站在一個選擇復原程序所需要的知識,尤其對於RTO, RPO, MTD的定義,以及復原的政策選擇,這些都是在做BCP中所必須要去注意的
對於永續的概念及分析,是可以透過Owner在找到重要流程時,必須提供那種層度的支援及備援政策,更重要的是每筆花費都是有限的
必須以達成最高的成本效益為最佳選擇,以上希望大家在應用到實務上時,可以更精凖的選擇一個更有效的復原政策。


Anything keeps Availability.
Anywhere keeps Integrity.
Anytime keeps Confidentiality.
keep A.I.C. = Information Security