IT災難恢復最關鍵的7要素 你知道幾個
由于自然和人為災害,企業(yè)網(wǎng)絡和數(shù)據(jù)訪問可能會毫無征兆地被中斷。當然,您可能無法阻止所有這一切的發(fā)生,但是如果有一個好的災難恢復計劃,您就可以更好地應對這些意外事件。
颶風、龍卷風、地震、火災、洪水、恐怖襲擊以及網(wǎng)絡攻擊,您要知道所有這些問題都可能會隨時發(fā)生在您的公司。您可能也已經(jīng)制定了災難恢復(DR)計劃,來保護企業(yè)的數(shù)據(jù)、員工和業(yè)務安全。
但是您的災難恢復計劃考慮得周全嗎?它上次進行更新和測試是什么時候?您是否考慮過采用新技術(shù)和服務,使災難恢復工作變得更容易?以下為您列出了IT災難恢復計劃應該涵蓋的7大關鍵事項,一起來看看吧:
1. 分析所有潛在的威脅及其可能發(fā)生的反應
研究公司IDC的數(shù)據(jù)恢復研究總監(jiān)Phil Goodwin建議稱,您的災難恢復計劃應該考慮到“潛在中斷”對您業(yè)務全方位的影響。然后,您應該針對每種情況制定一份恢復計劃。例如,Goodwin表示:
“如果發(fā)生了一次網(wǎng)絡攻擊,關閉了華盛頓特區(qū)(D.C.)的服務器,那么您有針對該場景的過渡計劃嗎?”
當然,并非所有場景都會發(fā)生。所以,應該盡您所能地去嘗試預測哪些潛在的中斷最有可能出現(xiàn)。Goodwin指出,不幸的是,網(wǎng)絡攻擊正在成為“最有可能發(fā)生的場景”。因此,在您的災難恢復計劃中,應該將針對網(wǎng)絡攻擊的計劃置于優(yōu)先位置。
2. 業(yè)務影響分析(business impact analysis,簡稱BIA)
SAP公司總裁兼首席執(zhí)行官Mark Testoni建議稱,為了有效地確定災難恢復優(yōu)先級,應該對每個主要信息系統(tǒng)進行業(yè)務影響分析。
跟據(jù)Gartner的說法,業(yè)務影響分析會“識別和評估自然以及人為災害對業(yè)務運營產(chǎn)生的潛在影響(金融、生命/安全、監(jiān)管、法律/合同、信譽等等)。”
Testoni指出,
“對主要IT系統(tǒng)進行一次全面的業(yè)務影響分析,將有助于確定系統(tǒng)的優(yōu)先級和相關性。這有助于對系統(tǒng)進行優(yōu)先級排序,制定恢復策略和減少損失的優(yōu)先事項。業(yè)務影響分析檢查三個安全目標:保密性、完整性以及可用性。制定一個全面的災難恢復計劃的標準方法是:首先制定政策,然后進行業(yè)務影響分析,通過業(yè)務影響分析建立優(yōu)先次序后,制定應急策略,并在應急計劃中正式實施。”
您可以在Ready.gov和國家標準與技術(shù)研究所等網(wǎng)站上,找到業(yè)務影響分析模板和問卷。
3. 員工
Goodwin表示,許多企業(yè)在其災難恢復計劃中常犯的錯誤是“過分關注技術(shù),而不太重視人員和過程”。IT是一個使能者(enabler)。永遠不要忘記,您不僅僅是要恢復數(shù)據(jù)和服務器。他建議,可以考慮如何在整個企業(yè)環(huán)境內(nèi)制定一個災難恢復計劃。他說,
“您需要從您的用戶社區(qū)獲得哪些行為?災難發(fā)生后,他們需要什么樣的幫助才能重新啟動并運行?”
FBI網(wǎng)絡部前安全顧問兼發(fā)言人John Iannarelli表示,除此之外,還應當確定負責應對危機的關鍵人員;確保您有他們的電子郵件、手機號碼以及家庭座機號等信息;明確危機處理期間的當班者;知道您應向誰求助,例如執(zhí)法部門,如果可能的話,在災難發(fā)生前就要與當局建立好聯(lián)系;事先確定好在災難發(fā)生時,誰將代表公司面對受害者、客戶和員工。最后,他還補充說,發(fā)言人還需要想好打算說什么,打算披露多少信息,以及如何處理好讓那些懷疑貴公司業(yè)務能力的人感到放心。
4. 更新
Gartner公司的IT基礎設施戰(zhàn)略研究總監(jiān)Mark Jaggers指出,組織易犯的另一重大錯誤,是在對其內(nèi)部系統(tǒng)進行更改后(例如進行了重大的軟件更新),并沒有更新其災難恢復計劃。除非考慮到目前使用的所有技術(shù)、系統(tǒng)和應用程序,否則您的計劃并不完整。
此外,自制定完成災難恢復計劃以來,可能還會有新的技術(shù)或產(chǎn)品出現(xiàn)。災難恢復計劃是基于計劃完成時,對可用過程和工具的假設。網(wǎng)絡彈性公司Veriflow的產(chǎn)品管理副總裁Milind Kulkarni指出,
“由于如今的技術(shù)發(fā)展比以往任何時候都更快,創(chuàng)新也總是會從意想不到的地方涌現(xiàn)出來,這些假設可能會發(fā)生重大變化。計算機科學和預測算法的進步,以及價格合理的超強計算能力等因素,促進了新方法和解決方案的出現(xiàn),保證了IT系統(tǒng)的彈性、正常運行時間、可用性和災難恢復能力。”
例如,通過亞馬遜的AWS Snowball等服務,企業(yè)可以把PB級(千萬億字節(jié))的業(yè)務數(shù)據(jù)轉(zhuǎn)移到現(xiàn)場專用安全設備上。傳輸完成后,就可以將設備發(fā)送到您選擇的AWS中心,在該中心將您的數(shù)據(jù)傳送到云端。Kulkarni指出,AWS Snowball和其他類似的服務為企業(yè)提供了創(chuàng)新且價格合理的新方法,來確保數(shù)據(jù)冗余——這是任何一個災難恢復計劃的基礎。
5. 優(yōu)先事項
Iannarelli建議稱,確定什么是最重要的。并不是所有的業(yè)務都值得保存或者需要保護。當然,您的個人信息是的!但任何已公開發(fā)布的信息都不那么重要。試想一下,如果您的房子著火了,在您跑出家門時最想抓在手里帶出火海的是什么?
6. 定期地練習和演練
Kulkarni警告稱,只是制定災難恢復計劃是不夠的。還需要定期對該計劃進行測試,人們需要實踐練習,就像學校會定期讓學生參加消防和應急演習一樣。如果不經(jīng)常演練,該計劃將是無效的。
7. 考慮災難恢復即服務(disaster recovery as a service,簡稱DRaaS)
將數(shù)據(jù)操作業(yè)務轉(zhuǎn)移到云端的做法日益流行,這有助于實現(xiàn)災難恢復即服務(DRaaS)。Goodwin認為,諸如iland和IBM等提供商所提供的按需服務,使災難恢復工作變得更容易且更經(jīng)濟,同時也讓更多的企業(yè)能夠更好地應對災難。
Goodwin建議稱,在考慮DRaaS時,需要詢問供應商將如何測試和驗證數(shù)據(jù)及工作流程的恢復狀態(tài),因為有些測試可能會比其他測試的范圍要廣。
不要等待
Iannarelli表示,大多數(shù)公司犯下的最大錯誤,就是等到發(fā)生網(wǎng)絡攻擊或者災難之后,才去想下一步該怎么做。他說,
“在聯(lián)邦調(diào)查局工作的20多年時間里,我從來沒有見過任何人因為數(shù)據(jù)泄露而被公司解雇。但我看到很多人因為沒有能處理好泄露事件而被解雇。”