多種類型的災(zāi)難都可能導(dǎo)致關(guān)鍵系統(tǒng)離線、辦公室和數(shù)據(jù)中心受損,或?qū)е抡I(yè)務(wù)運(yùn)營(yíng)所需的數(shù)據(jù)庫和應(yīng)用程序暫時(shí)無法使用。災(zāi)難恢復(fù)計(jì)劃是企業(yè)快速恢復(fù)其最重要系統(tǒng)和應(yīng)用程序的流程和技術(shù)路線圖,以便企業(yè)能夠在恢復(fù)其他系統(tǒng)和應(yīng)用程序的同時(shí)恢復(fù)工作。
災(zāi)難恢復(fù)簡(jiǎn)介
災(zāi)難恢復(fù) (DR) 包括企業(yè)在發(fā)生破壞性事件后恢復(fù)其計(jì)算工作負(fù)載的技術(shù)計(jì)劃,以及在災(zāi)難發(fā)生前測(cè)試策略的方法。在災(zāi)難恢復(fù)計(jì)劃中,工作負(fù)載按重要性排序。企業(yè)的目標(biāo)是最大限度地減少計(jì)算停機(jī)時(shí)間和數(shù)據(jù)丟失,同時(shí)平衡每個(gè)工作負(fù)載的成本。
雖然災(zāi)難恢復(fù)長(zhǎng)期以來一直是 IT 運(yùn)營(yíng)的重要組成部分,但云計(jì)算和為互聯(lián)網(wǎng)設(shè)計(jì)的軟件架構(gòu)正在降低實(shí)施全面災(zāi)難恢復(fù)計(jì)劃的成本和工作量。
定義和概述
災(zāi)難恢復(fù)是指企業(yè)在因操作員錯(cuò)誤、瀆職、軟件錯(cuò)誤、自然災(zāi)害或其他災(zāi)難導(dǎo)致意外停機(jī)后,為使重要 IT 系統(tǒng)恢復(fù)運(yùn)行而采取的政策、技術(shù)和預(yù)算。在發(fā)生中斷之前,企業(yè)需要確定哪些關(guān)鍵任務(wù)應(yīng)用程序必須在災(zāi)難發(fā)生后立即恢復(fù),并將其他應(yīng)用程序按重要性分組(稱為層級(jí))。然后,他們需要確定企業(yè)可以承受每個(gè)應(yīng)用程序的停機(jī)時(shí)間和數(shù)據(jù)丟失量,并據(jù)此制定 IT 策略。
災(zāi)難恢復(fù)的重要性
災(zāi)難恢復(fù)非常重要,因?yàn)槠茐男允录?dǎo)致的意外停機(jī)可能導(dǎo)致重大財(cái)務(wù)損失——據(jù)行業(yè)估計(jì),每小時(shí)約 10 萬美元。長(zhǎng)時(shí)間的停機(jī)還會(huì)損害品牌聲譽(yù),并導(dǎo)致監(jiān)管機(jī)構(gòu)的譴責(zé)或處罰。在一些監(jiān)管嚴(yán)格的行業(yè),包括金融服務(wù)、能源和醫(yī)療保健,公司需要以比傳統(tǒng)備份數(shù)據(jù)副本更快的速度恢復(fù)數(shù)據(jù)和計(jì)算操作。
在緊急服務(wù)和醫(yī)療保健等領(lǐng)域,意外停機(jī)也可能導(dǎo)致生命損失。如果發(fā)生災(zāi)難性事件(如颶風(fēng)、龍卷風(fēng)或地震),那么所有服務(wù)都面臨風(fēng)險(xiǎn)。信息能否流向需要的地方以拯救生命?
災(zāi)難恢復(fù)的基本概念
有兩個(gè)關(guān)鍵的災(zāi)難恢復(fù)指標(biāo):恢復(fù)時(shí)間目標(biāo) (RTO),衡量系統(tǒng)可以保持離線狀態(tài)的最長(zhǎng)時(shí)間;恢復(fù)點(diǎn)目標(biāo) (RPO),衡量企業(yè)可以承受的數(shù)據(jù)丟失量,與備份或復(fù)制的頻率相關(guān)。對(duì)于這兩個(gè)指標(biāo),閾值越短越好,但成本也越高。IT 組織通常會(huì)為其運(yùn)行的每個(gè)系統(tǒng)設(shè)置 RTO 和 RPO,從而讓他們能夠平衡成本和關(guān)鍵性。
災(zāi)難恢復(fù)是一個(gè)成熟的實(shí)踐領(lǐng)域,但更多地使用云服務(wù)與所謂的“試點(diǎn)”部署相結(jié)合,即使用實(shí)時(shí)、最新的數(shù)據(jù)和備用服務(wù)來重啟云數(shù)據(jù)中心的系統(tǒng),可以幫助規(guī)劃人員以更少的資金提供出色的 RTO 和 RPO 指標(biāo)。這是因?yàn)樵铺峁┥淘诿總€(gè)基礎(chǔ)設(shè)施層都投資了冗余,從而實(shí)現(xiàn)了自動(dòng)和半自動(dòng)故障轉(zhuǎn)移和恢復(fù)過程。這些是他們的客戶不再需要進(jìn)行的投資。此外,試點(diǎn)部署可以將恢復(fù)服務(wù)所需的時(shí)間縮短到幾分鐘。
有關(guān)基于云的 DR 部署的更多信息即將發(fā)布。
災(zāi)害類型
許多類型的災(zāi)難都會(huì)影響 IT 系統(tǒng),包括網(wǎng)絡(luò)攻擊、硬件故障、自然災(zāi)害和人為錯(cuò)誤導(dǎo)致的中斷。有些災(zāi)難是可以預(yù)見的。例如,所有組織都可能成為網(wǎng)絡(luò)攻擊的目標(biāo)。有些公司位于颶風(fēng)、地震和洪水等自然災(zāi)害更容易發(fā)生的地方。人為錯(cuò)誤是常有的事。
這項(xiàng)工作就是當(dāng)出現(xiàn)問題時(shí)做好反應(yīng)的準(zhǔn)備。
計(jì)劃外中斷是指系統(tǒng)或服務(wù)中意外中斷,導(dǎo)致停機(jī)和正常運(yùn)營(yíng)中斷。這些中斷可能由于剛剛討論的因素而發(fā)生,并可能對(duì)企業(yè)造成嚴(yán)重后果,包括收入損失、聲譽(yù)受損、客戶滿意度下降,甚至生命損失。制定恢復(fù)計(jì)劃至關(guān)重要,以最大限度地減少計(jì)劃外中斷的影響并確??焖倩謴?fù)服務(wù)。
災(zāi)難恢復(fù)與高可用性
高可用性技術(shù)可在集群中的節(jié)點(diǎn)或集群服務(wù)器之間復(fù)制數(shù)據(jù),以便它們可以相互故障轉(zhuǎn)移并保持工作負(fù)載運(yùn)行,從而確保非常高的 IT 服務(wù)水平。這些技術(shù)旨在消除單點(diǎn)故障,并且通常由保證正常運(yùn)行時(shí)間百分比的服務(wù)級(jí)別協(xié)議支持。在云計(jì)算中,高可用性保護(hù)物理基礎(chǔ)設(shè)施,包括電源、冷卻、存儲(chǔ)、網(wǎng)絡(luò)和服務(wù)器。應(yīng)用程序級(jí)負(fù)載平衡軟件也有助于確保高水平的正常運(yùn)行時(shí)間。
另一方面,災(zāi)難恢復(fù)可防止多點(diǎn)故障,旨在在極端中斷(例如地震或颶風(fēng)導(dǎo)致設(shè)施癱瘓)后將關(guān)鍵工作負(fù)載恢復(fù)到運(yùn)行狀態(tài)。災(zāi)難恢復(fù)站點(diǎn)通常在地理位置上彼此相距甚遠(yuǎn)。
高可用性和 DR 技術(shù)都應(yīng)該是全面業(yè)務(wù)連續(xù)性計(jì)劃的一部分。
災(zāi)難恢復(fù)的目標(biāo)
災(zāi)難恢復(fù)計(jì)劃的主要目標(biāo)是確保業(yè)務(wù)部門在危機(jī)期間能夠繼續(xù)工作。災(zāi)難恢復(fù)計(jì)劃包括快速重啟計(jì)算服務(wù)以及限制數(shù)據(jù)和資金損失的流程。它們還旨在滿足管理業(yè)務(wù)連續(xù)性和數(shù)據(jù)保留的監(jiān)管要求。
恢復(fù)時(shí)間目標(biāo) (RTO) 和恢復(fù)點(diǎn)目標(biāo) (RPO)
災(zāi)難恢復(fù)計(jì)劃的兩個(gè)主要指標(biāo)是恢復(fù)時(shí)間目標(biāo) (RTO) 和恢復(fù)點(diǎn)目標(biāo) (RPO)。企業(yè)運(yùn)行的每個(gè)系統(tǒng)可能具有不同的 RTO 和 RPO 要求,具體取決于 IT 部門與相關(guān)業(yè)務(wù)部門之間的服務(wù)水平協(xié)議。
對(duì)于每個(gè)應(yīng)用程序或服務(wù),RTO 是計(jì)劃外中斷后允許的最大停機(jī)時(shí)間,而 RPO 衡量企業(yè)愿意容忍的最大數(shù)據(jù)丟失量。閾值越短/越小越好,但通常成本更高。IT 組織可以為其運(yùn)行的每個(gè)系統(tǒng)設(shè)置 RTO 和 RPO,以平衡成本和關(guān)鍵性。
制定災(zāi)難恢復(fù)計(jì)劃
DR 計(jì)劃包括對(duì)災(zāi)難事件的潛在風(fēng)險(xiǎn)、可能造成的運(yùn)營(yíng)損害、員工和外部利益相關(guān)者可能受到的影響以及可能由此造成的財(cái)務(wù)損失或監(jiān)管罰款的全面評(píng)估。
作為制定災(zāi)難恢復(fù)計(jì)劃的一部分,公司需要確定執(zhí)行發(fā)起人和受影響的團(tuán)隊(duì);編目可能在災(zāi)難期間受損的物理和 IT 資產(chǎn);并考慮對(duì)客戶、供應(yīng)商、合作伙伴和其他利益相關(guān)者的潛在影響。
IT 部門需要決定哪些工作負(fù)載可以從備份中恢復(fù),哪些工作負(fù)載需要實(shí)時(shí)數(shù)據(jù)和以較低容量運(yùn)行的服務(wù),哪些工作負(fù)載需要滿負(fù)荷運(yùn)行。在某些情況下,停機(jī)的活動(dòng)系統(tǒng)將自動(dòng)切換到備用系統(tǒng),從而將停機(jī)時(shí)間降至最低,并且不會(huì)丟失任何數(shù)據(jù)。在其他情況下,切換將是手動(dòng)的。IT 團(tuán)隊(duì)將希望選擇備份站點(diǎn)并制定一個(gè)計(jì)劃,讓他們能夠快速重啟應(yīng)用程序。云計(jì)算在這里大有幫助。企業(yè)還需要尋找可能阻礙重啟運(yùn)營(yíng)的 IT 依賴關(guān)系——一個(gè)離線應(yīng)用程序阻止另一個(gè)應(yīng)用程序重新上線的情況。
除了這些技術(shù)方面之外,高管領(lǐng)導(dǎo)和業(yè)務(wù)部門還應(yīng)制定緊急溝通和響應(yīng)計(jì)劃,并對(duì)員工進(jìn)行災(zāi)難恢復(fù)計(jì)劃培訓(xùn),通過桌面測(cè)試或演練進(jìn)行測(cè)試和演練,并不斷改進(jìn)。
風(fēng)險(xiǎn)評(píng)估和恢復(fù)目標(biāo)
每個(gè) DR 計(jì)劃都應(yīng)包括可能中斷業(yè)務(wù)運(yùn)營(yíng)的事件的風(fēng)險(xiǎn)評(píng)估、可能受影響的應(yīng)用程序的影響分析以及由此造成的財(cái)務(wù)損失的估計(jì)。業(yè)務(wù)影響分析應(yīng)包括每個(gè)應(yīng)用程序的 RTO 和 RPO。然后,企業(yè)可以決定其恢復(fù)計(jì)劃,并選擇在哪里以更高的成本換取更短的恢復(fù)時(shí)間和恢復(fù)點(diǎn)目標(biāo)。
備份和恢復(fù)策略
備份和恢復(fù)方法根據(jù)性能成本不同而有所差異,包括以下幾種:
- 離線備份具有更高的 RPO,但在勒索軟件攻擊期間可能是唯一的選擇
- 試點(diǎn)部署可以在幾分鐘內(nèi)(而不是幾小時(shí))將系統(tǒng)恢復(fù)到工作狀態(tài),但比簡(jiǎn)單的備份更昂貴,維護(hù)起來也更困難
- 熱備用方法,將實(shí)時(shí)數(shù)據(jù)與以較低容量運(yùn)行的云中應(yīng)用程序副本相結(jié)合
- 主動(dòng)/主動(dòng)故障轉(zhuǎn)移方法,即多個(gè)實(shí)時(shí)站點(diǎn)以滿負(fù)荷運(yùn)行以實(shí)現(xiàn)恢復(fù)時(shí)間,并且恢復(fù)點(diǎn)接近于零,是最昂貴的災(zāi)難恢復(fù)策略,盡管現(xiàn)代軟件架構(gòu)和數(shù)據(jù)管理策略可以幫助控制成本,并可能帶來其他好處,包括提高可擴(kuò)展性
計(jì)劃測(cè)試和合規(guī)性
僅創(chuàng)建 IT 清單、確定應(yīng)用程序?qū)雍陀成湟蕾囮P(guān)系是不夠的。為了使 DR 達(dá)到企業(yè)期望的水平,從操作系統(tǒng)到應(yīng)用程序的每種技術(shù)都需要冗余。DR 的成功還取決于定期測(cè)試,無論是桌面演練(利益相關(guān)者口頭執(zhí)行步驟),還是 IT 部門將采取的措施的實(shí)際演練以及僅在災(zāi)難期間使用的系統(tǒng)組件的測(cè)試。
財(cái)務(wù)報(bào)告和數(shù)據(jù)保護(hù)法規(guī)也會(huì)影響災(zāi)難恢復(fù)計(jì)劃。例如,美國(guó)企業(yè)財(cái)務(wù)報(bào)告法規(guī)《薩班斯-奧克斯利法案》規(guī)定了數(shù)據(jù)保留要求。美國(guó)《健康保險(xiǎn)流通與責(zé)任法案》(HIPAA)要求在災(zāi)難期間制定電子健康信息應(yīng)急計(jì)劃,歐盟《通用數(shù)據(jù)保護(hù)條例》(GDPR)則規(guī)定在災(zāi)難期間公民的個(gè)人數(shù)據(jù)必須可用。
DRaaS 的優(yōu)勢(shì)和用例
災(zāi)難恢復(fù)即服務(wù) (DRaaS) 是一種云服務(wù),可讓企業(yè)在公共云或混合云中運(yùn)行應(yīng)用程序,并在云提供商的設(shè)施而不是本地?cái)?shù)據(jù)中心制定 DR 計(jì)劃。基于云的 DRaaS 產(chǎn)品可讓公司在云區(qū)域之間遠(yuǎn)程轉(zhuǎn)換計(jì)算、數(shù)據(jù)庫和應(yīng)用程序負(fù)載,并自動(dòng)執(zhí)行恢復(fù)業(yè)務(wù)系統(tǒng)所需的步驟,而無需重新架構(gòu)它們或使用專門的管理軟件。至關(guān)重要的是,云提供商的 DRaaS 解決方案應(yīng)專為備用區(qū)域的高可用性而設(shè)計(jì),以確保服務(wù)在災(zāi)難事件期間可訪問且正常運(yùn)行。
企業(yè)可以使用云中的 DR 來規(guī)劃在自然災(zāi)害破壞基礎(chǔ)設(shè)施或網(wǎng)絡(luò)事件(例如勒索軟件攻擊,導(dǎo)致本地網(wǎng)絡(luò)資源訪問被切斷)后恢復(fù)數(shù)據(jù)。由于數(shù)據(jù)可以存儲(chǔ)在區(qū)域云中,因此該策略可以符合 GDPR 等數(shù)據(jù)保護(hù)法規(guī)。當(dāng)預(yù)算緊張時(shí),DRaaS 也是一個(gè)不錯(cuò)的解決方案,因?yàn)槠涑杀究赡艿陀谠O(shè)置冗余恢復(fù)站點(diǎn)的成本。
實(shí)施災(zāi)難恢復(fù)解決方案
制定災(zāi)難恢復(fù)計(jì)劃應(yīng)首先對(duì)潛在災(zāi)難事件及其對(duì) IT 系統(tǒng)和業(yè)務(wù)流程的影響進(jìn)行風(fēng)險(xiǎn)評(píng)估。然后,在管理層的支持下,IT 和業(yè)務(wù)線團(tuán)隊(duì)?wèi)?yīng)根據(jù)資產(chǎn)和系統(tǒng)的重要性對(duì)其進(jìn)行排序,并根據(jù)所需的 RTO 和 RPO 以及可用預(yù)算分配 DR 策略來保護(hù)每個(gè)資產(chǎn)和系統(tǒng)。DR 計(jì)劃是更廣泛的業(yè)務(wù)連續(xù)性計(jì)劃的一部分,用于縮短從災(zāi)難、網(wǎng)絡(luò)攻擊或技術(shù)錯(cuò)誤導(dǎo)致的中斷到恢復(fù)的時(shí)間。它們需要不斷測(cè)試和更新。
傳統(tǒng)災(zāi)難恢復(fù)與基于云的災(zāi)難恢復(fù)
傳統(tǒng)災(zāi)難恢復(fù)依賴于位于公司自有數(shù)據(jù)中心的冗余服務(wù)器和存儲(chǔ)設(shè)備,或?qū)I(yè)務(wù)數(shù)據(jù)和應(yīng)用程序?qū)嵗齻浞莸竭h(yuǎn)程數(shù)據(jù)中心,因此一個(gè)地理區(qū)域的問題不太可能對(duì)遠(yuǎn)處的遠(yuǎn)程副本造成損害。相比之下,基于云的災(zāi)難恢復(fù)策略允許企業(yè)在公共云中存儲(chǔ)較小或備用的應(yīng)用程序?qū)嵗北?,并在緊急情況下需要激活時(shí)通過添加計(jì)算資源來擴(kuò)展它們,從而節(jié)省前期成本。企業(yè)還可以將關(guān)鍵任務(wù)應(yīng)用程序分布在多個(gè)云區(qū)域。
災(zāi)難恢復(fù)工作流程、運(yùn)行手冊(cè)和計(jì)劃
災(zāi)難恢復(fù)工作流程概述了在危機(jī)期間重啟系統(tǒng)、恢復(fù)數(shù)據(jù)和通信所需的步驟和順序。災(zāi)難恢復(fù)運(yùn)行手冊(cè)更詳細(xì)地介紹了恢復(fù)過程和相關(guān)文檔。它們提供了易于遵循的清單,用于在緊急情況下將數(shù)字運(yùn)營(yíng)轉(zhuǎn)移到安全的地方,并且可以在緊急情況下簡(jiǎn)化測(cè)試或故障轉(zhuǎn)移。工作流程和運(yùn)行手冊(cè)向企業(yè)展示了如何分階段進(jìn)行恢復(fù),并確定了關(guān)鍵系統(tǒng)和服務(wù)水平協(xié)議。
災(zāi)難恢復(fù)工作流程包括風(fēng)險(xiǎn)評(píng)估、參與計(jì)劃的委員會(huì)以及管理支持、恢復(fù)策略和測(cè)試程序。運(yùn)行手冊(cè)可能包含不同數(shù)據(jù)庫、服務(wù)器和網(wǎng)絡(luò)設(shè)備的詳細(xì)清單,以便工作人員能夠在時(shí)間壓力下執(zhí)行恢復(fù)步驟。
了解 DR 操作:故障轉(zhuǎn)移和切換
災(zāi)難恢復(fù)操作是執(zhí)行災(zāi)難恢復(fù)計(jì)劃中每個(gè)預(yù)定步驟或任務(wù)的過程,這些步驟或任務(wù)是將組織的基礎(chǔ)設(shè)施、數(shù)據(jù)庫和應(yīng)用程序恢復(fù)到完全運(yùn)行狀態(tài)所必需的。故障轉(zhuǎn)移和切換這兩個(gè)術(shù)語用于描述應(yīng)用程序堆棧轉(zhuǎn)換到不同位置的過程。
故障轉(zhuǎn)移功能可在發(fā)生意外危機(jī)(包括斷電和設(shè)備故障)時(shí)快速切換到備用系統(tǒng)。當(dāng)應(yīng)用程序、數(shù)據(jù)庫和虛擬機(jī)崩潰,并且存儲(chǔ)、數(shù)據(jù)和操作系統(tǒng)等資源處于不穩(wěn)定狀態(tài)時(shí),就會(huì)使用故障轉(zhuǎn)移功能。
切換是在計(jì)劃停機(jī)維護(hù)期間有序地過渡到輔助系統(tǒng)。它允許關(guān)閉應(yīng)用程序、數(shù)據(jù)庫和虛擬機(jī)或服務(wù)器。在這種情況下,主區(qū)域和備用區(qū)域均正常運(yùn)行,IT 運(yùn)營(yíng)人員將系統(tǒng)從一個(gè)區(qū)域移動(dòng)到另一個(gè)區(qū)域進(jìn)行維護(hù)或完成滾動(dòng)升級(jí)。
基于云的災(zāi)難恢復(fù)的類型
云計(jì)算的靈活性使企業(yè)能夠?qū)嵤┓掀湫枨蟮臑?zāi)難恢復(fù)策略,而不會(huì)超出預(yù)算。混合云安排(其中一些計(jì)算資源在本地運(yùn)行,一些在公共云中運(yùn)行)可以降低災(zāi)難恢復(fù)的成本。云架構(gòu)(包括微服務(wù))允許軟件組件在分布式虛擬服務(wù)器上運(yùn)行,從而使它們不易受到多種災(zāi)難的影響。
跨區(qū)域?yàn)?zāi)難恢復(fù)解決方案
跨區(qū)域?yàn)?zāi)難恢復(fù)解決方案可保護(hù)組織免受颶風(fēng)等中斷的影響,這些中斷會(huì)導(dǎo)致僅托管在一個(gè)數(shù)據(jù)中心的系統(tǒng)的訪問中斷。服務(wù)可以在受影響區(qū)域之外的容錯(cuò)、地理上分開且隔離的可用性域中運(yùn)行。給定系統(tǒng)的整個(gè)應(yīng)用程序堆棧(包括虛擬機(jī)、數(shù)據(jù)庫和應(yīng)用程序)可以轉(zhuǎn)換到另一個(gè)位置的不同云區(qū)域。
混合云災(zāi)難恢復(fù)解決方案
混合云是一種流行的架構(gòu),它允許企業(yè)將一些工作負(fù)載從自己的數(shù)據(jù)中心轉(zhuǎn)移到云基礎(chǔ)設(shè)施。它也有助于災(zāi)難恢復(fù)。采用混合架構(gòu)通常需要在虛擬服務(wù)器上運(yùn)行工作負(fù)載,以便云數(shù)據(jù)中心內(nèi)的底層硬件可以輕松更改而不會(huì)影響運(yùn)營(yíng)。
一旦工作負(fù)載虛擬化,當(dāng)主數(shù)據(jù)中心不可用時(shí),它們可以在云環(huán)境中重新啟動(dòng)。云數(shù)據(jù)中心可以成為地理上分散的數(shù)據(jù)中心陣列的經(jīng)濟(jì)替代方案。
多云災(zāi)難恢復(fù)解決方案
多云災(zāi)難恢復(fù)解決方案通過將應(yīng)用程序的組件分布在兩個(gè)或更多提供商的云基礎(chǔ)架構(gòu)中來保護(hù)應(yīng)用程序和數(shù)據(jù)。此策略適合使用多個(gè)云提供商的企業(yè),讓他們可以為不同的應(yīng)用程序設(shè)置恢復(fù)時(shí)間和點(diǎn)目標(biāo),同時(shí)管理成本并做出有關(guān)地理分布的決策。多云災(zāi)難恢復(fù)流程也可能源自服務(wù)和應(yīng)用程序的開發(fā)方式。
使用 DRaaS 自動(dòng)執(zhí)行災(zāi)難恢復(fù)任務(wù)
災(zāi)難恢復(fù)編排和管理服務(wù)可以為應(yīng)用程序堆棧的所有層(包括基礎(chǔ)設(shè)施、數(shù)據(jù)庫和中間件)提供全面的 DR。DRaaS 通過快速執(zhí)行災(zāi)難恢復(fù)工作流來恢復(fù)不同區(qū)域的應(yīng)用程序堆棧,從而減少人為錯(cuò)誤并最大限度地縮短恢復(fù)時(shí)間。
Oracle 云基礎(chǔ)設(shè)施 (OCI) 全棧災(zāi)難恢復(fù)讓客戶能夠管理全球 OCI 區(qū)域之間的基礎(chǔ)設(shè)施、數(shù)據(jù)庫和應(yīng)用程序的過渡??蛻艨梢允褂萌珬?zāi)難恢復(fù),而無需重新設(shè)計(jì)或重新部署現(xiàn)有基礎(chǔ)設(shè)施、數(shù)據(jù)庫或應(yīng)用程序,同時(shí)也無需專門的存儲(chǔ)或管理服務(wù)器。
災(zāi)難恢復(fù)常見問題解答
為什么災(zāi)難恢復(fù)對(duì)企業(yè)很重要?
計(jì)劃外的企業(yè)中斷成本高昂。根據(jù) IT 咨詢機(jī)構(gòu) Uptime Institute 的數(shù)據(jù),超過三分之二的計(jì)劃外 IT 中斷成本超過 10 萬美元,而四分之一的計(jì)劃外 IT 中斷成本超過 100 萬美元。
災(zāi)難恢復(fù)計(jì)劃的關(guān)鍵組成部分是什么?
災(zāi)難恢復(fù)計(jì)劃包括公司選擇備份站點(diǎn)或在公共云中部署計(jì)算工作負(fù)載的策略,以便快速重啟運(yùn)營(yíng)。組織還需要對(duì)關(guān)鍵任務(wù)和重要業(yè)務(wù)應(yīng)用程序進(jìn)行排序,并映射它們之間的依賴關(guān)系,這些依賴關(guān)系可能會(huì)阻礙軟件恢復(fù)運(yùn)行。
災(zāi)難恢復(fù)與數(shù)據(jù)備份有何不同?
將數(shù)據(jù)備份到遠(yuǎn)程服務(wù)器或站點(diǎn)是災(zāi)難恢復(fù)的一個(gè)方面,但現(xiàn)代災(zāi)難恢復(fù)計(jì)劃涵蓋的內(nèi)容遠(yuǎn)不止這些。公司需要考慮平衡數(shù)據(jù)復(fù)制與服務(wù)可用性的技術(shù)策略,以控制成本,同時(shí)允許他們從小型備用實(shí)例重新啟動(dòng)應(yīng)用程序。
云計(jì)算如何影響災(zāi)難恢復(fù)?
云技術(shù)可以通過將云區(qū)域劃分為彼此隔離且具有容錯(cuò)能力的可用性域來在災(zāi)難期間提供保障。公司可以使用云供應(yīng)商通常提供的設(shè)施和實(shí)用程序復(fù)制系統(tǒng)以實(shí)現(xiàn)高可用性和災(zāi)難恢復(fù)。