ISO22301認證好處
ISO22301管理體系認證是指根據(jù)國際標準組織(InternationalOrganizationforStandardization)制定的ISO22301:2019標準,由第三方認證機構對組織的業(yè)務連續(xù)性管理體系進行審核和認證的過程。
這一體系是為了確保組織在面臨各種內(nèi)外部風險和威脅時能夠持續(xù)提供產(chǎn)品和服務,并在緊急情況下迅速恢復正常運營。
進行ISO22301管理體系認證可以帶來以下幾個方面的益處:1.提高組織的競爭力:通過ISO22301認證,組織能夠向客戶和合作伙伴展示其業(yè)務連續(xù)性管理能力的可靠性和有效性,增強其市場競爭力。
2.保護組織的聲譽:一旦面臨重大突發(fā)事件,組織能夠更好地應對并減少潛在的負面影響,保障組織的聲譽和形象。
3.確保業(yè)務連續(xù)性:ISO22301要求組織制定和實施業(yè)務連續(xù)性計劃,以確保在緊急情況下能夠持續(xù)提供產(chǎn)品和服務。
通過認證,組織可以評估和提升自身的業(yè)務連續(xù)性能力,有效減少生產(chǎn)中斷風險。
4.提高員工的意識和準備度:ISO22301管理體系認證要求組織進行員工培訓和演練,以提高員工對突發(fā)事件的應對能力和緊急情況下的行動準備度。
5.減少損失和風險:認證能夠使組織更加關注風險管理和業(yè)務連續(xù)性規(guī)劃,降低突發(fā)事件對組織造成的損失,減少因災害而導致的業(yè)務中斷和經(jīng)濟損失。
6.符合法律法規(guī)和合同要求:通過ISO22301認證,組織能夠滿足相關法律法規(guī)和合同對業(yè)務連續(xù)性的要求,避免違規(guī)行為帶來的法律風險。
ISO22301管理體系認證是當前企業(yè)不可忽視的重要認證之一。
認證不僅能夠提升組織的競爭力和聲譽,還能夠保障業(yè)務連續(xù)性,減少損失和風險,同時也能夠使組織更好地符合法律法規(guī)和合同要求。
對于企業(yè)來說,獲得ISO22301認證將是一項長期而持續(xù)的努力,但也將帶來深遠的積極影響。
業(yè)務連續(xù)性管理包含主要工作階段
業(yè)務連續(xù)性管理大家并不陌生,聽的很多,但真正落地的時候發(fā)現(xiàn)很多規(guī)范、標準中都涉及業(yè)務連續(xù)性,無論是ITIL4、ISO22301-2019、GBT30146-2013、ISO27001等標準中都是專門或者有獨立的模塊講解業(yè)務連續(xù)性的。因此,只有真正理解了業(yè)務連續(xù)性的核心目標或期望解決的問題后才能夠撥開迷霧,真正理解或落地業(yè)務連續(xù)性。這篇文章期望能夠將業(yè)務連續(xù)性的概念、定義和不同標準/規(guī)范中的區(qū)別做一個整理,以幫助業(yè)務連續(xù)性能夠更好的落地。
一、業(yè)務連續(xù)性的本質(zhì)
業(yè)務連續(xù)性管理(BCM)是一個框架,它包括風險識別和控制的過程,以確保一個組織在面對潛在的威脅時能夠持續(xù)運作。這些威脅可以是自然災害、技術故障、恐怖主義行為、電力故障等。BCM的目標是減少這些威脅對業(yè)務運營的影響,并確保關鍵業(yè)務功能在危機發(fā)生后能夠迅速恢復。
從這個定義我們可以看出,業(yè)務連續(xù)性不僅針對IT業(yè)務,其實企業(yè)多有業(yè)務都可能面臨不連續(xù)的情況。因此,業(yè)務連續(xù)性其實分為針對IT業(yè)務的和針對企業(yè)運營的。本文我們僅介紹針對IT業(yè)務的業(yè)務連續(xù)性管理。
二、與業(yè)務連續(xù)性相關標準與規(guī)范
服務連續(xù)性管理(ITIL4)
服務連續(xù)性管理(ITIL4):服務連續(xù)性管理實踐的目的是確保在出現(xiàn)災難時保持服務可用性并維持足夠性能。該實踐提供了一個 建立組織彈性的框架和產(chǎn)生有效反應的能力,可保障關鍵利益相關者的利益,以及組織的聲譽、品牌和價值創(chuàng)造活動。
概念:服務連續(xù)性(ITIL4)
是指在災難事態(tài)或破壞性事件發(fā)生后,服務提供者以可接受的預定義級別繼續(xù)服務運營的能力。
服務連續(xù)性管理通過確保 IT 和服務可以在災難或危機后所需的商定業(yè)務時間范圍內(nèi)恢復,從而支持整體業(yè)務連續(xù)性管理 (BCM) 和規(guī)劃能力。當服務中斷或組織風險發(fā)生的規(guī)模大于組織通過正常響應和恢復實踐(如事件和重大事件管理)處理它們的能力時,就會觸發(fā)該實踐。這種大規(guī)模的組織事態(tài)通常稱為災難。
每個組織都需要了解在自身的環(huán)境中什么是災難。在觸發(fā)事件之前,必須使用業(yè)務影響分析,在組織層面和 每個服務級別上考慮和定義災難的含義。
業(yè)務連續(xù)性(BCM:ISO22301-2019)
業(yè)務連續(xù)性管理ISO標準的描述相對比較晦澀,但是在2011年發(fā)布過一個《商業(yè)銀行業(yè)務連續(xù)性監(jiān)管指引》中對業(yè)務連續(xù)性的要求基本符合ISO的要求,但理解和落地性比較好,本文我們引用了其中的內(nèi)容:
業(yè)務連續(xù)性管理:是指商業(yè)銀行為有效應對重要業(yè)務運營中斷事件,建設應急響應、恢復機制和管理能力框架,保障重要業(yè)務持續(xù)運營的一整套管理過程,包括策略、組織架構、方法、標準和程序。
重要業(yè)務:是指面向客戶、涉及賬務處理、時效性要求較高的銀行業(yè)務,其運營服務中斷會對商業(yè)銀行產(chǎn)生較大經(jīng)濟損失或聲譽影響,或對公民、法人和其他組織的權益、社會秩序和公共利益、國家安全造成嚴重影響的業(yè)務。
重要業(yè)務運營中斷事件(以下簡稱運營中斷事件)是指因下述原因導致信息系統(tǒng)服務異常、重要業(yè)務停止運營的事件。主要包括:
(一)信息技術故障:信息系統(tǒng)技術故障、配套設施故障;
(二)外部服務中斷:第三方無法合作或提供服務等;
(三)人為破壞:黑客攻擊、恐怖襲擊等;
(四)自然災害:火災、雷擊、海嘯、地震、重大疫情等。
業(yè)務連續(xù)性管理需要做的事情:
確定重要業(yè)務及其恢復目標,
制定業(yè)務連續(xù)性計劃,
配置必要的資源,
有效處置運營中斷事件,
積極開展演練
業(yè)務連續(xù)性管理的評估改進。
三、業(yè)務連續(xù)性的核心概念定義
災難
ISO將災難定義為“一種具有高度不確定性的情況,這種情況會破壞核心業(yè)務和/或組織的信譽,并需要緊急行動。可以通俗理解為一種突發(fā)的計劃外事態(tài),可給組織造成巨大損害或重大損失。災難會導致組織在某些預定最短時間段內(nèi)無法履行重要的業(yè)務功能. 如:供應鏈故障、恐怖主義、天氣、網(wǎng)絡攻擊、衛(wèi)生緊急情況、政治或經(jīng)濟事件、技術故障、公共危機。
RTO (Recovery Time Objective)
定義:RTO 是指從業(yè)務流程中斷到恢復到可接受的服務水平所需的最大時間。
示例:假設一個在線零售商店的網(wǎng)站發(fā)生了故障。如果他們確定RTO為4小時,這意味著他們需要在4小時內(nèi)恢復網(wǎng)站的正常運行,以避免更大的業(yè)務損失。如何定義:RTO的定義通常基于以下因素:
業(yè)務對停機時間的容忍度。
潛在的經(jīng)濟損失。
客戶和合同方面的義務。
法規(guī)和合規(guī)要求。
RPO (Recovery Point Objective)
定義:RPO 是指在發(fā)生中斷事件后,可以接受數(shù)據(jù)丟失的最大時間段。
示例:繼續(xù)上面的在線零售商店的例子,如果他們確定RPO為30分鐘,這意味著他們可以接受最近30分鐘內(nèi)的數(shù)據(jù)丟失(例如,最近30分鐘的訂單)。因此,他們的備份策略可能需要每30分鐘備份一次數(shù)據(jù)。如何定義:RPO的定義通常基于以下因素:
業(yè)務對數(shù)據(jù)丟失的容忍度。
數(shù)據(jù)的價值和重要性。
法規(guī)和合規(guī)要求。
在確定RTO和RPO時,關鍵是進行全面的業(yè)務影響分析(BIA),了解各個業(yè)務流程和系統(tǒng)的重要性,并與相關的利益相關者進行溝通。這樣可以確保這兩個指標與業(yè)務的實際需求和風險承受能力相匹配。
最大容忍中斷時間/最大可接受中斷(MAO:Maximum Acceptable Outage)
ISO22301-2012定義如下(2019版已經(jīng)刪除):
MAO指在中斷威脅到組織實現(xiàn)其業(yè)務目標和/或生存能力之前必須進行有效恢復的時間。
RTO事件之后的時間段,在此期間生產(chǎn)或業(yè)務活動必須重新開始,或者資源必須恢復
按照此邏輯, RTO應當比MAO在數(shù)量上少一些,這足以說明組織的風險偏好.MAO應該在業(yè)務影響分析中確定。
RTO 應該在服務連續(xù)性計劃的開發(fā)中定義。
業(yè)務影響分析 (BIA)
服務連續(xù)性管理實踐中的一個關鍵活動,用于識別重要的業(yè)務功能 (VBF) 及它們的依賴關系。這些依賴關系可能包括供應商、人員、其他業(yè)務流程和 IT 服務。BIA 定義 IT 服務的恢復需求。這些需求包括每個 IT 服務的 RTO、RPO 和最小目標服務級別。
災難恢復計劃
一系列定義清晰的計劃,涉及組織如何從災難中復原并恢復到災難前狀態(tài),這些計劃應考慮服務管理的四個維度。通常包括的內(nèi)容:
響應計劃: 明確了服務提供者最初如何對破壞性的事態(tài)做出反應,以防止損壞,例如火災或網(wǎng)絡攻擊。
恢復計劃:明確了服務提供者如何恢復服務以實現(xiàn) RTO 和 RPO。
返回正常運營的計劃:
定義了服務提供商在恢復后如何恢復正常運營。
例如,如果已經(jīng)使用了備用數(shù)據(jù)中心,那么這個階段將使主數(shù)據(jù)中心重新投入運營,并恢復再次調(diào)用IT服務連續(xù)性計劃的能力。
應急預案
應急預案是組織應對運營中斷事件的總體方案,包括總體組織架構、各層級預案的定位和銜接關系及對運營中斷事件的預警、報告、分析、決策、處理、恢復等處置程序。
總體預案通常用于處置導致大范圍業(yè)務運營中斷的事件。
應當制定重要業(yè)務專項應急預案,專項應急預案應當注重災難場景的設計,明確在不同場景下的應急流程和措施。
業(yè)務條線的專項應急預案,應當注重調(diào)動內(nèi)部資源、采取業(yè)務應急手段盡快恢復業(yè)務,并和信息科技部門、保障部門的應急預案有效銜接。
專項應急預案的主要內(nèi)容應當包括:
(一)應急組織架構及各部門、人員在預案中的角色、權限、職責分工;
(二)信息傳遞路徑和方式;
(三)運營中斷事件處置程序,包括預警、報告、決策、指揮、響應、回退等;
(四)運營中斷事件處置過程中的風險控制措施;
(五)運營中斷事件的危機處理機制;
(六)運營中斷事件的內(nèi)部溝通機制和聯(lián)系方式;
(七)運營中斷事件的外部溝通機制和聯(lián)系方式;
(八)應急完成后的還原機制。
四、業(yè)務連續(xù)性在各規(guī)范/標準中的區(qū)別
可用性管理與服務連續(xù)性管理的區(qū)別
服務的連續(xù)性和可用性管理的實踐之間的界限是不明顯的。兩種做法都涉及風險的概念,并致力于識別和準備應對可能威脅并導致服務不能運轉的事件。對于這兩種實踐,都需要了解VBF和風險評估或服務故障的BIA。最終,兩種做法都確保了組織的抗故障能力。但兩個實踐在設計上是有不同的考慮,具體表現(xiàn)在:
緯度 | 可用性管理 | 服務連續(xù)性管理 |
關注點 | 高概率風險 | 高影響風險(緊急情況、災難) |
方法 | 更加主動 | 更加被動 |
目的 | 減少不期望事件的可能性 | 減少不期望事件的影響 |
解決方案的重點 | 技術解決方案 | 組織措施 |
策略 | 優(yōu)化 | 創(chuàng)建冗余 |
是否為公司功能的一部分 | 不是 | 通常是 |
情境 | 業(yè)務照常 | 特殊情況 |
相關指標 | MTRS、MTBF、MTBSI | RTO、RPO |
在實際落地和執(zhí)行可用性管理和服務連續(xù)性管理時,我們需要關注以下幾個不同點:
服務連續(xù)性管理實踐不包含那些不會嚴重影響組織的輕度或短期故障。
它關注與重大損害相關的風險,無論它們發(fā)生的可能性或不可能性有多大。
通常,這些是緊急情況:火災,洪水,斷電,數(shù)據(jù)中心故障等。
雖然可用性管理實踐并未忽略故障對服務提供者和消費者造成的負面影響但是單個組件的輕度中斷也在流程中有所考慮。
二者目標不同。
可用性管理實踐處理統(tǒng)計數(shù)據(jù)并分析趨勢;
連續(xù)性管理關心如何應對破壞性事件。
可用性規(guī)劃致力于滿足當前和將來的商定要求,并避免出現(xiàn)偏差。
可用性管理實踐發(fā)現(xiàn)并消除單點失效;
所采取的對策通常是積極主動的,以減少意外事態(tài)發(fā)生的可能性。
服務連續(xù)性管理實踐專注于規(guī)劃,以管理破壞性事件的嚴重后果。
備份站點,服務提供的替代方案的過渡,還有恢復程序,都可以減少損壞,但是通常不影響事件發(fā)生的可能性。
業(yè)務連續(xù)性在各個標準規(guī)范中的對比
特點/標準 | ISO 22301-2019 (業(yè)務連續(xù)性管理) | ISO 27001 (安全管理) | 應急管理 | 可用性管理 |
主要焦點 | 業(yè)務連續(xù)性和恢復 | 信息安全 | 災難和緊急響應 | 系統(tǒng)和服務的持續(xù)可用性 |
目的 | 確保關鍵業(yè)務功能在中斷后能迅速恢復 | 保護信息資產(chǎn)的完整性、機密性和可用性 | 減少緊急事件的影響,保護生命和財產(chǎn) | 優(yōu)化和確保關鍵服務和應用的高可用性 |
方法 | 風險評估、業(yè)務影響分析、恢復策略 | 風險評估、選擇和實施控制措施 | 預防、準備、響應、恢復 | 監(jiān)控、維護和恢復服務 |
業(yè)務連續(xù)性的角色 | 核心組成部分 | 一個控制目標,確保信息安全在業(yè)務連續(xù)性事件中得到維護 | 在災難后迅速恢復正常運營 | 通過技術手段確保服務不間斷 |
與其他標準/概念的關系 | 可與 ISO 27001 整合 | 可與 ISO 22301 整合 | 與業(yè)務連續(xù)性和安全管理有交集 | 與業(yè)務連續(xù)性有交集,但更偏重技術層面 |
適用場景 | 任何可能面臨業(yè)務中斷風險的組織 | 任何需要保護其信息資產(chǎn)的組織 | 面臨自然災害、技術事故或人為事件的組織 | 依賴關鍵IT系統(tǒng)和服務的組織 |
五、業(yè)務連續(xù)性與災難恢復(DR)
業(yè)務連續(xù)性管理(BCM)是一個全面的管理過程,預先定義了各種對組織運作能力有干擾的潛在影響,使組織能夠容忍部分或全部業(yè)務能力的喪失所帶來的影響。
災難恢復DR
災難恢復(DR)是在發(fā)生自然或人為災害后,重新啟用信息系統(tǒng)的數(shù)據(jù)、硬件及軟件設備,恢復正常商業(yè)運作的過程。災難恢復是的業(yè)務連續(xù)性管理的一部分,其核心是對企業(yè)的災難性風險做出評估、防范,特別是對關鍵性業(yè)務數(shù)據(jù)、流程予以及時記錄、備份和保護。
業(yè)務連續(xù)性管理(BCM)與災難恢復(DR)是兩個密切相關的做法,是指企業(yè)為了保持業(yè)務持續(xù)運行,為防范不可預見的風險所做的準備。
業(yè)務連續(xù)性管理更加寬泛,關注企業(yè)的戰(zhàn)略,以保障業(yè)務運營為目標,解決全生命周期的問題,而災難恢復更加注重具體操作,以系統(tǒng)為目標,著重解決事中的問題,同步處理事后的問題。
災難恢復(DR)與業(yè)務連續(xù)性管理(BCM)的區(qū)別和聯(lián)系
特點/標準 | 業(yè)務連續(xù)性管理 (BCM) | 災難恢復 (DR) |
主要焦點 | 整體業(yè)務流程和功能 | IT系統(tǒng)和數(shù)據(jù) |
目的 | 確保關鍵業(yè)務功能在中斷后能迅速恢復 | 在IT系統(tǒng)出現(xiàn)故障后迅速恢復數(shù)據(jù)和應用 |
方法 | 風險評估、業(yè)務影響分析、恢復策略 | 數(shù)據(jù)備份、系統(tǒng)恢復、備用站點 |
涵蓋范圍 | 整個組織的所有關鍵業(yè)務流程 | 主要是IT系統(tǒng)和數(shù)據(jù) |
實施時間 | 在中斷事件發(fā)生前、中、后 | 在中斷事件發(fā)生后 |
與其他標準/概念的關系 | BCM通常包括DR作為其組成部分 | DR是BCM的一個子集 |
適用場景 | 任何可能面臨業(yè)務中斷風險的組織 | 依賴關鍵IT系統(tǒng)和數(shù)據(jù)的組織 |
聯(lián)系:
互補性:業(yè)務連續(xù)性管理和災難恢復是互補的。
BCM關注整個組織的連續(xù)性,而DR專注于IT系統(tǒng)和數(shù)據(jù)的恢復。
層次:DR通常被視為BCM的一個關鍵組成部分。
當組織制定BCM策略和計劃時,它們通常會包括一個專門的DR計劃來處理IT相關的中斷。
目標:兩者的最終目標都是確保組織能夠在中斷事件后迅速恢復正常運營。
六、災備、容災和業(yè)務連續(xù)性
常說的容災系統(tǒng)就屬于災難恢復管理的技術范疇,這是一個完整的業(yè)務連續(xù)性大框架內(nèi)的一個極為重要的部分。一般而言,建設災備系統(tǒng),需要根據(jù)業(yè)務的要求和投入規(guī)模,確定業(yè)務連續(xù)性管理的范圍和程度,然后,針對IT容災和恢復提出切實可行的方案。缺少任何一個環(huán)節(jié),整個災備體系的建設都是不完整的。沒有IT容災和恢復的技術實現(xiàn),整個災備體系的規(guī)劃和計劃就是無源之水和空中樓閣,根本沒有根基。而沒有一個完善的業(yè)務連續(xù)性體系,則使得整個業(yè)務的災難后的連續(xù)運行無法有效進行,整個組織無法形成聯(lián)動機制,做到危機響應和危機應急。
業(yè)務連續(xù)性計劃是基于企業(yè)戰(zhàn)略的、處理長期的、面向中斷后維持業(yè)務連續(xù)性的規(guī)劃,核心是業(yè)務連續(xù);災難恢復計劃是面向重大的、災難性的系統(tǒng)故障,在異地恢復業(yè)務暫時性正常運轉的計劃。
當業(yè)務連續(xù)性管理和災難恢復結合到一個單一的項目中時,不能孤立地制訂業(yè)務連續(xù)性計劃或災難恢復計劃,要求企業(yè)管理人員和技術人員密切協(xié)作,制定切實可行的業(yè)務連續(xù)性和災難恢復的計劃和策略,保證業(yè)務連續(xù)性管理和災難恢復有效聯(lián)動。
根據(jù)監(jiān)管要求,每年需對企業(yè)的業(yè)務連續(xù)性管理做持續(xù)更新,包括風險分析、業(yè)務影響分析、業(yè)務連續(xù)性管理策略或災難恢復策略等。其次,隨著企業(yè)業(yè)務需求不斷增加,IT系統(tǒng)也需要經(jīng)常更新升級。
災備和備份的區(qū)別
容災(Disaster Tolerance):就是在上述的災難發(fā)生時,在保證生產(chǎn)系統(tǒng)的數(shù)據(jù)盡量少丟失的情況下,保持生存系統(tǒng)的業(yè)務不間斷地運行。
容錯(Fault Tolerance):指在計算機系統(tǒng)的軟件、硬件發(fā)生故障時,保證計算機系統(tǒng)中仍能工作的能力。
區(qū)別:容錯可以通過硬件冗余、錯誤檢查和熱交換 再加上特殊的軟件來實現(xiàn),而容災必須通過系統(tǒng)冗余、災難檢測和系統(tǒng)遷移等技術來實現(xiàn)。當設備故障不能通過容錯機制解決而導致系統(tǒng)宕機時,這種故障的解決就屬于容災的范疇。
什么是災難恢復(Disaster Recovery):指的是在災難發(fā)生后,將系統(tǒng)恢復到正常運作的能力。
區(qū)別:容災強調(diào)的是在災難發(fā)生時,保證系統(tǒng)業(yè)務持續(xù)不間斷地運行的能力,而災難恢復強調(diào)的災難之后,系統(tǒng)的恢復能力。現(xiàn)在的容災系統(tǒng)都包含著災難恢復的功能,所以本文的討論除了包括容災方面的內(nèi)容,還包括了 災難恢復的部分內(nèi)容。
容災系統(tǒng)在企業(yè)中給與數(shù)據(jù)安全系數(shù)相當高的保障,但是容災系統(tǒng)倒是是什么,他們是什么意思?恐怕連正在使用容災備份的網(wǎng)絡管理人員都不能解釋。本文用最淺顯的語言給大家解釋容災備份到底是什么。
容災和備份的目的不同
容災系統(tǒng)的目的在于保證系統(tǒng)數(shù)據(jù)和服務的“在線性”,即當系統(tǒng)發(fā)生故障時,仍然能夠正常地向網(wǎng)絡系統(tǒng)提供數(shù)據(jù)和服務,以使系統(tǒng)不致停頓。
而容災備份技術的目的與此并不相同,備份是“將在線數(shù)據(jù)轉移成離線數(shù)據(jù)的過程”,其目的在于應付系統(tǒng)數(shù)據(jù)中的邏輯錯誤和歷史數(shù)據(jù)保存。
所以,在各種容錯技術非常豐富的今天,備份系統(tǒng)仍然是不可替代的。
備份是基石
備份是指為防止系統(tǒng)出現(xiàn)操作失誤或系統(tǒng)故障導致數(shù)據(jù)丟失,而將全系統(tǒng)或部分數(shù)據(jù)集合從應用主機的硬盤或陣列復制到其它的存儲介質(zhì)的過程。
備份是數(shù)據(jù)高可用的最后一道防線,其目的是為了系統(tǒng)數(shù)據(jù)崩潰時能夠恢復數(shù)據(jù)。
容災不可少
那么建設了備份系統(tǒng),是否就不需要容災備份系統(tǒng)?這還要看業(yè)務部門對RTO(恢復所需的時間指標)/RPO(能夠恢復到的最新狀態(tài))指標的 期望值,如果允許1TB的數(shù)據(jù)庫RTO=8小時,RPO=1天,那備份系統(tǒng)就能滿足要求。同時,備份的目的在于應付系統(tǒng)數(shù)據(jù)中的邏輯錯誤和歷史數(shù)據(jù)保存。只能夠滿足數(shù)據(jù)丟失、數(shù)據(jù)破壞時的數(shù)據(jù)恢復目的,而不能提供實時的業(yè)務接管功能。
因此,容災系統(tǒng)對于某些關鍵業(yè)務而言也是必不可少的。人們談及容災備份往往是針對當生產(chǎn)系統(tǒng),不能正常工作時,其業(yè)務可由容災系統(tǒng)接替這些業(yè)務,繼續(xù)進行正常的工作。
能夠提供很好的RTO和RPO指標。同時遠程容災系統(tǒng)具備應付各種災難,特別是區(qū)域性與毀滅性災難的能力,具備較為完善的數(shù)據(jù)保護與災難恢復功能,保證災難降臨時數(shù)據(jù)的完整性及業(yè)務的連續(xù)性,并在最短時間內(nèi)恢復業(yè)務系統(tǒng)的正常運行,將損失降到最小。
容災不能替換備份
容災系統(tǒng)會完整地把生產(chǎn)系統(tǒng)的任何變化復制到容災端去,包括不想讓它復制的工作,比如不小心把計費系統(tǒng)內(nèi)的用戶信息表刪除了,同時容災端的 用戶信息表也會被完整地刪除。如果是同步容災,那容災端同時就刪除了;如果是異步容災,那容災端在數(shù)據(jù)異步復制的間隔內(nèi)就會被刪除。這時就需要從備份系統(tǒng) 中取出最新備份,來恢復被錯誤刪除的信息。因此容災系統(tǒng)的建設不能替代備份系統(tǒng)的建設。
七、業(yè)務連續(xù)性與高可用
高可用(High availability,即 HA)的主要目的是為了保障「業(yè)務的連續(xù)性」,即在用戶眼里,業(yè)務永遠是正常(或者說基本正常)對外提供服務的。通常,高可用主要是針對架構而言,但其實高可用系統(tǒng)設計有一套比較科學的工程管理套路,要從產(chǎn)品、開發(fā)、運維、基建等全方位去考量和設計,高可用系統(tǒng)的設計思想包括但不限于:
做好研發(fā)規(guī)范,系統(tǒng)都是研發(fā)人員設計和編碼寫出來的,因此首先要對研發(fā)層面有一個規(guī)范和標準
做好容量規(guī)劃和評估,主要是讓開發(fā)人員對系統(tǒng)要抗住的量級有一個基本認知,方便進行合理的架構設計和演進。
做好服務層面的高可用,主要是負載均衡、彈性擴縮容、異步解耦、故障容錯、過載保護等。
做好存儲層面的高可用,主要是冗余備份(熱備、冷備)、失效轉移(確認,轉移,恢復)等。
做好運維層面的高可用,主要是發(fā)布測試、監(jiān)控告警、容災、故障演練等。
做好產(chǎn)品層面的高可用,主要是兜底策略。
做好應急預案,主要是在出現(xiàn)問題后怎么快速恢復,不至于讓我們的異常事態(tài)擴大。
可以使用一張圖來表示高可用的設計思路。
BCM、容災、災備、高可用在數(shù)據(jù)中心的應用,BCM主要用于解決數(shù)據(jù)中心業(yè)務連續(xù)性兩個方面的問題:
(1) 高可用性
是指提供在數(shù)據(jù)中心部分故障的情況下,仍能提供繼續(xù)訪問應用的能力。不論這個故障是業(yè)務流程、物理設施、IT軟/硬件的故障。
(2) 災難恢復
是指當災難破壞數(shù)據(jù)中心時在不同地點、不同硬件設備上恢復數(shù)據(jù)的能力。上述兩個方面不是相互孤立的,而是相互關聯(lián)、有交叉的。為保證數(shù)據(jù)中心的業(yè)務連續(xù)性,高可用性和災難恢復要映射到數(shù)據(jù)中心的各個層面,從用戶終端到服務器、 存儲器、甚至包括機房環(huán)境。國際標準ISO20000和ISO27001建立了規(guī)范的IT服務和信息安全的管理體系,在ISO20000的框架內(nèi),就包含了可持續(xù)性管理流程的內(nèi)容。
八、總結:業(yè)務連續(xù)性、災備、容災、高可用
業(yè)務連續(xù)性是一套完整的管理體系核心目的是保障業(yè)務永遠正常。在這樣的目標之下需要一系列的管理方法、流程、制度、人員、技術去配套實現(xiàn)。因此,為企業(yè)重要應用和流程提供業(yè)務連續(xù)性應該包括以下三個方面:
業(yè)務連續(xù)性管理(BCM):
建立一套保障業(yè)務永遠正常的保障管理體系;
災難恢復(Disaster Recovery):
指當災難破壞生產(chǎn)中心時,在不同的地點恢復數(shù)據(jù)的能力。
高可用性(High availability) :指提供在本地故障情況下,能繼續(xù)訪問應用的能力。
無論這個故障是業(yè)務流程、物理設施,還是IT軟硬件故障。
同時,上述三個部分不是相互孤立的,是相互關聯(lián),而且有交叉的,可以總結如下圖:
實施業(yè)務連續(xù)性的關鍵動作
業(yè)務連續(xù)性行業(yè)生態(tài),有哪些細分市場領域
與業(yè)務連續(xù)性相關的廠商可以稱之為一個細分的行業(yè)市場,這個市場中可以大致的分為以下幾種
中企檢測認證網(wǎng)提供iso體系認證機構查詢,檢驗檢測、認證認可、資質(zhì)資格、計量校準、知識產(chǎn)權貫標一站式行業(yè)企業(yè)服務平臺。中企檢測認證網(wǎng)為檢測行業(yè)相關檢驗、檢測、認證、計量、校準機構,儀器設備、耗材、配件、試劑、標準品供應商,法規(guī)咨詢、標準服務、實驗室軟件提供商提供包括品牌宣傳、產(chǎn)品展示、技術交流、新品推薦等全方位推廣服務。這個問題就給大家解答到這里了,如還需要了解更多專業(yè)性問題可以撥打中企檢測認證網(wǎng)在線客服13550333441。為您提供全面檢測、認證、商標、專利、知識產(chǎn)權、版權法律法規(guī)知識資訊,包括商標注冊、食品檢測、第三方檢測機構、網(wǎng)絡信息技術檢測、環(huán)境檢測、管理體系認證、服務體系認證、產(chǎn)品認證、版權登記、專利申請、知識產(chǎn)權、檢測法、認證標準等信息,中企檢測認證網(wǎng)為檢測認證商標專利從業(yè)者提供多種檢測、認證、知識產(chǎn)權、版權、商標、專利的轉讓代理查詢法律法規(guī),咨詢輔導等知識。
本文內(nèi)容整合網(wǎng)站:百度百科、搜狗百科、360百科、知乎、市場監(jiān)督總局 、國家認證認可監(jiān)督管理委員會、質(zhì)量認證中心
免責聲明:本文部分內(nèi)容根據(jù)網(wǎng)絡信息整理,文章版權歸原作者所有。向原作者致敬!發(fā)布旨在積善利他,如涉及作品內(nèi)容、版權和其它問題,請跟我們聯(lián)系刪除并致歉!