第一篇:政府行業(yè)系統(tǒng)災(zāi)備建設(shè)白皮書
政府行業(yè)系統(tǒng)災(zāi)備建設(shè)白皮書
目 錄
政府行業(yè)災(zāi)備建設(shè)特點(diǎn)及案例剖析..............................................69 6.1
政府行業(yè)災(zāi)備建設(shè)特點(diǎn)及案例剖析...........................................................69 6.1.1
行業(yè)概覽..............................................................69 6.1.2
行業(yè)現(xiàn)狀與需求........................................................72 6.1.3
應(yīng)用場(chǎng)景與解決方案....................................................74 6.1.4
典型用戶案例..........................................................78 6.1.5 小結(jié)...............................................................80
災(zāi)備市場(chǎng)與行業(yè)趨勢(shì)...................................................................137 7.1
災(zāi)備市場(chǎng)概況........................................................................................137 7.1.1
市場(chǎng)高速增長(zhǎng).........................................................137 7.1.2
市場(chǎng)多元發(fā)展.........................................................138 7.2 未來(lái)五年(2020-2025)趨勢(shì)...............................................................139 7.2.1
信創(chuàng)推動(dòng)核心技術(shù)自主研發(fā).............................................139 7.2.2
合規(guī)性仍是推動(dòng)行業(yè)發(fā)展主因...........................................140 7.2.3
平臺(tái)化推進(jìn)災(zāi)備產(chǎn)業(yè)化發(fā)展.............................................141 7.2.4
災(zāi)備人才和用戶群體持續(xù)增長(zhǎng)...........................................142
政府行業(yè)災(zāi)備建設(shè)特點(diǎn)及案例剖析 數(shù)字化轉(zhuǎn)型加速了行業(yè)的信息化建設(shè),如何保障信息化建設(shè)安全,國(guó)家已經(jīng)從法律層面制定了一系列的法規(guī)條文,并明確了信息運(yùn)營(yíng)主體的職責(zé)。在這個(gè)大背景下,災(zāi)備建設(shè)落實(shí)到具體的建設(shè)工具,無(wú)外乎數(shù)據(jù)的容災(zāi)備份、遷移、恢復(fù)等技術(shù)產(chǎn)品。但每個(gè)行業(yè)的信息系統(tǒng)和數(shù)據(jù)特點(diǎn)不同,也造就了不同的災(zāi)備解決方案。譬如,政務(wù)行業(yè)的私有云架構(gòu),不僅要考慮內(nèi)外網(wǎng)特殊情況,還要考慮數(shù)據(jù)中心建設(shè)一期和二期軟硬件的異構(gòu)問(wèn)題等。
為了更真實(shí)地展現(xiàn)重點(diǎn)行業(yè)的災(zāi)備建設(shè)特點(diǎn),本章節(jié)涉及的行業(yè)概述、應(yīng)用場(chǎng)景和典型案例,主要來(lái)自英方軟件近百位一線技術(shù)工程師的實(shí)踐。這些內(nèi)容幾乎全面覆蓋了各個(gè)行業(yè)的災(zāi)備特點(diǎn)和需求,在具體的應(yīng)用場(chǎng)景和方案剖析中,也可以作為大家參考的重要的實(shí)踐內(nèi)容。
本章節(jié)共列舉了政府、金融、醫(yī)療、教育、電信、能源、制造等行業(yè)的災(zāi)備建設(shè)特點(diǎn),這些行業(yè)所涉及的內(nèi)容如下表所示。
行業(yè) 內(nèi)容 政府 指各級(jí)政府部門及各種機(jī)構(gòu),如公檢法、公積金、大數(shù)據(jù)局、環(huán)保、消防等部門。
金融 指經(jīng)營(yíng)金融商品的特殊行業(yè),包括銀行、保險(xiǎn)、信托、證券、會(huì)計(jì)、審核及相關(guān)設(shè) 備制造商、系統(tǒng)集成商。
醫(yī)療 指與人們身心健康相關(guān)的產(chǎn)業(yè)的統(tǒng)稱,包含了傳統(tǒng)意義上的衛(wèi)健委機(jī)構(gòu)、醫(yī)院等。
教育 指各地教育局和各大中專院校及中小學(xué)等教學(xué)主體。
電信 指各個(gè)電信運(yùn)營(yíng)商以及運(yùn)營(yíng)商機(jī)構(gòu)依托各地 IDC 進(jìn)行的云災(zāi)備建設(shè)。
能源 指天然氣、石油石化、國(guó)家電網(wǎng)、南方電網(wǎng)及各地下屬電網(wǎng)公司等。
制造 指機(jī)械和電子制造業(yè)、輕紡工業(yè)、資源加工工業(yè),如航空發(fā)動(dòng)機(jī)、半導(dǎo)體芯片、機(jī)械、汽車、五金、食品、服裝等。
表 6-1 災(zāi)備重點(diǎn)行業(yè)涉及領(lǐng)域 6.1 政府行業(yè)災(zāi)備建設(shè)特點(diǎn)及案例剖析 6.1.1 行業(yè)概覽 電子政務(wù)是指政府機(jī)構(gòu)通過(guò)運(yùn)用信息化手段,實(shí)現(xiàn)辦公自動(dòng)化、24 小時(shí)咨詢服務(wù)、網(wǎng)上申報(bào)和審批等各種政府職能。電子政務(wù)應(yīng)用包括政務(wù)信息查詢、公共政務(wù)辦公、政府辦公自動(dòng)化等。本內(nèi)容涉及的電子政務(wù)的建設(shè)主體是各級(jí)政府部門及各種組織機(jī)構(gòu),涵蓋各級(jí)黨組織、政府部門、公檢法、委辦機(jī)構(gòu)等,譬如各級(jí)人民政府、人民檢察院、人民法院、公安部門、消防、工商、稅務(wù)、環(huán)保等。本章節(jié)所涉及的電子政務(wù)的數(shù)據(jù)安全和業(yè)務(wù)連續(xù)性的內(nèi)容,也是以為百姓提供日常服務(wù)的政府及組織為主。
新基建、數(shù)字中國(guó)、智慧城市、互聯(lián)網(wǎng) + 政務(wù)等新型城市的建設(shè)浪潮,都離不開作為電子政務(wù)底座的新型基礎(chǔ)設(shè)施—政務(wù)云。當(dāng)前,各地政府大力興建的政務(wù)云,也不負(fù)重托,通過(guò)新型電子政務(wù)的方式,在數(shù)字政府、智慧政務(wù)、智慧民生等應(yīng)用領(lǐng)域,逐步實(shí)現(xiàn)人民政府提出的“讓數(shù)據(jù)多跑路,讓百姓少跑腿”的鄭重承諾。為此,通過(guò)先進(jìn)的數(shù)據(jù)復(fù)制、容災(zāi)備份等技術(shù)構(gòu)建一個(gè)安全可靠的政
務(wù)云,已經(jīng)成為各級(jí)政府組織信息化建設(shè)的重要內(nèi)容之一,也是建設(shè)人民滿意的數(shù)字化服務(wù)型政府的必要條件。
(1)等級(jí)保護(hù)和分級(jí)保護(hù) 政府電子政務(wù)的建設(shè)和發(fā)展關(guān)乎國(guó)計(jì)民生,也關(guān)于國(guó)家安全和經(jīng)濟(jì)發(fā)展。由于當(dāng)前的信息安全保密問(wèn)題日益突出,勒索病毒、網(wǎng)絡(luò)攻擊、機(jī)密文件泄露等事件愈發(fā)頻繁,給國(guó)家安全和政府外交工作帶來(lái)重大的挑戰(zhàn)。為此構(gòu)建新時(shí)代電子政務(wù)的信息化應(yīng)用,必須做好關(guān)鍵信息和數(shù)據(jù)的安全管理及保護(hù)工作,必須加強(qiáng)對(duì)政府信息數(shù)據(jù)和國(guó)家機(jī)密保護(hù)的宣傳工作,必須確保各類信息不泄露、不丟失和重要系統(tǒng)不出現(xiàn)重大故障。
強(qiáng)化信息安全,法度利器先行。國(guó)家層面已制定了相應(yīng)的一系列法律法規(guī),強(qiáng)制性要求各類數(shù)據(jù)中心的運(yùn)營(yíng)機(jī)構(gòu)必須遵守各項(xiàng)信息安全規(guī)定,提升整體的信息安全防護(hù)措施,而政府及組織在這方面起到了帶頭示范的作用。在國(guó)家已頒布的一系列法律法規(guī)中,等級(jí)保護(hù)和分級(jí)保護(hù)的影響范圍最廣。
等級(jí)保護(hù),即信息安全技術(shù)網(wǎng)絡(luò)安全等級(jí)保護(hù)要求,是我國(guó)信息安全保障的一項(xiàng)基本制度。2003 年由中辦、國(guó)辦轉(zhuǎn)發(fā)《國(guó)家信息化領(lǐng)導(dǎo)小組關(guān)于加強(qiáng)信息安全保障工作的意見》,正式提出實(shí)行信息安全等級(jí)保護(hù)和建立國(guó)家信息安全保障體系的明確要求。2007 年和 2008 年頒布實(shí)施的 《信息安全等級(jí)保護(hù)管理辦法》和《信息安全等級(jí)保護(hù)基本要求》,統(tǒng)稱“等保 1.0 ”;2019 年 5 月發(fā) 布《信息安全技術(shù)網(wǎng)絡(luò)安全等級(jí)保護(hù)基本要求》,統(tǒng)稱“等保 2.0 ”。在等級(jí)保護(hù)分級(jí)中,按重要程度共分為五級(jí):
一級(jí)(自主保護(hù))
二級(jí)(指導(dǎo)保護(hù))
三級(jí)(監(jiān)督保護(hù))
四級(jí)(強(qiáng)制保護(hù))
五級(jí)(??乇Wo(hù))
除了等級(jí)保護(hù),國(guó)家也對(duì)涉及國(guó)家機(jī)密的信息系統(tǒng)進(jìn)行了分級(jí)。2005 年 12 月,國(guó)家保密局下 發(fā)了《涉及國(guó)家秘密的信息系統(tǒng)分級(jí)保護(hù)管理辦法》,同時(shí),《保密法》修訂草案也增加了網(wǎng)絡(luò)安全保密管理的條款。分級(jí)保護(hù)分為:
秘密級(jí) 機(jī)密級(jí)和機(jī)密級(jí)(增強(qiáng))
絕密級(jí) 等級(jí)保護(hù)和分級(jí)保護(hù)的制定,從國(guó)家法律層面規(guī)范了公民、法人和機(jī)構(gòu)組織對(duì)信息系統(tǒng)分等級(jí) 實(shí)行安全保護(hù)。各級(jí)政府電子政務(wù)的建設(shè),涵蓋幾十個(gè)不同等級(jí)的應(yīng)用系統(tǒng),如何區(qū)分這些系統(tǒng)的等級(jí)和分級(jí),政府政務(wù)管理機(jī)構(gòu)已經(jīng)組織專家團(tuán)隊(duì)做了全面的評(píng)估和評(píng)定,對(duì)政府應(yīng)用的系統(tǒng)進(jìn)行了等級(jí)劃分。
一般而言,面向社會(huì)提供服務(wù)窗口的網(wǎng)站及 Web 應(yīng)用系統(tǒng)對(duì)國(guó)家安全影響有限,可以劃分為一二級(jí)等級(jí)保護(hù),對(duì)外公開的氣候、經(jīng)濟(jì)統(tǒng)計(jì)、災(zāi)害預(yù)防等信息也不屬于國(guó)家秘密。但是,一些重要的網(wǎng)站、內(nèi)部流轉(zhuǎn)的機(jī)密公文及測(cè)繪、國(guó)防等信息系統(tǒng),就屬于較高等級(jí)或秘密的保護(hù)范疇。故從數(shù)據(jù)管理和災(zāi)備角度分析,電子政務(wù)信息系統(tǒng)應(yīng)根據(jù)其信息安全保護(hù)等級(jí)和業(yè)務(wù)連續(xù)性要求,選擇建設(shè)相對(duì)應(yīng)的災(zāi)備系統(tǒng),以防止因系統(tǒng)終止提供服務(wù)而對(duì)市民的正常生產(chǎn)生活帶來(lái)影響,甚至造成嚴(yán)重的社會(huì)影響;電子政務(wù)信息系統(tǒng)也應(yīng)根據(jù)其數(shù)據(jù)的重要性程度制定數(shù)據(jù)備份策略,以防止因數(shù)據(jù)丟失而造成損失。
(2)政府電子政務(wù)發(fā)展的法律法規(guī) 國(guó)家在大力推進(jìn)電子政務(wù)快速發(fā)展的同時(shí),不同主管機(jī)構(gòu)和部門下發(fā)和頒布了一系列的政策法規(guī)。例如:
《中華人民共和國(guó)網(wǎng)絡(luò)安全法》第七十二條規(guī)定:國(guó)家機(jī)關(guān)政務(wù)網(wǎng)絡(luò)的運(yùn)營(yíng)者不履行本法規(guī)定的網(wǎng)絡(luò)安全保護(hù)義務(wù)的,由其上級(jí)機(jī)關(guān)或者有關(guān)機(jī)關(guān)責(zé)令改正;對(duì)直接負(fù)責(zé)的主管人員和其他直接責(zé)任人員依法給予處分。
《國(guó)務(wù)院辦公廳關(guān)于印發(fā)進(jìn)一步深化“互聯(lián)網(wǎng)+ 政務(wù)服務(wù)”推進(jìn)政務(wù)服務(wù)“一網(wǎng)、一門、一次” 改革實(shí)施方案的通知》(國(guó)辦發(fā)〔2018〕45 號(hào))要求“加強(qiáng)數(shù)據(jù)共享安全保障”,依法加強(qiáng)隱私等信息保護(hù);提高國(guó)家電子政務(wù)外網(wǎng)、國(guó)家數(shù)據(jù)共享交換平臺(tái)和國(guó)家政務(wù)服務(wù)平臺(tái)的安全防護(hù)能力; 推進(jìn)政務(wù)信息資源共享風(fēng)險(xiǎn)評(píng)估和安全審查,強(qiáng)化應(yīng)急預(yù)案管理,切實(shí)做好數(shù)據(jù)安全事件的應(yīng)急處置。
《國(guó)家發(fā)展改革委關(guān)于印發(fā)“十三五”國(guó)家政務(wù)信息化工程建設(shè)規(guī)劃的通知》指出,“構(gòu)建一體化政務(wù)數(shù)據(jù)平臺(tái)”是規(guī)劃的主要任務(wù)之一,即按照“數(shù)、云、網(wǎng)、端”融合創(chuàng)新趨勢(shì)及電子政務(wù)集約化建設(shè)需求,依托統(tǒng)一的國(guó)家電子政務(wù)網(wǎng)絡(luò)加快建設(shè)綜合性公共基礎(chǔ)設(shè)施平臺(tái),形成互聯(lián)互通、安全防護(hù)、共享交換、云計(jì)算、數(shù)據(jù)分析、容災(zāi)備份等綜合服務(wù)能力,實(shí)現(xiàn)電子政務(wù)關(guān)鍵公共基礎(chǔ)設(shè)施的統(tǒng)建共用,支撐政務(wù)業(yè)務(wù)協(xié)同和數(shù)據(jù)共享匯聚。
本章節(jié)整理了對(duì)政府電子政務(wù)發(fā)展起到積極推動(dòng)作用的法律法規(guī)及文件,各級(jí)政府及組織可根據(jù)機(jī)構(gòu)規(guī)模、屬性、等級(jí)進(jìn)行相應(yīng)的數(shù)據(jù)安全和業(yè)務(wù)連續(xù)性的建設(shè)。
“加快電子政務(wù)信息系統(tǒng)的發(fā)展” 《國(guó)務(wù)院辦公廳關(guān)于促進(jìn)電子政務(wù)協(xié)調(diào)發(fā)展的指導(dǎo)意見》(國(guó)辦發(fā)〔2014〕66 號(hào))
《國(guó)務(wù)院關(guān)于促進(jìn)云計(jì)算創(chuàng)新發(fā)展培育信息產(chǎn)業(yè)新業(yè)態(tài)的意見》(國(guó)發(fā)〔2015〕 5 號(hào))
《國(guó)務(wù)院關(guān)于印發(fā)政務(wù)信息資源共享管理暫行辦法的通知》(國(guó)發(fā)〔2016〕51 號(hào))
《國(guó)務(wù)院關(guān)于加快推進(jìn)“互聯(lián)網(wǎng) + 政務(wù)服務(wù)”工作的指導(dǎo)意見》(國(guó)發(fā)〔2016〕55 號(hào))
《國(guó)務(wù)院辦公廳關(guān)于印發(fā) <2017 年政務(wù)公開工作要點(diǎn) > 的通知》(國(guó)辦發(fā)〔2017〕24 號(hào))
《國(guó)務(wù)院辦公廳關(guān)于印發(fā)政府網(wǎng)站發(fā)展指引的通知》(國(guó)辦發(fā)〔2017〕47 號(hào))
《國(guó)務(wù)院辦公廳關(guān)于印發(fā)< 政府網(wǎng)站集約化試點(diǎn)工作方案> 的通知》(國(guó)辦函〔2018〕71 號(hào))
“關(guān)于保障電子政務(wù)信息系統(tǒng)安全的發(fā)展” 《關(guān)于加強(qiáng)黨政部門云計(jì)算服務(wù)網(wǎng)絡(luò)安全管理的意見》(中網(wǎng)辦發(fā)文〔2014〕14 號(hào))
《關(guān)于加強(qiáng)黨政機(jī)關(guān)網(wǎng)站安全管理的通知》(中網(wǎng)辦發(fā)文〔2014〕1 號(hào))
《公共安全業(yè)務(wù)連續(xù)性管理體系指南》國(guó)家標(biāo)準(zhǔn)(GB/T 31595-2015)
《國(guó)家網(wǎng)絡(luò)空間安全戰(zhàn)略》(國(guó)家網(wǎng)信辦 2016 年 7 月)
《中華人民共和國(guó)網(wǎng)絡(luò)安全法》(2017 年 6 月 1 日)
《信息安全技術(shù)網(wǎng)絡(luò)安全等級(jí)保護(hù)基本要求》(GB/T 22239-2019)
《網(wǎng)絡(luò)安全審查辦法》(國(guó)家網(wǎng)信辦 2020 年 4 月)
隨著我國(guó)經(jīng)濟(jì)體量的持續(xù)壯大和國(guó)際地位的顯著提升,境外敵對(duì)勢(shì)力通過(guò)網(wǎng)絡(luò)滲透攻擊我國(guó)重要部門的網(wǎng)絡(luò)系統(tǒng),以及通過(guò)黑客技術(shù)加密重要文件的事情時(shí)有發(fā)生。據(jù)新聞報(bào)道,從 2014 年開始,某機(jī)構(gòu)安全大腦通過(guò)整合海量安全大數(shù)據(jù),發(fā)現(xiàn)了多起境外 APT 組織使用“在野”0day 漏洞針對(duì) 我國(guó)境內(nèi)目標(biāo)發(fā)起的 APT 攻擊,并發(fā)現(xiàn)境外針對(duì)中國(guó)境內(nèi)目標(biāo)的攻擊最早可以追溯到 2007 年,至 少影響了中國(guó)境內(nèi)超過(guò)萬(wàn)臺(tái)電腦,攻擊范圍遍布國(guó)內(nèi) 31 個(gè)省級(jí)行政區(qū)。
這些攻擊對(duì)象包括國(guó)防、航天、政府、重要企業(yè)的網(wǎng)絡(luò)系統(tǒng),由此可見各級(jí)政府及組織加強(qiáng)電子政務(wù)信息系統(tǒng)和數(shù)據(jù)安全的保護(hù)迫在眉睫。
6.1.2 行業(yè)現(xiàn)狀與需求 提高工作效率,建設(shè)人民滿意的數(shù)字化服務(wù)型政府,離不開政務(wù)電子化所需要的各種信息化技術(shù)和設(shè)備。我國(guó)電子政務(wù)建設(shè),以 1999 年政府上網(wǎng)工程啟動(dòng)這一標(biāo)志性事件為界 , 之前為政府信息化的前期 , 之后為政府信息化大規(guī)模建設(shè)階段。我們總體上將其劃分為三個(gè)時(shí)期:
(1)網(wǎng)站建設(shè)時(shí)期 這一時(shí)期的電子政務(wù)建設(shè),更多關(guān)注政務(wù)信息和流程的公布,與群眾線上交互等。同時(shí),通過(guò)政府部門的帶動(dòng),培養(yǎng)群眾對(duì)新技術(shù)、新方式的接受和適應(yīng)能力。
(2)信息化時(shí)期 這個(gè)時(shí)期主要是在第一階段的基礎(chǔ)上,實(shí)現(xiàn)協(xié)同辦公、不見面審批、網(wǎng)上執(zhí)法、網(wǎng)絡(luò)化管理等。這個(gè)階段所面臨的挑戰(zhàn)是實(shí)現(xiàn)孤立部門間流程的統(tǒng)一和協(xié)同化。
(3)大數(shù)據(jù)時(shí)代 這個(gè)階段政府的網(wǎng)絡(luò)建設(shè)觀念逐漸淡化,更多強(qiáng)調(diào)對(duì)大數(shù)據(jù)、人工智能、容器云、區(qū)塊鏈等新興技術(shù)的應(yīng)用,實(shí)現(xiàn)對(duì)數(shù)據(jù)的挖掘、交互、分析、保護(hù),同時(shí)也更強(qiáng)調(diào)數(shù)據(jù)和業(yè)務(wù)的安全性,強(qiáng)調(diào)部門協(xié)同打破數(shù)據(jù)孤島,保障數(shù)據(jù)價(jià)值的時(shí)效性,加快數(shù)據(jù)流動(dòng),最終為供給側(cè)提供需要的數(shù)據(jù)價(jià)值,從而為老百姓提供更高效便捷的政務(wù)服務(wù)。
時(shí)至今日,電子政務(wù)也從前端網(wǎng)站建設(shè)轉(zhuǎn)向基礎(chǔ)設(shè)施集約建設(shè),政務(wù)云和大數(shù)據(jù)中心已成為數(shù)字政府建設(shè)的當(dāng)務(wù)之急。政務(wù)云也是電子政務(wù) IT 發(fā)展新 10 年,在云計(jì)算時(shí)代,電子政務(wù) IT 基礎(chǔ)
設(shè)施將從分離重新走向融合,用戶通過(guò)云操作系統(tǒng),將數(shù)據(jù)中心多廠家異構(gòu)的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源進(jìn)行統(tǒng)一融合,對(duì)外提供開放與標(biāo)準(zhǔn)化的IT 服務(wù)接口,實(shí)現(xiàn)數(shù)據(jù)資源與應(yīng)用資源的融合。為此,在眾多的子系統(tǒng)與數(shù)據(jù)庫(kù)中,需要一個(gè)平臺(tái)來(lái)傳遞可靠的、與平臺(tái)及語(yǔ)言無(wú)關(guān)的數(shù)據(jù),且能夠把數(shù)據(jù)透明化。這時(shí),數(shù)據(jù)復(fù)制技術(shù)將在接口調(diào)用過(guò)程中發(fā)揮重要作用,通過(guò)不斷的收集、調(diào)用、分析數(shù)據(jù),滿足 IT 業(yè)務(wù)的需求,并協(xié)助業(yè)務(wù)模型決策做出更智能的預(yù)測(cè)。
硬幣都有兩面性,云環(huán)境下的電子政務(wù)在獲得集約建設(shè)、資源利用最大化的同時(shí),也意味著風(fēng)險(xiǎn)共擔(dān)。政務(wù)云建設(shè)需要評(píng)估資源間的依賴關(guān)系,適當(dāng)對(duì) IT 資源進(jìn)行解耦,減少 IT 資源的關(guān)聯(lián)風(fēng)險(xiǎn),以及對(duì)關(guān)鍵 IT 資源進(jìn)行容災(zāi)備份,確保構(gòu)建在政務(wù)云上的系統(tǒng)安全持續(xù)運(yùn)行。
不將所有雞蛋放在一個(gè)籃子,是各地政務(wù)云建設(shè)應(yīng)當(dāng)遵循的一個(gè)標(biāo)準(zhǔn)。當(dāng)前,政務(wù)云建設(shè)分為內(nèi)外網(wǎng),以及兩地三中心或異地容災(zāi)的建設(shè)模式。即通常情況下,在同一個(gè)政務(wù)云的數(shù)據(jù)中心,管理者會(huì)將政務(wù)內(nèi)網(wǎng)系統(tǒng)和外網(wǎng)系統(tǒng)劃分為兩個(gè)區(qū)域,它們之間的 IT 資源相互獨(dú)立,同時(shí)同城采用主備模式,在同城 50 公里左右的地方構(gòu)建備用政務(wù)云數(shù)據(jù)中心,當(dāng)生產(chǎn)數(shù)據(jù)中心的系統(tǒng)發(fā)生故障,要么在本地?cái)?shù)據(jù)中心進(jìn)行系統(tǒng)切換,要么整體切換到備用數(shù)據(jù)中心,實(shí)現(xiàn)系統(tǒng)應(yīng)用的容災(zāi)保護(hù)。最后,為了避免區(qū)域性災(zāi)害如地震、火災(zāi)、洪災(zāi)、戰(zhàn)爭(zhēng)可能造成的毀滅性破壞,對(duì)于重要系統(tǒng)和數(shù)據(jù)庫(kù)數(shù)據(jù),還需要在異地建立災(zāi)備中心,用于關(guān)鍵系統(tǒng)和數(shù)據(jù)的恢復(fù),符合等保要求。
圖 6.1-1 電子政務(wù)架構(gòu)圖 在這種“一朵云二張網(wǎng)三中心”的運(yùn)營(yíng)管理模式下,電子政務(wù)在業(yè)務(wù)方面,劃分為兩類:一類是以省-市州-區(qū)縣-鄉(xiāng)鎮(zhèn)為四級(jí)行政機(jī)構(gòu)的電子政務(wù)模式,專注于政府便民服務(wù)、政策發(fā)布執(zhí)行和公文傳輸?shù)?;一類是以省廳-市州局-區(qū)縣分局-鄉(xiāng)鎮(zhèn)營(yíng)業(yè)所(行業(yè)稱呼略有差別)的模式,專注細(xì)分業(yè)務(wù)的對(duì)外服務(wù)、政策執(zhí)行發(fā)布和公文傳輸?shù)龋ㄈ绻珯z法)。
不同的領(lǐng)域和單位,有不同的數(shù)據(jù)安全和業(yè)務(wù)連續(xù)性需求,等級(jí)保護(hù)和分級(jí)保護(hù)要求也不一樣,綜合分析,主要存在以下需求:
業(yè)務(wù)數(shù)據(jù)本地備份、CDP
本地?cái)?shù)據(jù)庫(kù)讀寫分離和容災(zāi)本地應(yīng)用系統(tǒng)的容災(zāi)高可用關(guān)鍵系統(tǒng)的異地跨平臺(tái)容災(zāi)
政務(wù)云虛擬機(jī)遷移和云災(zāi)備內(nèi)外網(wǎng)兩地三中心容災(zāi)備份 綜上,隨著電子政務(wù)的落地發(fā)展,構(gòu)建政務(wù)云之間的災(zāi)備體系將是下一步的建設(shè)重點(diǎn),防范網(wǎng)絡(luò)入侵和病毒攻擊將是首要任務(wù),同時(shí)系統(tǒng)故障帶來(lái)的對(duì)外服務(wù)窗口的關(guān)閉,如政務(wù)掛號(hào)系統(tǒng)故障、發(fā)布防洪資訊的網(wǎng)站訪問(wèn)不了,都會(huì)帶來(lái)一定的社會(huì)影響。為此,需要制定完備的容災(zāi)機(jī)制,確保數(shù)據(jù)不丟、業(yè)務(wù)不停。
6.1.3 應(yīng)用場(chǎng)景與解決方案 實(shí)現(xiàn)電子政務(wù)的數(shù)據(jù)安全和業(yè)務(wù)連續(xù)性建設(shè),需要捋清楚電子政務(wù)的系統(tǒng)網(wǎng)絡(luò)建設(shè)情況,特別是政務(wù)內(nèi)外網(wǎng)、多種異構(gòu)平臺(tái)情況、二層與三層網(wǎng)絡(luò)應(yīng)用等。
目前,我國(guó)電子政務(wù)網(wǎng)絡(luò)系統(tǒng)分為政務(wù)內(nèi)網(wǎng)和政務(wù)外網(wǎng),內(nèi)網(wǎng)是為政務(wù)系統(tǒng)自建的私有網(wǎng)絡(luò),外網(wǎng)一般指互聯(lián)網(wǎng),政務(wù)內(nèi)外網(wǎng)通過(guò)信息安全交換系統(tǒng),實(shí)現(xiàn)信息的交換,兩者是相互隔離又相互補(bǔ)充的關(guān)系。
政務(wù)內(nèi)網(wǎng):以滿足政府內(nèi)部辦公的需求為主,通過(guò)獨(dú)立的軟硬件設(shè)備達(dá)到物理隔離的目標(biāo),對(duì)上與國(guó)家電子政務(wù)內(nèi)網(wǎng)互聯(lián)。政務(wù)內(nèi)網(wǎng)為了安全覆蓋范圍盡可能少,主要用于傳送電子公文,以及不適合通過(guò)外網(wǎng)傳輸?shù)男畔ⅲ热缯?wù)信息、視頻會(huì)議等信息。
政務(wù)外網(wǎng):以政府公共服務(wù)網(wǎng)為主,組織機(jī)構(gòu)及民眾可以通過(guò)政府公共服務(wù)網(wǎng)查詢相關(guān)的政務(wù)信息。政務(wù)外網(wǎng)與互聯(lián)網(wǎng)通過(guò)網(wǎng)絡(luò)安全系統(tǒng)邏輯連接,是政務(wù)機(jī)構(gòu)人員與外面進(jìn)行信息交流的通道,是政務(wù)公開和為民辦事的主要窗口,各單位通過(guò)網(wǎng)站對(duì)外提供網(wǎng)上服務(wù)、受理申請(qǐng)等,典型代表為各類政府信息門戶網(wǎng)站。
互聯(lián)網(wǎng)出口:在異地災(zāi)備建設(shè)過(guò)程中,互聯(lián)網(wǎng)出口是系統(tǒng)故障完成切換后,政務(wù)系統(tǒng)繼續(xù)對(duì)外提供服務(wù)的網(wǎng)絡(luò)端口。通常情況下,按照規(guī)定政府機(jī)構(gòu)的下屬單位上網(wǎng),應(yīng)該統(tǒng)一上聯(lián)到政府信息中心的互聯(lián)網(wǎng)出口,但業(yè)務(wù)的不同,會(huì)存在個(gè)別政府單位因?yàn)楣ぷ餍枰蚱渌颍梢源罱í?dú)立的互聯(lián)網(wǎng)出口。
異構(gòu)平臺(tái)系統(tǒng):政務(wù)數(shù)據(jù)中心有一個(gè)顯著的特征,是供應(yīng)商錯(cuò)綜復(fù)雜,品牌繁多,不同的數(shù)據(jù)中心,存在虛擬化平臺(tái)異構(gòu)、服務(wù)器異構(gòu)、存儲(chǔ)系統(tǒng)與硬件異構(gòu)、數(shù)據(jù)庫(kù)異構(gòu)等問(wèn)題;此外,結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)也對(duì)政務(wù)大數(shù)據(jù)平臺(tái)、數(shù)據(jù)湖、容災(zāi)備份等應(yīng)用帶來(lái)挑戰(zhàn)。
網(wǎng)絡(luò)層容災(zāi)切換:政務(wù)系統(tǒng)內(nèi)外網(wǎng)的通信,以及在兩地三中心或異地容災(zāi)的情況下,會(huì)涉及不同網(wǎng)絡(luò)層的應(yīng)用。在故障發(fā)生時(shí),英方軟件通常采用的故障切換接管方法,分為在二層網(wǎng)絡(luò)環(huán)境下,會(huì)采用 VIP 漂移技術(shù),實(shí)現(xiàn)故障的切換;在三層網(wǎng)絡(luò)環(huán)境下,可以采用負(fù)載均衡方式,實(shí)現(xiàn)故障切換;在廣域網(wǎng)環(huán)境下,支持與 DNS 服務(wù)器無(wú)縫結(jié)合,實(shí)現(xiàn)故障切換。
綜上,針對(duì)不同場(chǎng)景不同網(wǎng)絡(luò)環(huán)境下的政務(wù)系統(tǒng),電子政務(wù)主管部門根據(jù)各個(gè)系統(tǒng)安全等級(jí)保護(hù)的要求,需要做出相應(yīng)的調(diào)整,當(dāng)本地?cái)?shù)據(jù)中心發(fā)生故障或出現(xiàn)重大災(zāi)難時(shí),可以馬上進(jìn)行容災(zāi)切換及數(shù)據(jù)恢復(fù)。而對(duì)于數(shù)據(jù)安全和業(yè)務(wù)連續(xù)性的建設(shè),采用同城或異地的主備數(shù)據(jù)中心、兩地三中心等方案,不僅可以實(shí)現(xiàn)省級(jí)(直轄市)的政府及組織電子政務(wù)云平臺(tái)的容災(zāi)備份,還可以實(shí)現(xiàn)地市級(jí)(區(qū)縣)政務(wù)系統(tǒng)的容災(zāi)備份。
英方軟件在電子政務(wù)領(lǐng)域擁有豐富容災(zāi)備份的項(xiàng)目實(shí)踐經(jīng)驗(yàn),可以為用戶提供政務(wù)系統(tǒng)的跨平臺(tái)遷移、本地容災(zāi)備份、異地?cái)?shù)據(jù)庫(kù)數(shù)據(jù)實(shí)時(shí)同步和系統(tǒng)容災(zāi)、云容災(zāi)、兩地三中心災(zāi)備等解決方案。由于政務(wù)機(jī)關(guān)分門別類較多,難以逐一陳述,下面我們挑選幾個(gè)有代表性的場(chǎng)景進(jìn)行介紹。
圖 6.1-2 政府及組織電子政務(wù)云整體架構(gòu)
(1)海量虛擬機(jī)跨平臺(tái)遷移和容災(zāi) 場(chǎng)景特點(diǎn):虛擬機(jī)數(shù)量大;虛擬化平臺(tái)及版本異構(gòu)。
用戶需求:本地或云端到云端的系統(tǒng)熱遷移;虛擬機(jī)的備份和故障快速切換接管。
圖 6.1-3 跨虛擬化平臺(tái)系統(tǒng)熱遷移 應(yīng)用實(shí)踐:在本地或異地?cái)?shù)據(jù)中心,通過(guò) i 2 M o ve
系統(tǒng)在線熱遷移軟件,在不影響日常政務(wù)服務(wù)的前提下,可以將系統(tǒng)從 V M w a r e
虛擬化平臺(tái)遷移到 K V M
+
O p e n S t a c k的異構(gòu)平臺(tái)上,同時(shí)增量數(shù)據(jù)及 IP 地址可一起遷移到新的平臺(tái)上,整個(gè)遷移進(jìn)程自動(dòng)化,遷移成功率高。與此同時(shí),由于平臺(tái)型故障對(duì)虛擬機(jī)集群可以造成致命打擊,為此需要通過(guò) i 2 A v a il a b ili t y
實(shí)現(xiàn)重要虛擬機(jī)系統(tǒng)的容災(zāi),保障業(yè)務(wù)連續(xù)性。
(2)政務(wù)云兩地三中心災(zāi)備 場(chǎng)景特點(diǎn):虛擬機(jī)規(guī)模大、內(nèi)外網(wǎng)環(huán)境;等級(jí)保護(hù)和分級(jí)保護(hù)要求不同。
用戶需求:建設(shè)兩地三中心災(zāi)備,保留互聯(lián)網(wǎng)出口;重要系統(tǒng)同城容災(zāi),數(shù)據(jù)異地備份;數(shù)據(jù)庫(kù)數(shù)據(jù)的實(shí)時(shí)同步和讀寫分離。
圖 6.1-4 政務(wù)云兩地三中心災(zāi)備 應(yīng)用實(shí)踐:兩地三中心的模式下,災(zāi)備建設(shè)遵守內(nèi)外網(wǎng)相互隔離的原則,并根據(jù)用戶需求決定是否在災(zāi)備端保留互聯(lián)網(wǎng)出口;在本地生產(chǎn)中心到同城災(zāi)備中心異構(gòu)虛擬化平臺(tái)的過(guò)程中,通過(guò) i 2 A c t i ve
數(shù)據(jù)庫(kù)語(yǔ)義級(jí)的數(shù)據(jù)實(shí)時(shí)復(fù)制和同步軟件,實(shí)現(xiàn)數(shù)據(jù)庫(kù)讀寫分離和容災(zāi);同時(shí)通過(guò) i2Availability 實(shí)現(xiàn)異構(gòu)平臺(tái)核心業(yè)務(wù)容災(zāi)接管;最后通過(guò) i2CDP、i2FFO 進(jìn)行本地到同城,同城到異地的數(shù)據(jù)同步和備份,可以有效防范邏輯錯(cuò)誤、勒索病毒的攻擊,保障數(shù)據(jù)和業(yè)務(wù)的安全。
(3)公安廳警務(wù)系統(tǒng)異地容災(zāi)與數(shù)據(jù)庫(kù)雙活 場(chǎng)景特點(diǎn):等級(jí)保護(hù)和分級(jí)保護(hù)要求不同;各個(gè)平臺(tái)的異構(gòu)問(wèn)題突出。
用戶需求:數(shù)據(jù)庫(kù)數(shù)據(jù)的實(shí)時(shí)同步和讀寫分離;建立同城或異地容災(zāi)中心;實(shí)現(xiàn)跨平臺(tái)的容災(zāi)接管。
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
圖 6.1-5 公安廳警務(wù)系統(tǒng)異地容災(zāi)與數(shù)據(jù)庫(kù)雙活
應(yīng)用實(shí)踐:在專網(wǎng)環(huán)境下的本地和異地?cái)?shù)據(jù)中心,通過(guò) i 2 A c t i ve
數(shù)據(jù)庫(kù)語(yǔ)義級(jí)的數(shù)據(jù)實(shí)時(shí)復(fù)制和同步軟件,將 O r a c l e
R A C
實(shí)時(shí)同步本地災(zāi)備服務(wù)器,然后在實(shí)時(shí)同步到異地災(zāi)備中心;然后通過(guò) i 2 A v a il a b ili t y
高可用軟件實(shí)現(xiàn)對(duì)本地業(yè)務(wù)系統(tǒng)的異地容災(zāi),確保業(yè)務(wù)應(yīng)用系統(tǒng)發(fā)生故障時(shí),可以秒級(jí)進(jìn)行切換接管。
(4)
公檢法海量 NAS 文件異地災(zāi)備與數(shù)據(jù)庫(kù)雙活 場(chǎng)景特點(diǎn):機(jī)密性強(qiáng)、等保要求高;海量小文件,平臺(tái)異構(gòu)。
用戶需求:NAS 下海量小文件的災(zāi)備;本地或同城的系統(tǒng)容災(zāi)。
圖 6.1-6 公檢法海量 NAS 文件異地災(zāi)備與數(shù)據(jù)庫(kù)雙活
應(yīng)用實(shí)踐:在專網(wǎng)環(huán)境下的本地和異地?cái)?shù)據(jù)中心,通過(guò) i2NAS 海量文件同步軟件,將 NAS 存儲(chǔ)下的服務(wù)器變化的數(shù)據(jù),匯集到本地 i2NAS 服務(wù)器,然后定時(shí)或?qū)崟r(shí)將變化的數(shù)據(jù)同步到容災(zāi)中心;通過(guò) i 2 A v a il a b ili t y
實(shí)現(xiàn)對(duì)本地業(yè)務(wù)系統(tǒng)的容災(zāi)高可用,確保關(guān)鍵系統(tǒng)發(fā)生故障時(shí),異地容災(zāi)中心可快速接管應(yīng)用;通過(guò) i2Active 數(shù)據(jù)庫(kù)語(yǔ)義級(jí)的數(shù)據(jù)實(shí)時(shí)復(fù)制和同步軟件,將 Oracle RAC 實(shí)時(shí)同步到本地或異地容災(zāi)中心。
(5)
大數(shù)據(jù)管理局?jǐn)?shù)據(jù)庫(kù)容災(zāi)及
CDP
保護(hù)場(chǎng)景特點(diǎn):數(shù)據(jù)集中管理,非結(jié)構(gòu)化數(shù)據(jù)多 用戶需求:數(shù)據(jù)庫(kù)系統(tǒng)的容災(zāi)和數(shù)據(jù)備份;異構(gòu)數(shù)據(jù)庫(kù)在大數(shù)據(jù)平臺(tái)的數(shù)據(jù)流通;數(shù)據(jù)庫(kù)數(shù)據(jù)CDP 保護(hù)。
應(yīng)用實(shí)踐:在本地大數(shù)據(jù)中心,通過(guò) i2Active 將 Oracle RAC 同步到備端 Oracle 數(shù)據(jù)庫(kù)單機(jī)服務(wù)器,然后通過(guò) i2CDP 實(shí)現(xiàn)數(shù)據(jù)庫(kù)數(shù)據(jù)的持續(xù)保護(hù);針對(duì) Oracle、MySQL、SQL Sever 等數(shù)據(jù)庫(kù)到大數(shù)據(jù)平臺(tái)的應(yīng)用需求,可通過(guò) i 2 S t r e a m
數(shù)據(jù)流復(fù)制管理軟件,采用抽取、轉(zhuǎn)換、裝載的方式,實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫(kù)平臺(tái)之間數(shù)據(jù)的傳輸及數(shù)據(jù)到 Kudu、Hadoop 等大數(shù)據(jù)平臺(tái),打破數(shù)據(jù)孤島,i2NAS i2NAS 的
實(shí)現(xiàn)數(shù)據(jù)互聯(lián)互通。
6.1.4 典型用戶案例 圖 6.1-7 大數(shù)據(jù)管理局?jǐn)?shù)據(jù)庫(kù)容災(zāi)及 CDP 保護(hù)(1)某公安廳跨平臺(tái)異地容災(zāi) 項(xiàng)目亮點(diǎn):在硬件及虛擬化異構(gòu)的情況下,實(shí)現(xiàn)重要數(shù)據(jù)庫(kù)數(shù)據(jù)異地約 400 公里的跨平臺(tái)實(shí)時(shí)同步和容災(zāi),以及重要警務(wù)系統(tǒng)的高可用異地容災(zāi)和災(zāi)備服務(wù)器數(shù)據(jù)的實(shí)時(shí)同步備份。
項(xiàng)目需求:結(jié)合公安信息化發(fā)展現(xiàn)狀和實(shí)際需求,新疆公安廳計(jì)劃按照國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)頒布的相關(guān)等級(jí)保護(hù)要求,建立一個(gè)集中、統(tǒng)一、高效的異地災(zāi)備系統(tǒng),以提高公安廳重要信息系統(tǒng)和數(shù)據(jù)的安全等級(jí),實(shí)現(xiàn)異地容災(zāi)和數(shù)據(jù)庫(kù)的雙活。
圖 6.1-8 某公安廳跨平臺(tái)異地容災(zāi)架構(gòu)圖
Oracle
XML SQL CSV TXT JSON
Oracle RAC
i2CDP
i2COOPY
解決方案:
1.
在本地環(huán)境下,通過(guò) i2Active 實(shí)現(xiàn) Oracle RAC 到 Oracle 災(zāi)備數(shù)據(jù)庫(kù)的實(shí)時(shí)同步,然后再通過(guò) i2Active 實(shí)時(shí)同步到異地災(zāi)備中心; 2.本地虛擬化平臺(tái)搭建各類警務(wù)系統(tǒng),通過(guò) i 2 A v a il a b ili t y
高可用軟件對(duì)本地業(yè)務(wù)系統(tǒng)的異地容災(zāi),確保應(yīng)用系統(tǒng)發(fā)生故障時(shí),可以秒級(jí)進(jìn)行切換接管; 3.在本地的數(shù)據(jù)中心,通過(guò) i 2 C D P
實(shí)現(xiàn)各類警務(wù)系統(tǒng)的重要數(shù)據(jù),持續(xù)備份到本地的災(zāi)備服務(wù)器,然后通過(guò) i2COOPY 實(shí)時(shí)同步到異地災(zāi)備中心。
(2)遵義市住房公積金中心異地容災(zāi)與互為災(zāi)備 項(xiàng)目亮點(diǎn):確保了公積金中心核心業(yè)務(wù)系統(tǒng)、綜服管理系統(tǒng)、結(jié)算系統(tǒng)的應(yīng)用容災(zāi),以及海量非結(jié)構(gòu)化數(shù)據(jù)庫(kù)的數(shù)據(jù)同步備份、CDP 和文件保護(hù),構(gòu)建了遵義市公積金中心到鹽城市公積金中心的異地容災(zāi)模式,首創(chuàng)兩市公積金中心“互為災(zāi)備”的新模式,在確保重要數(shù)據(jù)異地備份、系統(tǒng)容災(zāi)的同時(shí),突破傳統(tǒng)異地容災(zāi)成本高、可用性低、數(shù)據(jù)備份窗口大等難題,是“互聯(lián)網(wǎng) + 政務(wù)服務(wù)” 的創(chuàng)新實(shí)踐。
項(xiàng)目需求:實(shí)現(xiàn)公積金中心核心業(yè)務(wù)系統(tǒng)、綜服管理系統(tǒng)、結(jié)算系統(tǒng)的異地容災(zāi),確保數(shù)據(jù)和業(yè)務(wù)的安全;同時(shí)通過(guò)互為災(zāi)備的模式,減少異地災(zāi)備中心的投入。
解決方案:
圖 6.1-9 遵義市住房公積金中心容災(zāi)架構(gòu)圖 1.在生產(chǎn)中心通過(guò)虛擬化技術(shù),將服務(wù)器資源分配給相應(yīng)業(yè)務(wù)系統(tǒng),然后通過(guò) i 2 A v a il a b ili t y字節(jié)級(jí)數(shù)據(jù)復(fù)制高可用軟件,應(yīng)用程序與災(zāi)備中心應(yīng)用服務(wù)器進(jìn)行一對(duì)一的應(yīng)用高可用容災(zāi);數(shù)據(jù)庫(kù)與災(zāi)備中心數(shù)據(jù)庫(kù)服務(wù)器 i 2 B o x-C
進(jìn)行一對(duì)一的應(yīng)用高可用容災(zāi);當(dāng)生產(chǎn)中心某臺(tái)虛擬機(jī)出現(xiàn)故障時(shí),災(zāi)備中心相應(yīng)的服務(wù)器可秒級(jí)接管,繼續(xù)對(duì)外提供服務(wù)。
2.
通過(guò)虛擬化技術(shù)將災(zāi)備數(shù)據(jù)庫(kù)服務(wù)器 i 2 B o x-C
針對(duì)生產(chǎn)中心 A I X
小型機(jī)系統(tǒng)下的核心業(yè)務(wù)數(shù)據(jù)庫(kù)進(jìn)行集群,通過(guò) i 2 A c t i ve
數(shù)據(jù)庫(kù)語(yǔ)義級(jí)同步軟件,將集群實(shí)時(shí)同步到災(zāi)備數(shù)據(jù)庫(kù)服務(wù)器 i 2 B o x-C
上,實(shí)現(xiàn)核心數(shù)據(jù)庫(kù)集群從 A I X
小型機(jī)到 X 86
服務(wù)器的高可用容災(zāi);最后業(yè)務(wù)系統(tǒng)通過(guò) i2A v ail ability
高可用軟件,在災(zāi)備數(shù)據(jù)庫(kù)服務(wù)器 i2Bo x-C
上實(shí)現(xiàn)一對(duì)一高可用容災(zāi)。
i2Box-C i2CDP
3.
針對(duì)生產(chǎn)中心 A I X
小型機(jī)上的應(yīng)用程序和憑證數(shù)據(jù),通過(guò) i 2 B a c k u p
備份到災(zāi)備 A I X
小型機(jī)應(yīng)用服務(wù)器上,確保重要應(yīng)用和數(shù)據(jù)的備份保護(hù)。
4.
通過(guò)內(nèi)嵌的 i 2 C D P
災(zāi)備一體機(jī) i 2 B o x D-A,對(duì)存儲(chǔ)了生產(chǎn)端重要數(shù)據(jù)庫(kù)的災(zāi)備中心數(shù)據(jù)庫(kù)服務(wù)器 i 2 B o x-C
進(jìn)行持續(xù)數(shù)據(jù)保護(hù),當(dāng)數(shù)據(jù)庫(kù)數(shù)據(jù)出現(xiàn)損壞、丟失、中病毒等情況時(shí),可以通過(guò) CDP 數(shù)據(jù)恢復(fù)到任意時(shí)間點(diǎn)的數(shù)據(jù)。
6.1.5 小結(jié) 電子政務(wù)系統(tǒng)是政務(wù)和群眾之間溝通的重要渠道,是提高政務(wù)辦公效率的重要工具,也是信息化社會(huì)發(fā)展的基礎(chǔ)。建設(shè)人民滿意的數(shù)字化服務(wù)型政府,離不開電子政務(wù)平臺(tái)提供的技術(shù)支撐,而保障電子政務(wù)應(yīng)用系統(tǒng)和數(shù)據(jù)的安全,離不開數(shù)據(jù)復(fù)制核心技術(shù)和容災(zāi)備份等產(chǎn)品方案。在政務(wù)云數(shù)據(jù)中心領(lǐng)域,適合云和大數(shù)據(jù)應(yīng)用場(chǎng)景的數(shù)據(jù)復(fù)制技術(shù),將幫助用戶解決各類應(yīng)用場(chǎng)景的災(zāi)備需求,滿足不同平臺(tái)、不同網(wǎng)絡(luò)層和不同等級(jí)保護(hù)的需求。
7.1 災(zāi)備市場(chǎng)概況 第七章 災(zāi)備市場(chǎng)與行業(yè)趨勢(shì) 2020 年受新冠疫情的影響,以餐飲、旅游和娛樂(lè)為代表的行業(yè),受到了嚴(yán)重的沖擊。上半年,全世界主要經(jīng)濟(jì)體的 GDP 更是遭到重創(chuàng)。但是我們也可以看到,機(jī)構(gòu)數(shù)字化轉(zhuǎn)型的速度并沒(méi)有受到太大的影響,反而在應(yīng)對(duì)疫情造成的社交困境時(shí),線上業(yè)務(wù)展示了非常強(qiáng)大的靈活性和韌性,這也極大地促進(jìn)了文件同步、數(shù)據(jù)流動(dòng)和業(yè)務(wù)連續(xù)性在安全合規(guī)方面的發(fā)展。
2020 年國(guó)際安全形勢(shì)也是推動(dòng)市場(chǎng)發(fā)展的原因之一,包括以國(guó)家安全為借口對(duì)業(yè)務(wù)合規(guī)性的審查,蓄意挑起地區(qū)沖突,利用網(wǎng)絡(luò)技術(shù)滲透攻擊機(jī)構(gòu)的重要系統(tǒng)和數(shù)據(jù),以及對(duì)關(guān)鍵技術(shù)和制造業(yè)資源的爭(zhēng)奪,都促使相關(guān)機(jī)構(gòu)加大對(duì)數(shù)據(jù)和業(yè)務(wù)安全的保護(hù)——將重要數(shù)據(jù)和系統(tǒng)進(jìn)行多重保護(hù),以備機(jī)系統(tǒng)構(gòu)被攻擊時(shí),可以有最新的數(shù)據(jù)進(jìn)行業(yè)務(wù)的恢復(fù)。譬如,以半導(dǎo)體芯片為例,一些機(jī)構(gòu)就加大了生產(chǎn)系統(tǒng)和業(yè)務(wù)數(shù)據(jù)的異地備份的保護(hù)力度。
從中國(guó)第三方災(zāi)備技術(shù)服務(wù)商的市場(chǎng)營(yíng)收分析,市場(chǎng)強(qiáng)勁的需求一直存在,但是第一季度因疫情采取的社交限制,確實(shí)給一線的銷售帶來(lái)挑戰(zhàn)。不過(guò)隨著疫情被控制,第二季度以后,銷售的拜訪及營(yíng)銷活動(dòng)走出 V 字型的反彈。
這表明中國(guó)災(zāi)備市場(chǎng)也具備強(qiáng)勁的發(fā)展韌性,而推動(dòng)市場(chǎng)需求發(fā)展的兩大因素:一個(gè)是中國(guó)經(jīng)濟(jì)的高速發(fā)展,市場(chǎng)主體充滿活力,特別是今年提出的“新基建”戰(zhàn)略,極大地提振了科技企業(yè)、資本和市場(chǎng)研究機(jī)構(gòu)的信心,繼續(xù)推動(dòng)企業(yè)的數(shù)字化轉(zhuǎn)型;一個(gè)是中國(guó)長(zhǎng)期堅(jiān)持的將信息安全納入國(guó)家安全戰(zhàn)略,并出臺(tái)了“網(wǎng)絡(luò)安全法”、“等保 2.0”、“數(shù)據(jù)安全(草案)”等一系列的法律,以國(guó)家實(shí)行網(wǎng)絡(luò)安全等級(jí)保護(hù)制度明文規(guī)定所有運(yùn)營(yíng)主體,需要對(duì)所轄的信息系統(tǒng)嚴(yán)格按照要求進(jìn)行保護(hù)。
7.1.1 市場(chǎng)高速增長(zhǎng) 各類研究機(jī)構(gòu)對(duì)中國(guó)災(zāi)備市場(chǎng)的增長(zhǎng)預(yù)估都非常樂(lè)觀。智研咨詢的報(bào)告顯示:中國(guó)災(zāi)備行業(yè)市場(chǎng)規(guī)模從 2010 年的 49.8 億元,增長(zhǎng)至 2018 年近180 億元的市場(chǎng)規(guī)模,預(yù)計(jì)至 2022 年中國(guó)災(zāi)備 行業(yè)市場(chǎng)規(guī)模可達(dá) 300 億元以上。
前瞻產(chǎn)業(yè)研究院的報(bào)告重點(diǎn)提到云災(zāi)備將成未來(lái)主流趨勢(shì),其中云災(zāi)備市場(chǎng)規(guī)模從 2013 年的億元快速增長(zhǎng)到 2018 年的 10 億元,預(yù)計(jì)到 2022 年我國(guó)云災(zāi)備市場(chǎng)規(guī)??蛇_(dá) 70 億元。
信息技術(shù)研究和分析機(jī)構(gòu) Gartner 預(yù)計(jì),到 2020 年存儲(chǔ)安全(尤其是云存儲(chǔ)安全)支出將繼續(xù)攀升。如今復(fù)雜的地緣政治環(huán)境將法規(guī)遵從性推到了企業(yè)的首要任務(wù),2019 年整體安全支出增長(zhǎng)10.5%,預(yù)計(jì)未來(lái) 5 年云安全將增長(zhǎng) 41.2%。同時(shí),Gartner 也預(yù)計(jì)到 2021 年,使用備份而非歸檔方式來(lái)管理企業(yè)長(zhǎng)期數(shù)據(jù)的比例將從 2017 的 30% 上升到 50%。
根據(jù)白皮書內(nèi)容編委的調(diào)查,在中國(guó)經(jīng)濟(jì)高速發(fā)展的三十多年中,特別是從 2010 年互聯(lián)網(wǎng)開始進(jìn)入高速發(fā)展階段,中國(guó)災(zāi)備產(chǎn)品和市場(chǎng)也得到大力發(fā)展,中國(guó)災(zāi)備市場(chǎng)頭部企業(yè)的融資金額也一輪比一輪高。災(zāi)備產(chǎn)品從傳統(tǒng)的存儲(chǔ)數(shù)據(jù)備份發(fā)展到物理機(jī)、虛擬機(jī)系統(tǒng)的備份和容災(zāi),數(shù)據(jù)庫(kù)同步和容災(zāi)也逐漸發(fā)展壯大,并成為災(zāi)備市場(chǎng)重要的應(yīng)用場(chǎng)景之一。根據(jù)公開的資料整理,2010 年
我國(guó)災(zāi)備行業(yè)市場(chǎng)規(guī)模約 49.8 億元,2015 年達(dá)到 136.8 億元,近幾年中國(guó)災(zāi)備市場(chǎng)規(guī)模大體情況
49.8 55.1 60.3 73.9 88.7
如下:
400
300
200
106.5 127.8 151.8
177.4 207.8
240.5
280.3
329.1
0 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022
圖 7-1 2010-2022 年中國(guó)災(zāi)備行業(yè)市場(chǎng)規(guī)模 國(guó)際災(zāi)備市場(chǎng)也同樣發(fā)展強(qiáng)勁,根據(jù) DataCore 發(fā)布的 2018 年度 SDS 白皮書《The State of Software-Defined Storage,Hyperconverged and Cloud Storage》內(nèi)容,有 20% 的用戶計(jì)劃將存儲(chǔ)預(yù)算的 25% 用在第二存儲(chǔ)(災(zāi)備)上。
G a r t n e r
公開的數(shù)據(jù)分析報(bào)告提到:
2016
年市場(chǎng)規(guī)模已達(dá) 20
億美金,預(yù)計(jì) 2021
年的市場(chǎng)規(guī)模將達(dá)到 37.3 億美元。
M ar ketsandM ar k ets的相關(guān)數(shù)據(jù)也顯示,全球備份和恢復(fù)市場(chǎng)總額將從 2017
年的 71.3
億美元上升到 2022 年的 115.9 億美元。相比備份與恢復(fù)市場(chǎng),云災(zāi)備即服務(wù)(DRaaS)全球市場(chǎng)呈現(xiàn)出快速增長(zhǎng)的態(tài)勢(shì)。
Gartner 的調(diào)研報(bào)告顯示,預(yù)計(jì) 2021 年的 DRaaS 市場(chǎng)規(guī)模將達(dá)到 37.3 億美元;到 2022 年全球云安全市場(chǎng)規(guī)模將達(dá)到近120 億美元;Gartner DRaaS 魔力象限中的 10 個(gè)國(guó)外玩家市值總和
超過(guò) 1000 億美金。
7.1.2 市場(chǎng)多元發(fā)展 災(zāi)備脫胎于傳統(tǒng)的存儲(chǔ)廠商——為了解決存儲(chǔ)冗余的問(wèn)題,用戶在尋找災(zāi)備方案時(shí),首先想到了存儲(chǔ)廠商,為此很多傳統(tǒng)存儲(chǔ)廠商,同時(shí)也是傳統(tǒng)災(zāi)備方案的提供商。但是,隨著整個(gè)信息技術(shù)產(chǎn)品的不斷迭代,災(zāi)備應(yīng)用場(chǎng)景也從同機(jī)房的本地備份容災(zāi),向同城、異地及云端等更宏大的場(chǎng)景延伸,用戶數(shù)量更大,產(chǎn)品也更加豐富。
從傳統(tǒng)的備份產(chǎn)品開始,災(zāi)備產(chǎn)品正在不斷拓展邊界,目前主要涵蓋了傳統(tǒng)的系統(tǒng)備份、容災(zāi)和恢復(fù);數(shù)據(jù)同步、分發(fā)、脫敏、副本管理;大數(shù)據(jù)管理和應(yīng)用;數(shù)據(jù)庫(kù)讀寫分離和容災(zāi);文件管理、共享和保護(hù)等。
災(zāi)備技術(shù)也從傳統(tǒng)的存儲(chǔ)復(fù)制技術(shù),延伸到基于主機(jī)操作系統(tǒng)、數(shù)據(jù)庫(kù)、文件和網(wǎng)絡(luò)等五大數(shù)
據(jù)復(fù)制技術(shù)。在中國(guó),基于上述五種數(shù)據(jù)復(fù)制技術(shù)的災(zāi)備企業(yè),每家企業(yè)的產(chǎn)品側(cè)重點(diǎn)不同,其中
于災(zāi) 有專注于傳統(tǒng)的備份廠商,有專注于虛擬機(jī)容災(zāi)的廠商,有專注于文件共享備份的廠商,有專注于數(shù)據(jù)復(fù)制副本管理的廠商,也有專注于數(shù)據(jù)庫(kù)容災(zāi)的廠商。英方軟件是國(guó)內(nèi)集多種復(fù)制技術(shù)于一體,核心技術(shù)自主研發(fā)的基礎(chǔ)軟件廠商,能夠提供全域、多層次、多策略、多副本數(shù)據(jù)管理的全棧解決方案。
7.2 未來(lái)五年(2021-2025)趨勢(shì) 7.2.1 信創(chuàng)推動(dòng)核心技術(shù)自主研發(fā) 信創(chuàng)在網(wǎng)上公開的定義是信息技術(shù)應(yīng)用創(chuàng)新產(chǎn)業(yè),信創(chuàng)涉及的行業(yè)包括IT 基礎(chǔ)設(shè)置:CPU 芯片、服務(wù)器、存儲(chǔ)、交換機(jī)、路由器、各種云和相關(guān)服務(wù)內(nèi)容;基礎(chǔ)軟件:數(shù)據(jù)庫(kù)、操作系統(tǒng)、中間件; 應(yīng)用軟件:OA、ERP、辦公軟件、政務(wù)應(yīng)用、流版簽軟件;信息安全:邊界安全產(chǎn)品(如網(wǎng)絡(luò))、終端安全產(chǎn)品(如災(zāi)備)等。
圖 7-2 信創(chuàng)概念圖 信創(chuàng)是一項(xiàng)國(guó)家戰(zhàn)略,是當(dāng)今形勢(shì)下國(guó)家經(jīng)濟(jì)發(fā)展的新動(dòng)能,發(fā)展信創(chuàng)是為了解決“卡脖子” 的安全問(wèn)題,即通過(guò)自主創(chuàng)新把核心技術(shù)變成我們自主可控、可發(fā)展、可生產(chǎn)的技術(shù)。信創(chuàng)產(chǎn)業(yè)發(fā)展可以助力關(guān)鍵企業(yè)突破卡脖子技術(shù),提升關(guān)鍵產(chǎn)業(yè)鏈的發(fā)展,促進(jìn)社會(huì)經(jīng)濟(jì)的數(shù)字化轉(zhuǎn)型,保障國(guó)家戰(zhàn)略安全。
信創(chuàng)產(chǎn)業(yè)從技術(shù)體系構(gòu)建,強(qiáng)化產(chǎn)業(yè)基礎(chǔ)研究,加強(qiáng)資金政策保障能力等方面著手,促進(jìn)信創(chuàng)產(chǎn)業(yè)在關(guān)鍵領(lǐng)域和重點(diǎn)地區(qū)的落地生根,并帶動(dòng)傳統(tǒng)信息技術(shù)產(chǎn)業(yè)的轉(zhuǎn)型,構(gòu)建自主可控的信息技術(shù)應(yīng)用產(chǎn)業(yè)集群。
災(zāi)備技術(shù)是為確保信息系統(tǒng)和數(shù)據(jù)安全的關(guān)鍵技術(shù),以核心的數(shù)據(jù)復(fù)制技術(shù)為基礎(chǔ),廣泛應(yīng)用備、數(shù)據(jù)保護(hù)、云數(shù)據(jù)管理等領(lǐng)域,幫助各類用戶打破數(shù)據(jù)孤島,實(shí)現(xiàn)數(shù)據(jù)互聯(lián)互通,助力數(shù) 字經(jīng)濟(jì)的發(fā)展。信創(chuàng)產(chǎn)業(yè)的發(fā)展,將極大推動(dòng)字節(jié)級(jí)復(fù)制、數(shù)據(jù)庫(kù)語(yǔ)義級(jí)復(fù)制、變長(zhǎng)塊等核心技術(shù)的自主研發(fā),實(shí)現(xiàn)數(shù)據(jù)復(fù)制卡脖子技術(shù)的不斷突破和創(chuàng)新應(yīng)用,為國(guó)防、金融、政務(wù)、醫(yī)療、電信、能源、交通等行業(yè)保駕護(hù)航。
英方作為基礎(chǔ)軟件企業(yè),在信創(chuàng)產(chǎn)業(yè)方面,擁有“卡脖子”技術(shù),并在創(chuàng)始團(tuán)隊(duì)的帶領(lǐng)下,不斷發(fā)揮自身在基礎(chǔ)軟件、技術(shù)創(chuàng)新、國(guó)產(chǎn)化生態(tài)體系等方面的優(yōu)勢(shì),與各個(gè)生態(tài)伙伴一起形成發(fā)展
合力,積極參與各地各行業(yè)的信創(chuàng)產(chǎn)業(yè)發(fā)展。
從創(chuàng)始之初,英方就積極布局國(guó)產(chǎn)化數(shù)據(jù)復(fù)制技術(shù),并聚焦核心數(shù)據(jù)復(fù)制技術(shù)的研發(fā)和推廣。截至目前,英方已掌握十多項(xiàng)先進(jìn)的核心發(fā)明專利,從字節(jié)級(jí)數(shù)據(jù)復(fù)制技術(shù),到數(shù)據(jù)庫(kù)語(yǔ)義級(jí)復(fù)制技術(shù),再到變長(zhǎng)塊級(jí)數(shù)據(jù)復(fù)制技術(shù),并以核心數(shù)據(jù)復(fù)制技術(shù)為基礎(chǔ),先后推出 i 2 A v a il a b ili t y
應(yīng)用高可用、i2Active 數(shù)據(jù)庫(kù)容災(zāi)、i2Stream 大數(shù)據(jù)同步、i2Distributor 數(shù)據(jù)分發(fā)、i2CDP 持續(xù)數(shù)據(jù)保護(hù)、i2CDM 數(shù)據(jù)副本管理等重磅產(chǎn)品,并在政務(wù)、國(guó)防、公檢法等行業(yè)獲得廣大用戶的高度認(rèn)可。
同時(shí),英方始終與國(guó)產(chǎn)軟硬件廠商保持互通,實(shí)現(xiàn)多方產(chǎn)品兼容適配,并持續(xù)跟進(jìn)其版本迭代和新產(chǎn)品的兼容情況,全面擴(kuò)展英方災(zāi)備軟件的適配性,構(gòu)建完善的災(zāi)備和數(shù)據(jù)復(fù)制生態(tài)體系。截至目前,英方災(zāi)備軟件已完成國(guó)內(nèi)主流云廠商(浪潮云、曙光云、華為鯤鵬云等)、芯片(如兆芯、龍芯中科、飛騰、華為鯤鵬等)、操作系統(tǒng)(中標(biāo)麒麟、普華、紅旗、華為 F u s i o n S p h e r e
等)、數(shù)據(jù)庫(kù)(山東瀚高、人大金倉(cāng)、達(dá)夢(mèng)、南大通用等)等重要國(guó)產(chǎn)化企業(yè)產(chǎn)品的兼容適配,拓展國(guó)產(chǎn)化生態(tài)戰(zhàn)略合作。
此外,英方在近幾年先后通過(guò)了國(guó)家信息安全產(chǎn)品認(rèn)證、涉密信息系統(tǒng)產(chǎn)品檢測(cè)認(rèn)證、信息安全管理體系認(rèn)證、公安部計(jì)算機(jī)信息系統(tǒng)安全專用產(chǎn)品認(rèn)證等,并成為全國(guó)信息安全標(biāo)準(zhǔn)化技術(shù)委員會(huì)成員、國(guó)際災(zāi)難恢復(fù)協(xié)會(huì)(DRI)指定服務(wù)商、災(zāi)備技術(shù)國(guó)家工程實(shí)驗(yàn)室合作單位、災(zāi)備技術(shù)產(chǎn)業(yè)聯(lián)盟會(huì)員單位、國(guó)家高新技術(shù)認(rèn)證企業(yè)等。
在地方信創(chuàng)產(chǎn)業(yè)布局以及各行業(yè)國(guó)產(chǎn)化進(jìn)程中,英方作為災(zāi)備國(guó)產(chǎn)化廠商,在政務(wù)云、大數(shù)據(jù)局、公檢法等領(lǐng)域的國(guó)產(chǎn)化產(chǎn)品替代方面發(fā)揮了重要的作用。如:成都政務(wù)云通過(guò)英方 i 2 M o ve在線熱遷移解決方案,在不影響全市政務(wù)服務(wù)的基礎(chǔ)下,實(shí)現(xiàn) 2000
多臺(tái)虛機(jī)從 V M w a r e
平臺(tái)到 KVM+OpenStack平臺(tái)上的遷移;南京棲霞區(qū)大數(shù)據(jù)管理局基于英方 i2CDP 和 i2Active 的災(zāi)備解 決方案,在實(shí)現(xiàn)數(shù)據(jù)庫(kù)間實(shí)時(shí)備份和連續(xù)數(shù)據(jù)保護(hù)的基礎(chǔ)上,大大降低了帶寬壓力、系統(tǒng)災(zāi)后恢復(fù)時(shí)間、后期運(yùn)維工作等;海南省交通警察總隊(duì)通過(guò) i2Active 實(shí)現(xiàn)全省各地分發(fā)庫(kù)的聯(lián)動(dòng),實(shí)現(xiàn)生產(chǎn) 庫(kù)讀寫壓力的分流,有效提升生產(chǎn)庫(kù)的性能。
作為災(zāi)備及數(shù)據(jù)管理領(lǐng)域的頭部企業(yè),英方不僅不斷加大數(shù)據(jù)復(fù)制核心技術(shù)的研發(fā)投入,確保災(zāi)備及數(shù)據(jù)管理領(lǐng)域的卡脖子技術(shù)自主可控,還積極參與高精尖信息化技術(shù)人才的培養(yǎng),以及各地、各行業(yè)和各生態(tài)伙伴的信創(chuàng)產(chǎn)業(yè)活動(dòng),在技術(shù)標(biāo)準(zhǔn)、人才培養(yǎng)、體系建設(shè)方面貢獻(xiàn)力量。
7.2.2 合規(guī)性仍是推動(dòng)行業(yè)發(fā)展主因 信息系統(tǒng)和數(shù)據(jù)安全的合規(guī)性,是指系統(tǒng)的運(yùn)營(yíng)主體或責(zé)任人要制定安全保障機(jī)制,通過(guò)網(wǎng)絡(luò)安全、容災(zāi)備份、物理安全等技術(shù)方案,實(shí)時(shí)保障系統(tǒng)和數(shù)據(jù)的安全,并符合國(guó)家等級(jí)保護(hù)要求和分級(jí)保護(hù)要求。
頻發(fā)的安全事件時(shí)刻挑動(dòng)信息系統(tǒng)運(yùn)維人員的敏感神經(jīng),從網(wǎng)上公開的資料顯示:
2020 年 2 月 23 日,微盟公司員工惡意破壞公司線上生產(chǎn)環(huán)境及數(shù)據(jù),導(dǎo)致系統(tǒng)服務(wù)不可用,給商家經(jīng)營(yíng)造成了嚴(yán)重的影響,并帶來(lái)了廣泛的社會(huì)輿論。根據(jù)各方預(yù)測(cè),此次微盟數(shù)據(jù)庫(kù)刪除的直接損失大約在 40 億元左右。在刪庫(kù)事件以后微盟集團(tuán)在港股連續(xù)大跌,三天內(nèi)市值跌逾 30 億港元。這是典型的內(nèi)部權(quán)限管理帶來(lái)的安全問(wèn)題,是建立內(nèi)部合規(guī)性管理機(jī)制要重點(diǎn)關(guān)注的范疇。
2020 年 8 月,由于 IT 失誤,全球會(huì)計(jì)巨頭畢馬威的 1.45 萬(wàn)個(gè)微軟 Teams 用戶的聊天記錄被
永久性刪除,且微軟確認(rèn)這些聊天數(shù)據(jù)不可恢復(fù)。這是典型的弱 IT 行業(yè)在應(yīng)對(duì)數(shù)據(jù)安全方面的反面教材,值得所有國(guó)家的公司提高警惕,并相應(yīng)改善數(shù)據(jù)安全的保護(hù)措施。
2020 年 8 月,Maze 黑客團(tuán)伙聲稱,通過(guò) Maze 勒索軟件攻入韓國(guó)半導(dǎo)體巨頭 SK 海力士。Maze 黑客團(tuán)伙官網(wǎng)的屏幕截圖顯示,有 5% 的 SK 海力士數(shù)據(jù)被泄露,并以此作為黑客成功入侵 SK 海力士的證據(jù)。這是典型的針對(duì)知名機(jī)構(gòu)發(fā)起的勒索病毒攻擊的違法行為,并且與傳統(tǒng)的勒索軟件加密文件系統(tǒng)相比,Maze 為勒索軟件找到更能攻擊受害者軟肋的方法,那就是先公開泄露竊 取的少數(shù)信息,如不繳納贖金,黑客們可能會(huì)公開所有的包括敏感信息在內(nèi)的數(shù)據(jù)。
綜上三個(gè)公開的案例信息,針對(duì)信息系統(tǒng)和數(shù)據(jù)安全的合規(guī)性保護(hù),仍將是信息技術(shù)行業(yè)不可回避的話題。中國(guó)在近年加大了包括系統(tǒng)等級(jí)保護(hù)、數(shù)據(jù)安全和個(gè)人隱私等領(lǐng)域的立法工作,并在政務(wù)、金融、醫(yī)療等行業(yè)取得顯著效果。譬如,政務(wù)云的兩地三中心建設(shè)過(guò)程中,信息系統(tǒng)應(yīng)用級(jí)容災(zāi)及數(shù)據(jù)多重備份,為信息化政務(wù)的業(yè)務(wù)連續(xù)性管理提供安全可靠的支撐,確保當(dāng)潛在的威脅事件發(fā)生時(shí),業(yè)務(wù)恢復(fù)的 RTO 和數(shù)據(jù)恢復(fù)的 RPO 能夠達(dá)到最小,將經(jīng)濟(jì)性損失和非經(jīng)濟(jì)性損失降到最低。
7.2.3 平臺(tái)化推進(jìn)災(zāi)備產(chǎn)業(yè)化發(fā)展 維持一個(gè)產(chǎn)業(yè)的可持續(xù)發(fā)展,需要構(gòu)建以政策、法律、資本、人才和技術(shù)產(chǎn)品等為核心的產(chǎn)業(yè)體系。作為合規(guī)性方面的重要終端安全產(chǎn)品的技術(shù)方案,災(zāi)備保護(hù)的系統(tǒng)和數(shù)據(jù)越來(lái)越復(fù)雜,大型組織機(jī)構(gòu)針對(duì)災(zāi)備產(chǎn)品的運(yùn)維開始力不從心:運(yùn)維人員要解決不同產(chǎn)品、不同系統(tǒng)、不同技術(shù)服務(wù)商在災(zāi)備方面的運(yùn)維難題,包括產(chǎn)品的操作習(xí)慣和不兼容、沒(méi)有統(tǒng)一的管理平臺(tái)、備份系統(tǒng)可用性驗(yàn)證人力化等。
如何解決上述問(wèn)題,災(zāi)備平臺(tái)化以及依托平臺(tái)進(jìn)行智能化運(yùn)維是一個(gè)可靠的方案。我們針對(duì)金融、醫(yī)療、政務(wù)和大型企業(yè)的深入調(diào)研分析發(fā)現(xiàn),實(shí)現(xiàn)災(zāi)備平臺(tái)化智能運(yùn)維,可能會(huì)集中在以下三個(gè)方面:
一是云災(zāi)備平臺(tái)化。云災(zāi)備包括了云平臺(tái)本身提供的基礎(chǔ)版的云備份和云容災(zāi)方案,通過(guò)分布式架構(gòu)劃分高可用區(qū),為租戶提供基于自身基礎(chǔ)架構(gòu)的云災(zāi)備服務(wù)。從傳統(tǒng)的災(zāi)備架構(gòu)分析,雖然可以通過(guò)不同云數(shù)據(jù)中心劃分高可用區(qū)向外出租,但是作為非主營(yíng)業(yè)務(wù),災(zāi)備產(chǎn)品投入的產(chǎn)出比,還是處于艱難維持的階段,更多是處于自身高可用方案的完整性和安全性做出的投入,發(fā)展動(dòng)力是不足的,并且相比于第三方技術(shù)方案商,同等投入情況下,云平臺(tái)在數(shù)據(jù)級(jí)災(zāi)備的 RPO 值更大。
另外一種更具靈活性的云災(zāi)備平臺(tái)方案,是云平臺(tái)聯(lián)合第三方技術(shù)方案商,云平臺(tái)可以彈性地提供各種云資源,技術(shù)方案商提供云災(zāi)備平臺(tái),包括涵蓋數(shù)據(jù)同步和系統(tǒng)遷移工具,跨平臺(tái)的容災(zāi)產(chǎn)品,定時(shí)或?qū)崟r(shí)備份和 CDP 保護(hù),用于災(zāi)備演練的獨(dú)立網(wǎng)絡(luò)等產(chǎn)品方案。此外,云災(zāi)備平臺(tái)也向更靈活的災(zāi)備即服務(wù)方向發(fā)展,例如英方軟件與運(yùn)營(yíng)商結(jié)合打造的 i 2 C l o u d
云平臺(tái),可以根據(jù)用戶的需求,不僅可以為每個(gè)租戶分配管理賬號(hào),個(gè)性化保護(hù)指定的業(yè)務(wù)系統(tǒng)和數(shù)據(jù),還可以通過(guò)設(shè) 置網(wǎng)絡(luò)帶寬大小和災(zāi)備時(shí)間靈活地使用災(zāi)備產(chǎn)品,做到與云計(jì)算一樣的按需使用和付費(fèi)。
二是 CDM 超融合數(shù)據(jù)管理平臺(tái)。災(zāi)備是數(shù)據(jù)復(fù)制技術(shù)典型的應(yīng)用場(chǎng)景之一,高效的數(shù)據(jù)復(fù)制能力帶來(lái)更廣闊的綜合應(yīng)用場(chǎng)景。為此,復(fù)制數(shù)據(jù)管理(C o p y
D a t a
M a n a g e m e n t,C D M)是近年快速發(fā)展起來(lái)的產(chǎn)品,作為備受 G a r t n e r
推崇的數(shù)據(jù)管理產(chǎn)品,C D M
將傳統(tǒng)的數(shù)據(jù)復(fù)制進(jìn)行融合,將分散的數(shù)據(jù)集中起來(lái),通過(guò)自動(dòng)化策略,對(duì)復(fù)制數(shù)據(jù)進(jìn)行集中管理,不僅可以助力企業(yè)加速
雙模式 IT 運(yùn)作的落地,同時(shí)可以改進(jìn)數(shù)據(jù)保護(hù)的性能,縮短應(yīng)用開發(fā)的周期,對(duì)業(yè)務(wù)產(chǎn)生直接價(jià)值。簡(jiǎn)單地講,CDM 為用戶解決了數(shù)據(jù)災(zāi)備的同時(shí),也可以為用戶提供用于測(cè)試、演練所需的真實(shí)的 業(yè)務(wù)數(shù)據(jù),直接提高了備份數(shù)據(jù)的附加值。
經(jīng)過(guò)近幾年的快速發(fā)展,CDM 產(chǎn)品逐漸成熟,并形成基于 CDM 的超融合數(shù)據(jù)管理平臺(tái)。以 i 2 C D M
超融合數(shù)據(jù)管理平臺(tái)為例,該平臺(tái)將數(shù)據(jù)管理的生命周期劃分為四個(gè)部分:生產(chǎn)環(huán)境異構(gòu)——從服務(wù)器到操作系統(tǒng)到數(shù)據(jù)庫(kù)到虛擬化平臺(tái)的異構(gòu);容災(zāi)環(huán)境——從字節(jié)級(jí)復(fù)制到數(shù)據(jù)庫(kù)語(yǔ)義級(jí)復(fù)制到塊變化實(shí)時(shí)復(fù)制技術(shù),整合現(xiàn)有的數(shù)據(jù)復(fù)制技術(shù),實(shí)現(xiàn)初始全量數(shù)據(jù) + 持續(xù)增量數(shù)據(jù)的復(fù)制;超融合數(shù)據(jù)管理平臺(tái)——提供單一黃金副本,然后虛克隆出多個(gè)任意數(shù)量、任意歷史時(shí)間、可讀可寫的虛擬副本,節(jié)省存儲(chǔ)資源;應(yīng)用場(chǎng)景——應(yīng)急恢復(fù)、數(shù)據(jù)遷移、開發(fā)測(cè)試、數(shù)據(jù)恢復(fù)、培訓(xùn)環(huán)境等。
三是統(tǒng)一數(shù)據(jù)管理平臺(tái)。災(zāi)備解決的是系統(tǒng)和數(shù)據(jù)的安全問(wèn)題,但是隨著數(shù)據(jù)量的不斷增加和數(shù)據(jù)價(jià)值進(jìn)一步被挖掘,用戶希望基于數(shù)據(jù)復(fù)制技術(shù)的災(zāi)備產(chǎn)品可以提供更多的功能,比如跨平臺(tái)跨區(qū)域的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)實(shí)時(shí)同步,跨異構(gòu)數(shù)據(jù)庫(kù)的數(shù)據(jù)同步和跨大數(shù)據(jù)平臺(tái)的數(shù)據(jù)流動(dòng)管理,打破數(shù)據(jù)孤島,實(shí)現(xiàn)數(shù)據(jù)的互聯(lián)互通,并最終為商業(yè)智能提供可快速利用的數(shù)據(jù)報(bào)表。
以證券行業(yè)為例,一個(gè)大型的證券機(jī)構(gòu),其各種業(yè)務(wù)和管理 IT 系統(tǒng)多大兩三百個(gè),這些系統(tǒng)每天新增的各種結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)多達(dá)幾個(gè) TB,且呈現(xiàn)加速之勢(shì)。這些數(shù)據(jù)包括客戶的賬戶數(shù)據(jù)、交易數(shù)據(jù)、產(chǎn)品與服務(wù)數(shù)據(jù)、市場(chǎng)相關(guān)的數(shù)據(jù)、風(fēng)控?cái)?shù)據(jù),以及機(jī)構(gòu)本身的管理數(shù)據(jù)和 IT 運(yùn)維數(shù)據(jù)等,通過(guò)統(tǒng)一數(shù)據(jù)管理平臺(tái)(如英方軟件 i 2 U P),可以為證券機(jī)構(gòu)提供全域多層次多策略的統(tǒng)一數(shù)據(jù)管理,滿足用戶各類數(shù)據(jù)實(shí)時(shí)同步、CDP(持續(xù)數(shù)據(jù)保護(hù))、各類數(shù)據(jù)庫(kù)實(shí)時(shí)同步、各類虛擬機(jī)保護(hù)、兩地三中心,異地容災(zāi)、多副本快速交付、多應(yīng)用數(shù)據(jù)全面統(tǒng)一管理等需求。
7.2.4 災(zāi)備人才和用戶群體持續(xù)增長(zhǎng) 經(jīng)過(guò)十幾年的發(fā)展,災(zāi)備技術(shù)從傳統(tǒng)的存儲(chǔ)分支(第二存儲(chǔ))獨(dú)立發(fā)展至今,逐漸形成了一大批專業(yè)的技術(shù)和營(yíng)銷人才。從技術(shù)人才構(gòu)成看,分為傳統(tǒng)型人才和新型技術(shù)人才。傳統(tǒng)人才主要以傳統(tǒng)的存儲(chǔ)容災(zāi)、數(shù)據(jù)庫(kù)容災(zāi)、IT 運(yùn)維等技術(shù)人員為主,他們擁有資深的行業(yè)背景,對(duì)用戶的 IT 運(yùn)維場(chǎng)景非常了解,能夠針對(duì)用戶的災(zāi)備需求,快速提供不同層次、不同策略的災(zāi)備解決方案,在傳統(tǒng)的本地災(zāi)備向云災(zāi)備過(guò)渡過(guò)程中,發(fā)揮了關(guān)鍵的作用。
新型人才以應(yīng)屆畢業(yè)生為主,同時(shí)隨著災(zāi)備行業(yè)的快速發(fā)展,也吸引了一批其他泛 IT 行業(yè)的人才的加入。他們普遍年輕化,擁有較高的文化水平,學(xué)習(xí)和接受新事物的能力更強(qiáng),以及擁有更多可以獲得專業(yè)知識(shí)的網(wǎng)絡(luò)渠道。他們的加入,給整個(gè)行業(yè)帶來(lái)了活力和創(chuàng)造力。他們欠缺的是行業(yè)經(jīng)驗(yàn)和知識(shí),為此,技術(shù)服務(wù)商提供的專業(yè)工程師認(rèn)證培訓(xùn)服務(wù),是提升這批新型人才專業(yè)技能非常好的平臺(tái)。例如像英方軟件舉辦的工程師認(rèn)證培訓(xùn)和 DRI 在中國(guó)舉辦的 CBCP、MBCP 認(rèn)證等,都為中國(guó)災(zāi)備行業(yè)培養(yǎng)了大量的專業(yè)技術(shù)和管理人才。
伴隨專業(yè)人才隊(duì)伍的擴(kuò)大,用戶群體也越來(lái)越龐大,他們之間以正相關(guān)的關(guān)系,螺旋式推動(dòng)災(zāi)備產(chǎn)業(yè)向上發(fā)展。目前,在政務(wù)、金融、醫(yī)療、教育、電信、能源、制造、交通等行業(yè),凡是涉及信息系統(tǒng)和數(shù)據(jù)安全合規(guī)的領(lǐng)域,都離不開等級(jí)保護(hù)和分級(jí)保護(hù)的建設(shè)需求。為此,災(zāi)備用戶是一個(gè)相當(dāng)大的群體,但是由于長(zhǎng)期由于人力成本的問(wèn)題,大部分機(jī)構(gòu)并沒(méi)有專職的災(zāi)備管理人員,更多是通過(guò)運(yùn)維人員兼職的形式,實(shí)現(xiàn)災(zāi)備項(xiàng)目的管理。但是從近幾年的信息系統(tǒng)安全事件可以發(fā)現(xiàn),專業(yè)性不夠是造成很多災(zāi)備用戶在發(fā)生安全事故時(shí),仍然造成數(shù)據(jù)丟失和業(yè)務(wù)停止的主要原因。未雨綢繆,防微杜漸,隨著數(shù)字化轉(zhuǎn)型的加速,所有機(jī)構(gòu)都應(yīng)該從人員思想和習(xí)慣上培養(yǎng)員工的安全防范意識(shí),做好相應(yīng)的管理權(quán)限分級(jí)工作,逐步完善企業(yè)災(zāi)備人才隊(duì)伍和機(jī)制體系的建設(shè)。對(duì)于重要的行業(yè)機(jī)構(gòu),更應(yīng)該將災(zāi)備工作提升到二把手工程或一把手工程,并最終實(shí)現(xiàn)災(zāi)備與數(shù)據(jù)管理應(yīng)用合二為一的目標(biāo)。
第二篇:災(zāi)備建設(shè)的四大誤區(qū)
災(zāi)備建設(shè)的四大誤區(qū)
來(lái)源:中國(guó)計(jì)算機(jī)報(bào)
2010年08月24日11:44 我來(lái)說(shuō)兩句(0)復(fù)制鏈接 打印
大中小
作者:郭濤
企業(yè)只要投巨資建設(shè)了災(zāi)備系統(tǒng),以后就不會(huì)再出現(xiàn)業(yè)務(wù)中斷和數(shù)據(jù)丟失了嗎?其實(shí),災(zāi)難備份/恢復(fù)與業(yè)務(wù)連續(xù)性有很大的差別,不能將兩者混為一談。“對(duì)災(zāi)備的錯(cuò)誤認(rèn)知是導(dǎo)致災(zāi)備建設(shè)失敗的重要原因?!盓MC公司資深業(yè)務(wù)連續(xù)性咨詢顧問(wèn)許瑀表示。
容災(zāi)不等于業(yè)務(wù)連續(xù)性
一些企業(yè)領(lǐng)導(dǎo)的固有思維是:容災(zāi)與業(yè)務(wù)連續(xù)性是一回事,只要擁有了災(zāi)備系統(tǒng),就不應(yīng)該再出現(xiàn)業(yè)務(wù)的停頓。其實(shí),災(zāi)難備份主要用于應(yīng)對(duì)較大的災(zāi)難事件,而不是針對(duì)局部的事故。業(yè)務(wù)連續(xù)性的概念更寬泛,無(wú)論是局部的故障,還是重大的災(zāi)難,都不能使業(yè)務(wù)中斷。
許瑀表示:“災(zāi)難備份是業(yè)務(wù)連續(xù)性的基礎(chǔ),是企業(yè)多層次信息保護(hù)體系的重要組成部分。為確保業(yè)務(wù)連續(xù)性,企業(yè)應(yīng)優(yōu)先考慮建設(shè)基本的災(zāi)難備份和恢復(fù)系統(tǒng)。在?9·11?災(zāi)難事件中,美國(guó)世貿(mào)中心里數(shù)百家沒(méi)有災(zāi)難備份系統(tǒng)的公司徹底消失了。這充分體現(xiàn)了災(zāi)難備份作為企業(yè)信息架構(gòu)基礎(chǔ)組成部分的重要性。在建立了完善的災(zāi)備系統(tǒng)后,企業(yè)可以考慮構(gòu)建多層次的信息保護(hù)體系,進(jìn)一步提升業(yè)務(wù)連續(xù)性水平?!?/p>
由于投入的資金數(shù)量不同,信息基礎(chǔ)設(shè)施的狀況不同,災(zāi)備建設(shè)的思路不同,不同行業(yè)的用戶在建設(shè)災(zāi)備系統(tǒng)時(shí),很難遵循一個(gè)統(tǒng)一的策略。不過(guò),企業(yè)在建設(shè)災(zāi)備系統(tǒng)時(shí)應(yīng)遵循這樣一個(gè)原則,即無(wú)論采用何種技術(shù)手段,都必須保證數(shù)據(jù)的安全。這是災(zāi)備建設(shè)的底線。
重異地災(zāi)備 輕本地保護(hù)
“實(shí)際上,導(dǎo)致信息系統(tǒng)出現(xiàn)中斷,97%的原因是物理設(shè)備故障和系統(tǒng)的邏輯錯(cuò)誤,只有3%的業(yè)務(wù)中斷是由大災(zāi)難引起的。”許瑀分析說(shuō),“本地?cái)?shù)據(jù)保護(hù)與異地災(zāi)難恢復(fù)都非常重要。有的用戶認(rèn)為,只要建設(shè)了異地災(zāi)難恢復(fù)系統(tǒng)就能抵御所有的災(zāi)難,因此忽視了本地的數(shù)據(jù)保護(hù)。這其實(shí)是一個(gè)誤區(qū)?!?/p>
許瑀舉例說(shuō):“某用戶的磁盤出現(xiàn)故障,由于換盤時(shí)的錯(cuò)誤操作導(dǎo)致了核心數(shù)據(jù)庫(kù)的損壞。該用戶利用本地備份系統(tǒng)恢復(fù)數(shù)據(jù),恢復(fù)時(shí)間長(zhǎng)達(dá)一周,而且丟失了兩天的數(shù)據(jù)?!庇杏脩裘つ孔非筮^(guò)高的異地災(zāi)難恢復(fù)RTO和RPO指標(biāo),要求RTO小于4小時(shí),RPO小于15分鐘。但事實(shí)上,該用戶在進(jìn)行本地?cái)?shù)據(jù)恢復(fù)時(shí),RTO大于1天,RPO為24小時(shí)。用戶投巨資建設(shè)災(zāi)備系統(tǒng),卻不能減少因本地故障帶來(lái)的損失,這其實(shí)是本末倒置。許瑀認(rèn)為,只有將信息系統(tǒng)的本地?cái)?shù)據(jù)保護(hù)和異地災(zāi)難恢復(fù)相結(jié)合,才能構(gòu)成完善的業(yè)務(wù)容災(zāi)體系。本地?cái)?shù)據(jù)保護(hù)與異地災(zāi)難恢復(fù)防范的風(fēng)險(xiǎn)不同,因此采用的技術(shù)手段、機(jī)制和措施也不一樣。有些需要面向公眾提供服務(wù)的系統(tǒng),對(duì)災(zāi)難恢復(fù)的時(shí)間要求十分嚴(yán)格。但是大多數(shù)信息系統(tǒng)對(duì)災(zāi)難恢復(fù)等級(jí)的要求并不太高,通??梢越邮軒仔r(shí)的災(zāi)難恢復(fù)時(shí)間。對(duì)于大多數(shù)用戶來(lái)說(shuō),最重要的不是恢復(fù)時(shí)間的長(zhǎng)短,而是數(shù)據(jù)能夠100%被恢復(fù)。
RTO、RPO指標(biāo)過(guò)高
在建設(shè)災(zāi)備系統(tǒng)的過(guò)程中,RTO和RPO是兩個(gè)非常重要的指標(biāo)。那么,RTO與RPO的數(shù)值是不是越小越好呢?“某銀行針對(duì)其網(wǎng)上支付業(yè)務(wù)建設(shè)災(zāi)備系統(tǒng)時(shí),提出系統(tǒng)恢復(fù)時(shí)間小于30分鐘(即RTO小于30分鐘),只能丟失5分鐘的數(shù)據(jù)(即RPO小于5分鐘)?!痹S瑀表示,“我看到用戶的RTO和RPO指標(biāo)要求時(shí),第一感覺(jué)就是這不現(xiàn)實(shí)。因?yàn)殂y行的系統(tǒng)出現(xiàn)故障后,為了恢復(fù)數(shù)據(jù),技術(shù)人員通常要根據(jù)日志對(duì)活動(dòng)賬號(hào)進(jìn)行分析,而所有的日志分散在多個(gè)業(yè)務(wù)系統(tǒng)中,處理這些日志可能要采用手工方式。完成上述一系列步驟,銀行至少要花費(fèi)一兩個(gè)小時(shí)的時(shí)間。”
企業(yè)在制定災(zāi)備恢復(fù)的目標(biāo)時(shí),一定要從業(yè)務(wù)的實(shí)際需求出發(fā),不能盲目追求過(guò)高的RTO、RPO指標(biāo)。過(guò)高的RTO和RPO指標(biāo)不僅會(huì)增加災(zāi)備建設(shè)的成本,而且會(huì)讓用戶迷失在數(shù)字游戲中,對(duì)業(yè)務(wù)的保護(hù)無(wú)益。
忽視日常的運(yùn)維管理
“2007年,某公司的核心業(yè)務(wù)系統(tǒng)發(fā)生意外宕機(jī),多個(gè)關(guān)鍵業(yè)務(wù)數(shù)據(jù)庫(kù)癱瘓。公司領(lǐng)導(dǎo)決定啟用同城災(zāi)備系統(tǒng)。但是在進(jìn)行恢復(fù)時(shí),技術(shù)人員發(fā)現(xiàn),容災(zāi)端數(shù)據(jù)嚴(yán)重滯后于生產(chǎn)端數(shù)據(jù),災(zāi)備系統(tǒng)根本無(wú)法啟用?!痹S瑀舉例說(shuō),“事后,人們?cè)谧凡樵驎r(shí)發(fā)現(xiàn),由于系統(tǒng)管理員在進(jìn)行災(zāi)備端測(cè)試時(shí)中斷了災(zāi)備數(shù)據(jù)的復(fù)制關(guān)系,測(cè)試完成后又忘記了恢復(fù)災(zāi)備數(shù)據(jù)的復(fù)制關(guān)系,從而導(dǎo)致災(zāi)備系統(tǒng)無(wú)法啟用?!?/p>
在某些企業(yè)中,災(zāi)備系統(tǒng)完全成了擺設(shè)。平時(shí),這些企業(yè)的技術(shù)人員不對(duì)災(zāi)備系統(tǒng)進(jìn)行定期檢查,而且忽視了災(zāi)備演練。因此當(dāng)災(zāi)難發(fā)生時(shí),災(zāi)備系統(tǒng)很難發(fā)揮作用。中金數(shù)據(jù)系統(tǒng)有限公司高級(jí)副總裁陳天晴告訴記者,他們?cè)?jīng)按照合同要求為某客戶提供災(zāi)備演練服務(wù),但是客戶的相關(guān)人員總以工作忙為由推脫,造成服務(wù)合同遲遲不能履行。許瑀表示:“企業(yè)在建成災(zāi)備系統(tǒng)后,應(yīng)該定期進(jìn)行災(zāi)備演練,并建立完善的業(yè)務(wù)連續(xù)性計(jì)劃(BCP),包括詳細(xì)的災(zāi)難恢復(fù)計(jì)劃及本地恢復(fù)計(jì)劃等。
(責(zé)任編輯:王亞紅)
第三篇:政府行業(yè)備份容災(zāi)解決方案
政府行業(yè)備份容災(zāi)解決方案
隨著政府信息化建設(shè)進(jìn)入高速發(fā)展白熱化階段,信息系統(tǒng)數(shù)據(jù)中心資源的整合和虛擬化正在不斷發(fā)展,各級(jí)政府信息化建設(shè)的步伐也明顯加快,政府電子政務(wù)建設(shè)已從服務(wù)上網(wǎng)向內(nèi)部系統(tǒng)建設(shè)轉(zhuǎn)型,這就要求政府必須建設(shè)一套安全易用的備份用在系統(tǒng)。信息系統(tǒng)備份容災(zāi)解決方案要求專業(yè),高效,安全,簡(jiǎn)單易用。中科同向?yàn)檎畔⑾到y(tǒng)建設(shè)建立的備份容災(zāi)解決方案屬于綠色型:高可用,節(jié)省成本,安全易操作,為政府協(xié)同辦公,建立友好信息環(huán)境。
政府行業(yè)信息系統(tǒng)表現(xiàn)出以下特點(diǎn):
1、數(shù)據(jù)復(fù)雜。政府網(wǎng)與電子政務(wù)網(wǎng)不但是高級(jí)政府單位建設(shè),基層也建設(shè)了完善的電子政府系統(tǒng),而且全國(guó)統(tǒng)一搭建平臺(tái),互通,實(shí)現(xiàn)了全國(guó)聯(lián)網(wǎng)統(tǒng)一。各部門單位數(shù)據(jù)中心統(tǒng)一存放,數(shù)據(jù)多樣性復(fù)雜性可想而知。
2、數(shù)據(jù)中心管理人員業(yè)務(wù)繁多。作為信息系統(tǒng)管理人員,需要了解各方面的信息業(yè)務(wù),包括操作知識(shí),操作技能,各方面業(yè)務(wù)需要精通。否則遇到信息災(zāi)害時(shí)會(huì)無(wú)力回天,造成不可估量的后果。這就要求到軟件的簡(jiǎn)單易用,管理人員易學(xué)易會(huì),維護(hù)簡(jiǎn)單。
3、新舊系統(tǒng)連接。我國(guó)電子政務(wù)起步較晚,作為之前的大量數(shù)據(jù)需要留檔。所以要求數(shù)據(jù)備份如何接洽之前的數(shù)據(jù)到存儲(chǔ)保護(hù)恢復(fù)系統(tǒng)是一大技術(shù)難題。以前的數(shù)據(jù)格式可能多種多樣,要求備份容災(zāi)軟件需要接納不同數(shù)據(jù)格式。
4、政府行業(yè)的特殊性。一些保密單位要求有保密級(jí)別,涉及到國(guó)家安全。數(shù)據(jù)的保護(hù)性要求更高,而且要求做到數(shù)據(jù)可以接管,做到應(yīng)用級(jí)容災(zāi)。中科同向的政府行業(yè)數(shù)據(jù)備份容災(zāi)解決方案。
數(shù)據(jù)備份軟件Heartsone Backup V8.0可以安裝在windows、Linux、Unix等不同操作系統(tǒng)上,實(shí)現(xiàn)了跨平臺(tái)安裝備份。傳輸及備份壓縮后精密算法(AES3DES)這就對(duì)數(shù)據(jù)的安全更增加了一層保護(hù),需要主管人員用密鑰打開壓縮數(shù)據(jù)包。對(duì)恢復(fù)數(shù)據(jù)點(diǎn)擊選擇要恢復(fù)的數(shù)據(jù),點(diǎn)擊確定即可。
高度的數(shù)據(jù)備份安全需要做數(shù)據(jù)持續(xù)保護(hù)CDP。CDP技術(shù)中科同向?qū)崿F(xiàn)了PTO=0,RPO=0,做到了零數(shù)據(jù)丟失,保證業(yè)務(wù)的連續(xù)性,在故障期間瞬間恢復(fù)數(shù)據(jù)。中科同向CDP數(shù)據(jù)保護(hù)采用了四步驟,被稱為“四金剛”。
企業(yè)應(yīng)用級(jí)容災(zāi)DR,對(duì)數(shù)據(jù)庫(kù)日志進(jìn)行抓取,分析,保持了同步數(shù)據(jù)備份容災(zāi)。對(duì)數(shù)據(jù)庫(kù)、文件、系統(tǒng)可以做到實(shí)時(shí)增量備份,可以設(shè)置不同的備份策略,實(shí)現(xiàn)了局域網(wǎng)和異地容災(zāi)。
在未來(lái)的政府信息發(fā)展中,數(shù)據(jù)已經(jīng)作為政府的關(guān)鍵性依據(jù),中科同向?qū)⒉粩嘣诩夹g(shù)上創(chuàng)新,和政府齊心協(xié)力,做好政府信息化建設(shè),在數(shù)據(jù)備份容災(zāi)方面永創(chuàng)第一!
第四篇:工商銀行上海數(shù)據(jù)中心災(zāi)備系統(tǒng)運(yùn)維實(shí)踐
工商銀行上海數(shù)據(jù)中心災(zāi)備系統(tǒng)運(yùn)維實(shí)踐
一、“兩地三中心”建設(shè)歷程
工商銀行于1999 年開啟了數(shù)據(jù)中心集約化建設(shè)的先河,在北京、上海分別建設(shè)兩大數(shù)據(jù)中心后,于2002年1 月在國(guó)內(nèi)同業(yè)率先啟動(dòng)了主機(jī)災(zāi)難備份工程。經(jīng)過(guò)多年的建設(shè)和持續(xù)投入,已經(jīng)實(shí)現(xiàn)了高等級(jí)的核心系統(tǒng)災(zāi)備體系建設(shè),完成了全行應(yīng)用分等級(jí)災(zāi)備體系建設(shè)。為進(jìn)一步提升信息系統(tǒng)災(zāi)難恢復(fù)能力,工商銀行啟動(dòng)了 “兩地三中心”工程建設(shè)。根據(jù)規(guī)劃,2014 年將在上海嘉定建立同城數(shù)據(jù)中心,與上海外高橋數(shù)據(jù)中心構(gòu)成同城雙中心,同城雙中心整體與北京異地災(zāi)備中心組成異地災(zāi)備模式(如圖1 所示)。
“兩地三中心”模式可以滿足不同災(zāi)難場(chǎng)景下的恢復(fù)要求,實(shí)現(xiàn)更靈活的風(fēng)險(xiǎn)應(yīng)對(duì)。在架構(gòu)布局上,上海同城雙中心具備基本相同的業(yè)務(wù)處理能力并通過(guò)高速鏈路進(jìn)行實(shí)時(shí)數(shù)據(jù)同步,兩個(gè)中心之間距離約55 千米,日常情況下可按主/ 備或雙活模式運(yùn)行。在發(fā)生區(qū)域級(jí)災(zāi)難某個(gè)中心失效時(shí),可在基本不丟失數(shù)據(jù)的情況下進(jìn)行雙中心間的應(yīng)急切換,保持業(yè)務(wù)連續(xù)運(yùn)行。北京異地災(zāi)備中心用于同城雙中心的災(zāi)難恢復(fù),當(dāng)出現(xiàn)因大范圍自然災(zāi)害等原因?qū)е峦请p中心同時(shí)失效時(shí),異地災(zāi)備中心可以用災(zāi)備系統(tǒng)接管全行核心業(yè)務(wù)。
二、“兩地三中心”技術(shù)手段和實(shí)施策略
工商銀行通過(guò)技術(shù)攻關(guān),完成了“兩地三中心”模式下的信息系統(tǒng)業(yè)務(wù)連續(xù)性架構(gòu)設(shè)計(jì)和方案研究,提出了可以提供多層級(jí)業(yè)務(wù)連續(xù)性保障水平的解決方案。信息系統(tǒng)可以給銀行業(yè)務(wù)應(yīng)用提供A/A、A/Q 和A/S 等多種部署模式,最終以業(yè)務(wù)影響分析結(jié)果作為應(yīng)用部署模式選型的決策依據(jù)。
在具體實(shí)施中,工商銀行堅(jiān)持“全面覆蓋基本保障能力、重點(diǎn)針對(duì)關(guān)鍵核心應(yīng)用部署高等級(jí)災(zāi)備保障技術(shù)”原則,做好資源分等級(jí)和差異化配置。如ATM、POS、柜面業(yè)務(wù)、資本市場(chǎng)等核心業(yè)務(wù)系統(tǒng)是銀行的關(guān)鍵應(yīng)用,與其相關(guān)的應(yīng)用系統(tǒng)就具有較高的業(yè)務(wù)連續(xù)性等級(jí)。自2010 年工程啟動(dòng)以來(lái),項(xiàng)目進(jìn)展情況良好,完成方案規(guī)劃設(shè)計(jì)和驗(yàn)證評(píng)審,在數(shù)據(jù)庫(kù)復(fù)制技術(shù)全面推廣、智能網(wǎng)管改造、55 千米磁盤同步鏡像等關(guān)鍵技術(shù)領(lǐng)域取得了突破;完成了核心主機(jī)并行系統(tǒng)投產(chǎn),即雙園區(qū)模擬同城雙活的試運(yùn)行,目前主機(jī)并行系統(tǒng)主要運(yùn)行可分離查詢交易,分流了部分核心生產(chǎn)系統(tǒng)的負(fù)載壓力;完成13 個(gè)開放平臺(tái)應(yīng)用服務(wù)器雙活改造,預(yù)計(jì)今年將完成近50 個(gè)開放平臺(tái)應(yīng)用的雙活改造。同時(shí),工商銀行積極探索“兩地三中心”運(yùn)行模式,按照“一體化管理”原則,初步制定了“兩地三中心”生產(chǎn)運(yùn)行管理方案,并對(duì)組織架構(gòu)和主要職能進(jìn)行了規(guī)劃。嘉定同城數(shù)據(jù)中心園區(qū)基建工程按計(jì)劃推進(jìn),于2011 年底奠基,2012年4 月開工,2012 年底8 萬(wàn)平方米基建工程結(jié)構(gòu)封頂,計(jì)劃今年底機(jī)房樓交付使用,2014 年嘉定同城數(shù)據(jù)中心園區(qū)建成啟用,實(shí)現(xiàn)“兩地三中心”的數(shù)據(jù)中心布局。
三、“兩地三中心”安全措施
1.建立全面、系統(tǒng)、可持續(xù)發(fā)展的信息安全管理體系
①以安全、穩(wěn)定、高效、追求卓越為安全方針建立具有工商銀行特色的ISO27001 信息安全管理體系。數(shù)據(jù)中心(上海)于2011 年通過(guò)了ISO27001:2005 信息安全管理體系認(rèn)證,實(shí)現(xiàn)在信息安全組織、資產(chǎn)管理、人員安全、物理和環(huán)境安全、通信及操作管理、訪問(wèn)控制等11個(gè)方面130 余個(gè)控制點(diǎn)的全方位的信息安全管理體系。同時(shí),建立起具有工商銀行特色的支撐跨地域統(tǒng)一管理的ISO27001信息安全管理體系,主要包括信息安全制度管理、安全生產(chǎn)與運(yùn)維管理、安全與防控技術(shù)管理、用戶與人員管理、綜合管理等五大方面共107 項(xiàng)精細(xì)化管理制度。
②建設(shè)信息安全組織體系確保信息安全管理有效開展。數(shù)據(jù)中心成立了信息安全領(lǐng)導(dǎo)小組,作為信息安全管理最高管理機(jī)構(gòu),確定信息安全方針、目標(biāo)和控制策略,明確信息安全的管理職責(zé)。信息安全領(lǐng)導(dǎo)小組定期或不定期召開聯(lián)席會(huì)議,分析信息安全形勢(shì),研究中心信息安全管理薄弱環(huán)節(jié)及應(yīng)對(duì)措施,貫徹落實(shí)監(jiān)管部門、上級(jí)機(jī)構(gòu)信息安全管理要求等。中心建立了縱、橫向聯(lián)系報(bào)告機(jī)制,及時(shí)掌握并報(bào)告本區(qū)域重大信息安全事件、案件線索或案件,提示風(fēng)險(xiǎn),有效防控風(fēng)險(xiǎn)。
③信息安全管理體系隨著工商銀行和中心自身的發(fā)展、內(nèi)外部安全形勢(shì)的不斷變化,與時(shí)俱進(jìn)持續(xù)改進(jìn)。主要措施包括:定期對(duì)人員、硬件、軟件、數(shù)據(jù)與文檔等各類重要資產(chǎn)所面臨的風(fēng)險(xiǎn)進(jìn)行評(píng)估,結(jié)合現(xiàn)有技術(shù)能力和管理成本,制定相關(guān)的補(bǔ)償控制措施;利用有效的技術(shù)平臺(tái),通過(guò)完整、系統(tǒng)、及時(shí)的問(wèn)題整改跟蹤管理,將內(nèi)外部審計(jì)檢查發(fā)現(xiàn)的問(wèn)題進(jìn)行分析匯總,在督促及時(shí)完成整改的同時(shí),不斷挖掘制度漏洞和流程缺陷,及時(shí)完善管理體系;主動(dòng)對(duì)生產(chǎn)故障事件、外部信息安全重大事件等進(jìn)行分析研究,深入剖析問(wèn)題發(fā)生和防控失效的深層次原因,進(jìn)一步細(xì)化制度執(zhí)行要求、強(qiáng)化技術(shù)硬控制、優(yōu)化生產(chǎn)運(yùn)維流程;積極與外部審計(jì)監(jiān)管單位、各行業(yè)先進(jìn)企業(yè)進(jìn)行溝通,主動(dòng)學(xué)習(xí)借鑒國(guó)際先進(jìn)標(biāo)準(zhǔn)和業(yè)界領(lǐng)先經(jīng)驗(yàn),不斷完善優(yōu)化中心的信息安全管理體系。
2.生產(chǎn)運(yùn)維安全措施多管齊下,確保生產(chǎn)穩(wěn)定運(yùn)行
①努力降低變更引發(fā)的安全生產(chǎn)問(wèn)題。變更前通過(guò)變更評(píng)審會(huì)和變更協(xié)調(diào)會(huì)對(duì)高風(fēng)險(xiǎn)度變更和跨多個(gè)部門的變更進(jìn)行評(píng)估和協(xié)調(diào);變更中嚴(yán)格按照雙人復(fù)核提交方式進(jìn)行變更操作;變更后及時(shí)開展技術(shù)和業(yè)務(wù)驗(yàn)證。根據(jù)應(yīng)用等級(jí)和對(duì)外服務(wù)時(shí)間嚴(yán)格控制變更窗口,嚴(yán)格控制緊急變更。將環(huán)境搭建和版本升級(jí)準(zhǔn)備等相關(guān)變更活動(dòng)限制在與生產(chǎn)環(huán)境隔離的區(qū)域,進(jìn)一步降低變更操作風(fēng)險(xiǎn)。
②持續(xù)完善應(yīng)急管理。制定完備的應(yīng)急和災(zāi)備演練計(jì)劃,開展層次豐富的各類演練,及時(shí)總結(jié)演練過(guò)程發(fā)現(xiàn)的問(wèn)題并加以改進(jìn),定期開展南北兩地互相遠(yuǎn)程接管演練等。
③ 建立了涵蓋主機(jī)、網(wǎng)絡(luò)、平臺(tái)、UPS、應(yīng)用、安全等各領(lǐng)域的集中監(jiān)控報(bào)警平臺(tái),統(tǒng)一了監(jiān)控報(bào)警事件的處理流程,使得各類報(bào)警能得以快速處理。
④ 定期對(duì)生產(chǎn)事件進(jìn)行總結(jié)分析,找到問(wèn)題根源和解決方案,避免事件的再次發(fā)生和深層次安全隱患。建立完善的事件溝通機(jī)制,通過(guò)每日、每周及不定期專項(xiàng)會(huì)議將相關(guān)事件發(fā)生原因、處理過(guò)程、改進(jìn)措施等進(jìn)行分析總結(jié),舉一反三防微杜漸。
⑤高度重視性能容量管理,建立了覆蓋操作系統(tǒng)、數(shù)據(jù)庫(kù)、中間件、網(wǎng)絡(luò)、存儲(chǔ)、動(dòng)力、應(yīng)用等領(lǐng)域的較為全面的性能容量指標(biāo)和監(jiān)控系統(tǒng)及指標(biāo)閾值和報(bào)警規(guī)則,并結(jié)合實(shí)際生產(chǎn)情況、版本變化定期進(jìn)行全面的指標(biāo)梳理。定期開展性能容量統(tǒng)計(jì)分析,根據(jù)分析結(jié)果進(jìn)行相應(yīng)擴(kuò)容、改造或資源回收。
⑥進(jìn)一步完善運(yùn)行操作管理,提高批量操作自動(dòng)化水平,減少人為干預(yù)。通過(guò)專業(yè)系統(tǒng)對(duì)操作步驟制定、修改、發(fā)布、執(zhí)行過(guò)程記錄等進(jìn)行信息化、流程化、自動(dòng)化管理。實(shí)現(xiàn)了管理嚴(yán)謹(jǐn)、操作有序的安全生產(chǎn)目標(biāo)。
⑦以“知其所需、最小授權(quán)、唯一鑒別、有效控制”為原則,進(jìn)行各類用戶權(quán)限的劃分和按需發(fā)放,通過(guò)細(xì)致的訪問(wèn)控制,降低操作類安全事件發(fā)生的可能性。
⑧進(jìn)行嚴(yán)格的網(wǎng)絡(luò)區(qū)域劃分,實(shí)現(xiàn)生產(chǎn)與外部網(wǎng)、生產(chǎn)與辦公網(wǎng)的隔離。在接入網(wǎng)和互聯(lián)網(wǎng)區(qū)域網(wǎng)絡(luò)邊界部署入侵檢測(cè)防護(hù)設(shè)備,實(shí)現(xiàn)對(duì)攻擊事件、DOS/DDOS 事件的檢測(cè)和防護(hù)。
⑨ 通過(guò)技術(shù)手段嚴(yán)格落實(shí)數(shù)據(jù)訪問(wèn)、數(shù)據(jù)變形、數(shù)據(jù)傳輸、數(shù)據(jù)恢復(fù)、數(shù)據(jù)清理、數(shù)據(jù)銷毀等數(shù)據(jù)管理各環(huán)節(jié)的安全管理要求。同時(shí)建立完善的客戶端安全技術(shù)防護(hù)體系,包括防病毒管理、系統(tǒng)補(bǔ)丁管理、軟硬件管理、外發(fā)郵件管理、互聯(lián)網(wǎng)訪問(wèn)管理、電子文件安全管理、信息泄漏防護(hù)管理、筆記本硬盤密碼保護(hù)管理等,實(shí)現(xiàn)客戶端的安全準(zhǔn)入控制和數(shù)據(jù)安全管理。
⑩通過(guò)日志集中和安全審計(jì)平臺(tái)建設(shè),對(duì)各類生產(chǎn)系統(tǒng)的人員操作、系統(tǒng)安全事件等進(jìn)行快速和全面審計(jì),及時(shí)發(fā)現(xiàn)和通報(bào)違規(guī)操作、惡意攻擊、高風(fēng)險(xiǎn)操作等現(xiàn)象。
四、未來(lái)發(fā)展規(guī)劃
未來(lái),工商銀行數(shù)據(jù)中心要努力實(shí)現(xiàn)生產(chǎn)運(yùn)行管理可控、可靠、可持續(xù)的目標(biāo)。可控,即對(duì)日常運(yùn)維和突發(fā)問(wèn)題可以主動(dòng)安排和快速把控;可靠,即能提供穩(wěn)定可靠運(yùn)作的基礎(chǔ)設(shè)施環(huán)境,確保全行信息系統(tǒng)運(yùn)行不因物理設(shè)備故障而中斷??沙掷m(xù),即在任何時(shí)候、任何情況下均不發(fā)生對(duì)外服務(wù)中斷。為此重點(diǎn)要做好以下幾方面工作。
一是樹立“安全生產(chǎn)第一”和“第一時(shí)間恢復(fù)生產(chǎn)”的指導(dǎo)思想,落實(shí)各項(xiàng)生產(chǎn)運(yùn)行管理措施。包括提升監(jiān)控的覆蓋率、準(zhǔn)確率和時(shí)效性;提升應(yīng)急管理效率,確保在應(yīng)急情況下,能夠立即切換,第一時(shí)間恢復(fù)生產(chǎn);提升生產(chǎn)一線發(fā)生事件的處置能力;提升變更管理和應(yīng)用版本投產(chǎn)管理質(zhì)量;提升健康檢查、性能容量分析水平,提前采取預(yù)防和改進(jìn)措施,切實(shí)降低重大生產(chǎn)事件發(fā)生概率;提升對(duì)境外機(jī)構(gòu)的生產(chǎn)運(yùn)行管理和服務(wù),強(qiáng)化中心針對(duì)分行管理的專業(yè)人員的配備,完善對(duì)分行生產(chǎn)系統(tǒng)的遠(yuǎn)程實(shí)時(shí)監(jiān)控能力,抓好分行機(jī)房動(dòng)力設(shè)施、網(wǎng)絡(luò)通信線路的改造升級(jí)等。
二是進(jìn)一步提升信息系統(tǒng)的高可用性和災(zāi)備能力。要積極推進(jìn)以數(shù)據(jù)零丟失和“本地雙活、異地災(zāi)備”為原則的“兩地三中心”建設(shè),高標(biāo)準(zhǔn)、高質(zhì)量建設(shè)上海同城中心;要積極推動(dòng)應(yīng)用系統(tǒng)災(zāi)備體系優(yōu)化,根據(jù)應(yīng)用災(zāi)備等級(jí)劃分的要求,加快推進(jìn)開放平臺(tái)應(yīng)用系統(tǒng)的災(zāi)備建設(shè),確保關(guān)鍵開放平臺(tái)應(yīng)用系統(tǒng)均具備異地災(zāi)備能力。
三是加強(qiáng)生產(chǎn)運(yùn)維的自動(dòng)化工具研發(fā)與投入,不斷提升操作、監(jiān)控、維護(hù)、資源配置的自動(dòng)化程度。推動(dòng)實(shí)現(xiàn)數(shù)據(jù)中心批量操作自動(dòng)化比例達(dá)到98% 以上;要全面建立覆蓋各應(yīng)用系統(tǒng)的“端到端”業(yè)務(wù)級(jí)監(jiān)控,推動(dòng)數(shù)據(jù)中心運(yùn)行維護(hù)和資源配置的自動(dòng)化,從而全面提升數(shù)據(jù)中心例行化工作的質(zhì)量和效率。
四是以風(fēng)險(xiǎn)管理為核心,建立覆蓋全流程的信息安全管理體系,不斷提升信息安全管理水平。通過(guò)風(fēng)險(xiǎn)評(píng)估的方法,建立、實(shí)施、運(yùn)行、監(jiān)視、評(píng)審、保持和改進(jìn)信息安全工作的流程與規(guī)范。
五是建立科學(xué)合理的人力資源配置和激勵(lì)機(jī)制,加快建設(shè)數(shù)據(jù)中心專業(yè)化人才隊(duì)伍。要合理配置人力資源,加強(qiáng)行業(yè)領(lǐng)軍人才和高級(jí)專業(yè)人才培養(yǎng),建立人才梯隊(duì),穩(wěn)定人才隊(duì)伍。
第五篇:IBM容災(zāi)白皮書
IBM的容災(zāi)白皮書 內(nèi)容簡(jiǎn)介
隨著時(shí)代的發(fā)展,人類對(duì)于災(zāi)難的防范意識(shí)和要求越來(lái)越高。災(zāi)難的概念范疇非常廣泛,本書針對(duì)于企業(yè)環(huán)境,對(duì)業(yè)界當(dāng)前討論的熱門話題--IT容災(zāi)系統(tǒng)的概念和實(shí)現(xiàn)方法及設(shè)計(jì)流程做了深入淺出的分析,并從多個(gè)層面介紹了相應(yīng)的解決方案。希望讀者通過(guò)本書可以加深對(duì)于容災(zāi)系統(tǒng)的理解,對(duì)設(shè)計(jì)出一個(gè)切實(shí)可行的容災(zāi)系統(tǒng)能夠有所幫助。
第一章 信息—企業(yè)的財(cái)富與麻煩
前言
1.1 IT大集中 - 把蛋都裝進(jìn)籃子里
1.2 容災(zāi)-覆巢之下,亦有完卵
第二章 容災(zāi)概述
2.1 概述
2.2 容災(zāi)的實(shí)質(zhì)是確保永不停頓的業(yè)務(wù)運(yùn)營(yíng)
2.3 容災(zāi)的IT實(shí)現(xiàn)
第三章容災(zāi)方案分析
3.1 業(yè)務(wù)連續(xù)性開發(fā)模式
3.2 七層災(zāi)難恢復(fù)解決方案
3.3 如何選擇最優(yōu)的災(zāi)難恢復(fù)方案
第四章 容災(zāi)系統(tǒng)的設(shè)計(jì)過(guò)程
4.1 災(zāi)難恢復(fù)計(jì)劃描述
4.2 災(zāi)難恢復(fù)計(jì)劃項(xiàng)目階段
4.3 數(shù)據(jù)收集和關(guān)鍵需求分析階段
4.4 風(fēng)險(xiǎn)分析階段
4.5 數(shù)據(jù)保護(hù)階段
4.6 恢復(fù)階段
4.7 測(cè)試和培訓(xùn)階段
4.8 維護(hù)和修改階段
4.9 選擇災(zāi)難恢復(fù)方案的步驟介紹
第五章 典型方案介紹
5.1 基于軟件的數(shù)據(jù)備份技術(shù)
5.2 HACMP高可靠性災(zāi)備方案
5.3 基于磁盤系統(tǒng)的PPRC數(shù)據(jù)級(jí)災(zāi)難備份解決方案
附錄A.容災(zāi)方案演示環(huán)境
6.1 基于磁盤系統(tǒng)的PPRC數(shù)據(jù)級(jí)災(zāi)難備份解決方案典型應(yīng)用環(huán)境
附錄B.術(shù)語(yǔ)
第一章 企業(yè)面臨的挑戰(zhàn)以及發(fā)展趨勢(shì)
1.1前言
1958年,Bill Gore 和他的太太 Vieve Gore在美國(guó)特拉華州Newark市,自己家里的地下室成立了Gore公司。1969年,Gore公司研制成功獨(dú)特的,具有防風(fēng)、防水、透氣功能的GORE-TEX面料并廣泛應(yīng)用于生產(chǎn)具有功能性、保護(hù)性和時(shí)尚感的服裝和鞋類產(chǎn)品。目前,Gore公司已成為一家在全球擁有6000多名員工、40多間加工廠的跨國(guó)公司,并在氟材料的技術(shù)研究和應(yīng)用領(lǐng)域始終占據(jù)世界領(lǐng)先地位。
對(duì)于Gore這樣的以研發(fā)新型材料作為企業(yè)動(dòng)力的公司而言,材料的研發(fā)過(guò)程記錄、研發(fā)歷史數(shù)據(jù)、研發(fā)結(jié)果數(shù)據(jù)是企業(yè)最可寶貴的財(cái)富。請(qǐng)假設(shè)這樣一種情況,如果這些數(shù)據(jù)在一次事故中全部丟失,Gore公司會(huì)蒙受多么大的損失?
1983年,當(dāng)個(gè)人電腦還處于萌芽期的時(shí)候,美國(guó)青年戴爾成立了自己的個(gè)人電腦公司,主要銷售IBM的舊電腦和自己組裝的品牌電腦。那是一個(gè)電腦群雄激烈廝殺的年代,當(dāng)行業(yè)的領(lǐng)導(dǎo)者們爭(zhēng)相以引人注目的技術(shù)推出計(jì)算機(jī)時(shí),戴爾注意到了平凡的供應(yīng)鏈。戴爾公司利用信息技術(shù)全面管理公司生產(chǎn)過(guò)程。通過(guò)互聯(lián)網(wǎng),戴爾公司和其上游的配件制造商能夠?qū)蛻舻亩▎窝杆俚刈龀龇磻?yīng):當(dāng)定單傳至戴爾的控制中心時(shí),控制中心把定單分解為一個(gè)個(gè)子任務(wù),并通過(guò)網(wǎng)絡(luò)分派給各獨(dú)立配件制造商進(jìn)行生產(chǎn)。各制造商按照戴爾的電子定單進(jìn)行生產(chǎn)組裝,并按照戴爾控制中心的時(shí)間表來(lái)供貨。戴爾所需要做的只是在成品車間完成組裝和系統(tǒng)測(cè)試,剩下的就是客戶服務(wù)中心的事情了。―經(jīng)過(guò)優(yōu)化后,戴爾供應(yīng)鏈每20秒鐘匯集一次定單‖,―平均庫(kù)存時(shí)間僅有7小時(shí)‖。雖然沒(méi)有傲視群雄的杰出技術(shù),現(xiàn)在的戴爾公司卻已成長(zhǎng)為一個(gè)年銷售額達(dá)410億美金的企業(yè)。
對(duì)戴爾公司來(lái)說(shuō),市場(chǎng)信息的獲取、物流信息的傳遞以及合作伙伴的信息交換,這些共同構(gòu)成了拉動(dòng)企業(yè)正常運(yùn)轉(zhuǎn)的信息鏈。如果有一天,一場(chǎng)意外的事故導(dǎo)致供應(yīng)鏈的崩裂,戴爾該如何面對(duì)客戶惱怒的面容和企業(yè)直線下滑的利潤(rùn)?
信息,作為企業(yè)寶貴的資源,其重要性已經(jīng)得到了人們的充分認(rèn)識(shí)。但是我們?cè)撊绾伪Wo(hù)這一資源?假設(shè)您就是某企業(yè)的一位高級(jí)管理人員,當(dāng)您的企業(yè)遭遇以下事故時(shí),您將如何去面對(duì): 1. 某一天,證券公司的交易數(shù)據(jù)因操作失誤而損壞; 2. 某一天,保險(xiǎn)公司的所有保單數(shù)據(jù)因電源故障而丟失;
3. 石油勘探公司辛苦一年獲取的地質(zhì)數(shù)據(jù)因人為的惡意操作而丟失; 4. 醫(yī)院保存的所有病歷因?yàn)榇艓У膿p壞而無(wú)法使用; ……
這樣的例子還有很多很多。那么這樣的事故所帶來(lái)的后果是什么?至少,很難想象這個(gè)不幸的企業(yè)還能毫發(fā)無(wú)損的健康生存。因?yàn)椋瑢?duì)于信息時(shí)代的企業(yè)而言,健全的信息往往是維持其運(yùn)轉(zhuǎn)所必須的基本條件。所以,如何保護(hù)企業(yè)的信息資源,如何使企業(yè)免遭信息災(zāi)難,已經(jīng)成為企業(yè)所必須考慮的沉重問(wèn)題。
1.2 IT大集中 - 把蛋都裝進(jìn)籃子里
在計(jì)算機(jī)應(yīng)用的早期,是大型主機(jī)一統(tǒng)天下的時(shí)代。這是一種高度集中的信息應(yīng)用模式。昂貴的計(jì)算機(jī)和同樣昂貴的存儲(chǔ)設(shè)備躲藏在幽深的機(jī)房里,客戶僅能依靠啞終端與主機(jī)進(jìn)行交互,以完成自己的工作。
隨著IT設(shè)備的降價(jià)和網(wǎng)絡(luò)技術(shù)的發(fā)展,客戶機(jī)/服務(wù)器體系結(jié)構(gòu)和瀏覽器/服務(wù)器體系結(jié)構(gòu)這樣的信息應(yīng)用模式應(yīng)運(yùn)而生。這兩種全新的信息應(yīng)用模式,降低了用戶進(jìn)入計(jì)算機(jī)應(yīng)用系統(tǒng)的門檻,推進(jìn)了計(jì)算機(jī)應(yīng)用在現(xiàn)代社會(huì)的全面普及,并產(chǎn)生了今天計(jì)算機(jī)應(yīng)用分布式存在和數(shù)據(jù)存儲(chǔ)分布式存在的局面。
合久必分,分久必合。隨著網(wǎng)絡(luò)速度的進(jìn)一步提高以及高速存儲(chǔ)設(shè)備的降價(jià),高速信息交換、大容量存儲(chǔ)等困擾IT人員多年的問(wèn)題基本得到了解決。同時(shí),過(guò)于分布的應(yīng)用和數(shù)據(jù)所導(dǎo)致的日益昂貴的維護(hù)和運(yùn)營(yíng)費(fèi)用,已經(jīng)給大型企業(yè)的發(fā)展帶來(lái)了束縛。于是,大集中的號(hào)角重新吹響。
目前,在銀行信息化領(lǐng)域,數(shù)據(jù)大集中已經(jīng)成了一個(gè)熱門的話題。在國(guó)內(nèi),中國(guó)工商銀行在2000年就前瞻性地啟動(dòng)了數(shù)據(jù)大集中工程,并在2002年完成了全部工程的建設(shè)?,F(xiàn)在,中國(guó)工商銀行已經(jīng)將分布在全國(guó)各地的四十多個(gè)數(shù)據(jù)中心整合為互相連接、互為備份的北京、上海兩大數(shù)據(jù)中心,建成了全行統(tǒng)一的計(jì)算機(jī)系統(tǒng)平臺(tái)。同時(shí),國(guó)內(nèi)的其它銀行和大型證券公司也紛紛迎頭趕上。大集中已經(jīng)成為包括銀行、證券、保險(xiǎn)等行業(yè)在內(nèi)的整個(gè)金融信息化發(fā)展的大趨勢(shì)。
鑒于信息資源對(duì)于企業(yè)的寶貴作用,我們不妨把它們比作一枚枚金蛋,而信息基礎(chǔ)設(shè)施就是用來(lái)裝這些金蛋的籃子。過(guò)去,不同的金蛋分布在不同地域的籃子里,而大集中所帶來(lái)的信息基礎(chǔ)設(shè)施整合則意味著我們將把越來(lái)越多的金蛋放進(jìn)同一個(gè)籃子。此刻,一個(gè)不得不考慮的問(wèn)題出現(xiàn)了:如果這個(gè)籃子翻了,怎么辦?覆巢之下,豈有完卵?
1.3 容災(zāi)-覆巢之下,亦有完卵
2001年9月11日,美國(guó)世貿(mào)中心雙子大廈遭受了誰(shuí)也無(wú)法預(yù)料的恐怖打擊。災(zāi)難發(fā)生前,約有350家企業(yè)在世貿(mào)大廈中工作。事故發(fā)生一年后,重返世貿(mào)大廈的企業(yè)變成了150家,有200家企業(yè)由于重要信息系統(tǒng)的破壞,關(guān)鍵數(shù)據(jù)的丟失而永遠(yuǎn)的關(guān)閉、消失了。其中的一家公司稱,自己要恢復(fù)到災(zāi)難前的狀態(tài)需要50年的時(shí)間。
2003年,當(dāng)AT&T無(wú)線試圖對(duì)Siebel客戶關(guān)系管理(CRM)軟件進(jìn)行升級(jí)的時(shí)候,原定一個(gè)周末就能完成的項(xiàng)目演變?yōu)橐粓?chǎng)歷時(shí)六個(gè)星期的災(zāi)難。這次CRM軟件的升級(jí)使AT&T無(wú)線損失了1億多美元,僅增加的用戶欠款、員工加班費(fèi)和承包商的傭金就高達(dá)7500萬(wàn)美元。此外,技術(shù)故障也導(dǎo)致該公司去年第四季度的新增用戶數(shù)急降82%。而其損失并不僅限于這些,AT&T無(wú)線對(duì)分析師發(fā)布警告稱:―2004年上半年的用戶退網(wǎng)率將進(jìn)一步增加?!? 2003年,國(guó)內(nèi)某電信運(yùn)營(yíng)商的計(jì)費(fèi)存儲(chǔ)系統(tǒng)僅發(fā)生了兩個(gè)小時(shí)的故障,就造成400多萬(wàn)元的損失。這些尚不包括對(duì)公司聲譽(yù)的影響所導(dǎo)致的無(wú)形資產(chǎn)流失。
這些災(zāi)難的發(fā)生或許是偶然而難以預(yù)料的,但是,對(duì)災(zāi)難的預(yù)防卻絕對(duì)不應(yīng)該是一個(gè)偶然的話題。
據(jù)IDC的統(tǒng)計(jì)數(shù)字表明,美國(guó)在2000年以前的10年間發(fā)生過(guò)災(zāi)難的公司中,有55%當(dāng)時(shí)倒閉。剩下的45%中,因?yàn)閿?shù)據(jù)丟失,有29%也在兩年之內(nèi)倒閉,生存下來(lái)的僅占16%。國(guó)際調(diào)查機(jī)構(gòu)Gartner Group的數(shù)據(jù)表明,在由于經(jīng)歷大型災(zāi)難而導(dǎo)致系統(tǒng)停運(yùn)的公司中,有2/5再也沒(méi)有恢復(fù)運(yùn)營(yíng),剩下的公司中也有1/3在兩年內(nèi)破產(chǎn)。
美國(guó)德克薩斯州大學(xué)的調(diào)查顯示:―只有6%的公司可以在數(shù)據(jù)丟失后生存下來(lái),43%的公司會(huì)徹底關(guān)門,51%的公司會(huì)在兩年之內(nèi)消失?!?/p>
另一份針對(duì)這一課題的研究報(bào)告也顯示:在災(zāi)難之后,如果無(wú)法在14天內(nèi)恢復(fù)信息作業(yè),有75%的公司業(yè)務(wù)會(huì)完全停頓,43%的公司再也無(wú)法重新開業(yè),20%的企業(yè)在兩年之內(nèi)被迫宣告破產(chǎn)。
美國(guó)明尼蘇達(dá)大學(xué)的研究也表明,在遭遇災(zāi)難的同時(shí)又沒(méi)有災(zāi)難恢復(fù)計(jì)劃的企業(yè)中,將有超過(guò)60%在兩到三年后退出市場(chǎng)。而隨著企業(yè)對(duì)數(shù)據(jù)處理依賴程度的遞增,此比例還有上升的趨勢(shì)。
災(zāi)難的發(fā)生對(duì)企業(yè)的打擊往往是致命的。但是,面對(duì)災(zāi)難,企業(yè)就真的不堪一擊嗎?
答案是否定的!
同樣是令人恐怖的―9.11‖,世貿(mào)大廈倒塌后,在世貿(mào)大廈租有25層的金融界巨頭摩根斯坦利公司最為世人所關(guān)注。但是事發(fā)幾個(gè)小時(shí)后,該公司宣布:全球營(yíng)業(yè)部可以在第二天照常工作。這都是因?yàn)樵摴窘⒌臄?shù)據(jù)備份和遠(yuǎn)程容災(zāi)系統(tǒng),它們保護(hù)了公司的重要數(shù)據(jù),在關(guān)鍵時(shí)刻挽救了摩根斯坦利,同時(shí)也在一定程度上挽救了全球的金融行業(yè)。
這一獨(dú)特的例子說(shuō)明了什么?它說(shuō)明擁有先知先覺(jué)的防范意識(shí)和充分的技術(shù)準(zhǔn)備,即使是在突如其來(lái)的覆巢之災(zāi)下,亦有完卵,亦有企業(yè)的一線生機(jī)。
因此,預(yù)防災(zāi)難的發(fā)生,充分考慮災(zāi)難發(fā)生后的快速恢復(fù)手段,成為現(xiàn)代企業(yè)的一門必修課。其實(shí),在這一問(wèn)題上,中國(guó)古代的智者早就提出了自己的觀點(diǎn):生于憂患,死于安樂(lè)。無(wú)論是對(duì)一個(gè)國(guó)家,還是一個(gè)企業(yè),都是如此。第二章 容災(zāi)概述
2.1 概述
常言道,―知己知彼,百戰(zhàn)不殆‖。要實(shí)現(xiàn)容災(zāi),首先要了解我們的―敵人‖- 災(zāi)難。那么,哪些事件可以定義為災(zāi)難呢?典型的災(zāi)難事件是自然災(zāi)難,如火災(zāi)、洪水、地震、颶風(fēng)、龍卷風(fēng)、臺(tái)風(fēng)等,還有其它如原先提供給業(yè)務(wù)運(yùn)營(yíng)所需的服務(wù)中斷,如設(shè)備故障、軟件錯(cuò)誤、電信網(wǎng)絡(luò)中斷和電力故障等等。此外,人為的因素往往也會(huì)釀成大禍,如操作員錯(cuò)誤、破壞、植入有害代碼和恐怖襲擊。現(xiàn)階段,由于我國(guó)很多行業(yè)正處在高速發(fā)展的階段,很多生產(chǎn)流程和制度仍不完善,加之缺乏經(jīng)驗(yàn),這方面的損失屢見不鮮。事實(shí)上,我國(guó)2003年遭遇的―非典‖,某種意義上也是災(zāi)難。對(duì)此,我們認(rèn)為需要做到兩點(diǎn):一是建立切實(shí)可行的應(yīng)急機(jī)制,這主要包含一套基于充分且清楚地將風(fēng)險(xiǎn)予以分類定義的業(yè)務(wù)持續(xù)計(jì)劃,二是在危機(jī)突然降臨時(shí),此計(jì)劃能被有效執(zhí)行。
對(duì)于IT系統(tǒng),除了上述的災(zāi)難之外,與系統(tǒng)相關(guān)的計(jì)劃外宕機(jī)也可視作災(zāi)難(見圖1)。
圖1.停機(jī)原因分析-北美
自―9.11‖之后,全球各企業(yè)均認(rèn)識(shí)到災(zāi)難防范保護(hù)的重要性。某些大型金融機(jī)構(gòu)之所以能夠在兩天內(nèi)恢復(fù)營(yíng)業(yè),其主要原因是它們不僅象一般公司那樣在內(nèi)部進(jìn)行數(shù)據(jù)備份,而且在數(shù)英里外的數(shù)據(jù)備份中心也保留著數(shù)據(jù)備份。這些備份都是通過(guò)數(shù)據(jù)備份軟件和數(shù)據(jù)復(fù)制軟件進(jìn)行的。采取了這種措施后,一旦工作現(xiàn)場(chǎng)發(fā)生意外,企業(yè)就可以立即使用另一套數(shù)據(jù)。華爾街的金融機(jī)構(gòu)重新對(duì)災(zāi)難恢復(fù)的步驟做了評(píng)估,并認(rèn)識(shí)到災(zāi)難恢復(fù)只是技術(shù)手段之一,它們開始強(qiáng)調(diào) Business Continuity“災(zāi)難”恢復(fù)。因?yàn)檫^(guò)去的“災(zāi)難”恢復(fù)計(jì)劃并沒(méi)有強(qiáng)調(diào)全局性及對(duì)整個(gè)市場(chǎng)的影響,而如何維持業(yè)務(wù)的連續(xù)運(yùn)作將成為企業(yè)運(yùn)營(yíng)風(fēng)險(xiǎn)評(píng)估中至關(guān)重要的一環(huán)。事實(shí)證明,只有對(duì)數(shù)據(jù)存儲(chǔ)備份制定完備、持續(xù)且可執(zhí)行的容災(zāi)計(jì)劃,特別是業(yè)務(wù)連續(xù)計(jì)劃,才能為人們提供萬(wàn)無(wú)一失的數(shù)據(jù)安全保護(hù)。
嚴(yán)格的說(shuō),容災(zāi)計(jì)劃包括一系列應(yīng)急計(jì)劃,如業(yè)務(wù)持續(xù)計(jì)劃(BCP-Business Continuity Plan),業(yè)務(wù)恢復(fù)計(jì)劃(ERP-Business Recovery Plan),運(yùn)行連續(xù)性計(jì)劃(COOP-Continuity of Operations Plan),事件響應(yīng)計(jì)劃(IRP-Incident Response Plan),場(chǎng)所緊急計(jì)劃(OEP-Occupant Emergency Plan),危機(jī)通信計(jì)劃(CCP-Crisis Communication Plan),災(zāi)難恢復(fù)計(jì)劃(DRP-Disaster Recovery Plan)等等。
業(yè)務(wù)持續(xù)計(jì)劃(BCP)它是一套用來(lái)降低組織的重要營(yíng)運(yùn)功能遭受未料的中斷風(fēng)險(xiǎn)的作業(yè)程序,它可能是人工的或系統(tǒng)自動(dòng)的。業(yè)務(wù)持續(xù)計(jì)劃是高層管理人員的首要職責(zé),因?yàn)樗麄儽晃斡诒Wo(hù)公司的資產(chǎn)及公司的生存。業(yè)務(wù)持續(xù)計(jì)劃的目的是使得一個(gè)組織及其信息系統(tǒng)在災(zāi)難事件發(fā)生時(shí)仍可以繼續(xù)運(yùn)作。為了能對(duì)災(zāi)難事件有適當(dāng)?shù)膶?duì)策,嚴(yán)密的計(jì)劃及相關(guān)資源的投入是必須的。
業(yè)務(wù)恢復(fù)計(jì)劃(BRP)它也叫業(yè)務(wù)繼續(xù)計(jì)劃,涉及緊急事件后對(duì)業(yè)務(wù)處理的恢復(fù),但與BCP不同,它在整個(gè)緊急事件或中斷過(guò)程中缺乏確保關(guān)鍵處理的連續(xù)性的規(guī)程。BRP的制定應(yīng)該與災(zāi)難恢復(fù)計(jì)劃及BCP進(jìn)行協(xié)調(diào)。BRP應(yīng)該附加在BCP之后。
操作連續(xù)性計(jì)劃(COOP)COOP 關(guān)注位于機(jī)構(gòu)(通常是總部單位)備用站點(diǎn)的關(guān)鍵功能以及這些功能在恢復(fù)到正常操作狀態(tài)之前最多30天的運(yùn)行。由于COOP涉及到總部級(jí)的問(wèn)題,它和BCP是互相獨(dú)立制定和執(zhí)行的。COOP的標(biāo)準(zhǔn)要素包括職權(quán)條款、連續(xù)性的順序和關(guān)鍵記錄和數(shù)據(jù)庫(kù)。由于COOP強(qiáng)調(diào)機(jī)構(gòu)在備用站點(diǎn)恢復(fù)運(yùn)行中的能力,所以該計(jì)劃通常不包括IT運(yùn)行方面的內(nèi)容。另外,它不涉及無(wú)需重新配置到備用站點(diǎn)的小型危害。但是COOP可以將BCP、BRP和災(zāi)難恢復(fù)計(jì)劃作為附錄。
危機(jī)通信計(jì)劃(CCP)機(jī)構(gòu)應(yīng)該在災(zāi)難之前做好其內(nèi)部和外部通信規(guī)程的準(zhǔn)備工作。危機(jī)通信計(jì)劃通常由負(fù)責(zé)公共聯(lián)絡(luò)的機(jī)構(gòu)制定。危機(jī)通信計(jì)劃規(guī)程應(yīng)該和所有其它計(jì)劃協(xié)調(diào),以確保只有受到批準(zhǔn)的內(nèi)容公之于眾,它應(yīng)該作為附錄包含在BCP中。通信計(jì)劃通常指定特定的人員作為在災(zāi)難反應(yīng)中回答公眾問(wèn)題的唯一發(fā)言人。它還可以包括向個(gè)人和公眾散發(fā)狀態(tài)報(bào)告的規(guī)程,例如記者招待會(huì)的模板。
計(jì)劃(IRP)事件響應(yīng)計(jì)劃建立了處理針對(duì)機(jī)構(gòu)的IT系統(tǒng)攻擊的規(guī)程。這些規(guī)程用來(lái)協(xié)助安全人員對(duì)有害的計(jì)算機(jī)事件進(jìn)行識(shí)別、消減并進(jìn)行恢復(fù),這些事件的例子包括:對(duì)系統(tǒng)或數(shù)據(jù)的非法訪問(wèn)、拒絕服務(wù)攻擊、或?qū)τ布④浖?shù)據(jù)的非法更改(如有害邏輯:病毒、蠕蟲或木馬等)。本計(jì)劃可以包含在BCP的附錄中。
災(zāi)難恢復(fù)計(jì)劃(DRP)正如其名字所表示的,DRP應(yīng)用于重大的、通常是災(zāi)難性的、造成長(zhǎng)時(shí)間無(wú)法對(duì)正常設(shè)施進(jìn)行訪問(wèn)的事件。通常,DRP指用于緊急事件后在備用站點(diǎn)恢復(fù)目標(biāo)系統(tǒng)、應(yīng)用或計(jì)算機(jī)設(shè)施運(yùn)行的IT計(jì)劃。DRP的范圍可能與IT應(yīng)急計(jì)劃重疊,但是DRP的范圍比較狹窄,它不涉及無(wú)需重新配置的小型危害。根據(jù)機(jī)構(gòu)的需要,可能會(huì)有多個(gè)DRP附加在BCP之后。
場(chǎng)所緊急計(jì)劃(OEP)OEP在可能對(duì)人員的安全健康、環(huán)境或財(cái)產(chǎn)構(gòu)成威脅的事件發(fā)生時(shí),為設(shè)施中的人員提供反應(yīng)規(guī)程。OEP在設(shè)施級(jí)別進(jìn)行制定,與特定的地理位置和建筑結(jié)構(gòu)有關(guān)。設(shè)施OEP可以附加在BCP之后,但是獨(dú)立執(zhí)行。
BCP關(guān)注在中斷期間和之后維持機(jī)構(gòu)的業(yè)務(wù)功能。業(yè)務(wù)功能的一個(gè)可能的例子是工資的支付處理或客戶的信息處理。BCP可以專門為某個(gè)特定的業(yè)務(wù)處理編寫也可以涉及到所有關(guān)鍵的業(yè)務(wù)處理。IT系統(tǒng)在BCP中被認(rèn)為是對(duì)于業(yè)務(wù)處理的支持。在某些情況下,BCP可能沒(méi)有涉及到對(duì)過(guò)程的長(zhǎng)期恢復(fù)并使其回到正常運(yùn)行狀態(tài),而只是包含過(guò)渡的業(yè)務(wù)連續(xù)性需求。災(zāi)難恢復(fù)計(jì)劃、業(yè)務(wù)繼續(xù)計(jì)劃和場(chǎng)所緊急計(jì)劃可以附加在BCP之后。在BCP中設(shè)定的職責(zé)和優(yōu)先順序應(yīng)該和其在操作連續(xù)性計(jì)劃(COOP)中的一致以消除可能的沖突。
按一般慣例,備用站點(diǎn)維持機(jī)構(gòu)(通常是總部)要支持長(zhǎng)達(dá)30天的運(yùn)行,直到整個(gè)系統(tǒng)恢復(fù)到正常狀態(tài),COOP正是為了達(dá)到這個(gè)要求而制定的。BCP涉及到在重大中斷期間和之后維持業(yè)務(wù)處理所需的業(yè)務(wù)功能和IT系統(tǒng)。BRP記錄了機(jī)構(gòu)在備用站點(diǎn)進(jìn)行業(yè)務(wù)處理的持續(xù)規(guī)程。與BCP不同,BRP不涉及在緊急事件期間對(duì)關(guān)鍵處理的連續(xù)性維持。DRP是指設(shè)計(jì)用于重大和通常是毀滅性災(zāi)難之后的目標(biāo)系統(tǒng)、應(yīng)用程序或計(jì)算機(jī)設(shè)施的恢復(fù),它是以IT為主的計(jì)劃。兩個(gè)計(jì)劃都提供了IT系統(tǒng)的恢復(fù)和繼續(xù)規(guī)程。由于包括了對(duì)無(wú)需重新部署到備用站點(diǎn)的小型中斷進(jìn)行系統(tǒng)恢復(fù)的規(guī)程,所以這類計(jì)劃比DRP的范圍更廣泛。計(jì)算機(jī)事件響應(yīng)計(jì)劃建立了使安全人員可以確定、防止和恢復(fù)針對(duì)機(jī)構(gòu)IT系統(tǒng)進(jìn)行的計(jì)算機(jī)攻擊的規(guī)程。OEP則提供了在人員的健康和安全以及環(huán)境或財(cái)產(chǎn)等受到威脅的緊急情況下,設(shè)施工作人員所遵循的指導(dǎo)方針。計(jì)劃的制定者之間必須進(jìn)行協(xié)調(diào)以確保各自的策略和規(guī)程能夠互為補(bǔ)充,必須將所有有關(guān)計(jì)劃、系統(tǒng)和處理的變化情況反饋給系統(tǒng)和相應(yīng)處理計(jì)劃的制定者。2.2 容災(zāi)的實(shí)質(zhì)是確保永不停頓的業(yè)務(wù)運(yùn)營(yíng)
讓我們來(lái)看一個(gè)真實(shí)的故事:
Fred Alger基金管理公司的總部設(shè)在世貿(mào)中心北樓的93層。在上個(gè)世紀(jì)90年代,F(xiàn)red Alger曾是美國(guó)業(yè)績(jī)最好的一家基金管理公司。它旗下的―光譜共同基金‖(Spectra mutual fund)的年均收益率曾達(dá)到讓人驚羨的29%。然而,公司2000年的業(yè)績(jī)大幅下滑,其前景不容樂(lè)觀。2001年9月11日上午發(fā)生恐怖襲擊后,該公司正在上班的35人全部遇難,老板David Alger也在其中,這對(duì)Fred Alger公司來(lái)說(shuō)無(wú)疑是滅頂之災(zāi)。
所幸的是,該公司居安思危,在繁榮期建設(shè)的IT系統(tǒng)早早就考慮到容災(zāi)的需要,在50英里以外的新澤西中心區(qū)建有一個(gè)數(shù)據(jù)備份點(diǎn)。―9?11‖過(guò)后的第三天,該公司幸存無(wú)幾的人在那里發(fā)現(xiàn),襲擊之前所有的交易記錄和所有的研究報(bào)告都有詳細(xì)備份,并被完好無(wú)損地保留了下來(lái)。
所以,F(xiàn)red Alger公司沒(méi)有選擇關(guān)張,而是決定重建。他們并非盲目地不認(rèn)輸。幾年前就已退休的Fred Alger,在弟弟David去世后立刻再度出山。當(dāng)整個(gè)市場(chǎng)在去年9月17日重新開市時(shí),F(xiàn)red Alger公司成了華爾街經(jīng)紀(jì)公司中的股票大買家。
此后,當(dāng)其他基金管理公司的業(yè)績(jī)?cè)谌ツ瓿霈F(xiàn)滑坡時(shí),他們的利潤(rùn)反而因此大大增加。很快,F(xiàn)red Alger公司的投資管理隊(duì)伍也空前興旺起來(lái),并在第五大道的2層樓建立了新的總部。類似的故事令全世界在一夜之間認(rèn)識(shí)到,金融市場(chǎng)的數(shù)據(jù)備份和交易備份絕對(duì)不能缺少。
自美國(guó)建國(guó)以來(lái),華爾街就一直主宰著美國(guó)的金融。而此次襲擊已經(jīng)給了華爾街以致命的一擊。事實(shí)上,對(duì)世貿(mào)中心的襲擊完全改變了紐約的金融景觀。以往,曼哈頓4/5寫字樓的底層都是金融服務(wù)機(jī)構(gòu)。而如今,這些金融機(jī)構(gòu)中的一半以上都遷走了,大多都換了個(gè)小地方。在曼哈頓中心區(qū)的5萬(wàn)名金融服務(wù)人員中,已有19000名離開了這個(gè)城市。其中也有像摩根斯坦利和高盛公司這樣的―金融巨人‖。
因此,即使在曼哈頓區(qū)還在燃燒時(shí),監(jiān)管者們已經(jīng)開始考慮,如何才能重振金融業(yè),并讓它強(qiáng)大到足以抵御下一次災(zāi)難。在銀行家和監(jiān)管者們看來(lái),―9?11‖并不能被稱為信用事件。但下一次災(zāi)難,不論是什么樣的災(zāi)難,它一定會(huì)是一場(chǎng)信用事件。在龐大的支付鏈條上,一旦某個(gè)具有實(shí)力的環(huán)節(jié)受到支付困難的威脅,整個(gè)市場(chǎng),如外匯交易或美國(guó)財(cái)政債券交易就有可能出現(xiàn)大塞車。
為此,英國(guó)的金融服務(wù)管理局在一個(gè)儲(chǔ)存有備份數(shù)據(jù)的秘密地點(diǎn),進(jìn)行了多次―業(yè)務(wù)持續(xù)‖演習(xí)。美國(guó)的監(jiān)管者也拋出一份建議書。這份建議書的目的在于,要保持市場(chǎng)參與者之間實(shí)時(shí)的信息和通信聯(lián)系,即保持?jǐn)?shù)據(jù)備份點(diǎn)之間的通信聯(lián)系。監(jiān)管者和市場(chǎng)應(yīng)該能夠抵御住沉重的打擊,并應(yīng)在4小時(shí)以內(nèi)恢復(fù)工作。而對(duì)那些由15~20家大銀行和5~10家證券公司所組成的金融主干系統(tǒng)來(lái)說(shuō),在它們主要參與的市場(chǎng)中應(yīng)享受優(yōu)先權(quán),須在一天之內(nèi)恢復(fù)營(yíng)業(yè)。
在―9311‖以前,銀行之間(包括獨(dú)立的通信和信息技術(shù)系統(tǒng)之間)的應(yīng)急計(jì)劃很少有彼此的溝通。為此,設(shè)在巴塞爾的發(fā)達(dá)國(guó)家10國(guó) ―金融穩(wěn)定性論壇‖,已經(jīng)起草了一個(gè)―應(yīng)急協(xié)議名單‖。被列入這一名單的,都是些全球最重要的金融實(shí)體。根據(jù)這個(gè)協(xié)議,名單中的金融實(shí)體的監(jiān)管方可以在任何情況下及時(shí)取得聯(lián)系。
此外,美國(guó)監(jiān)管機(jī)構(gòu)已經(jīng)提出,要持續(xù)不斷地進(jìn)行應(yīng)急計(jì)劃測(cè)試,以對(duì)付―一切可以想象得出的事件‖。例如,進(jìn)行產(chǎn)業(yè)范圍的戰(zhàn)爭(zhēng)預(yù)演已經(jīng)提到議事日程,而―無(wú)線戰(zhàn)爭(zhēng)‖被最先納入其中。
那么,如何確保企業(yè)業(yè)務(wù)的連續(xù)運(yùn)營(yíng)以及數(shù)據(jù)的安全呢?嚴(yán)格的說(shuō),業(yè)務(wù)持續(xù)計(jì)劃的建立和實(shí)施過(guò)程,實(shí)際上是進(jìn)行一個(gè)涉及企業(yè)運(yùn)營(yíng)的項(xiàng)目,因此也涉及到項(xiàng)目管理的方方面面。標(biāo)準(zhǔn)的業(yè)務(wù)持續(xù)計(jì)劃項(xiàng)目應(yīng)按如下流程進(jìn)行: 1。項(xiàng)目啟動(dòng)和管理
確定業(yè)務(wù)持續(xù)計(jì)劃(BCP)實(shí)施過(guò)程的相關(guān)需求,包括獲得管理支持、以及組織和管理項(xiàng)目使其符合時(shí)間和預(yù)算的限制要求。2。風(fēng)險(xiǎn)評(píng)估和控制
確定可能造成機(jī)構(gòu)及其設(shè)施中斷的災(zāi)難、具有負(fù)面影響的事件和周邊環(huán)境因素,以及事件可能造成的損失、防止或減少潛在損失影響的控制措施,提供成本效益分析以調(diào)整控制措施方面的投資,達(dá)到消減風(fēng)險(xiǎn)的目的。同時(shí),由于風(fēng)險(xiǎn)會(huì)隨著系統(tǒng)的發(fā)展而變化,所以風(fēng)險(xiǎn)管理過(guò)程也必須是動(dòng)態(tài)的。
3。業(yè)務(wù)影響分析
確定由于中斷和預(yù)期災(zāi)難可能對(duì)機(jī)構(gòu)造成的影響,以及用來(lái)定量和定性分析這種影響的技術(shù)。確定關(guān)鍵功能、恢復(fù)優(yōu)先順序和相關(guān)性以便確定恢復(fù)時(shí)間。4。制定業(yè)務(wù)連續(xù)性策略
確定和指導(dǎo)備用業(yè)務(wù)恢復(fù)運(yùn)行策略的選擇,以便在恢復(fù)時(shí)間目標(biāo)范圍內(nèi)恢復(fù)業(yè)務(wù)和信息技術(shù),并維持機(jī)構(gòu)的關(guān)鍵功能。5。應(yīng)急響應(yīng)和運(yùn)作
制定和實(shí)施用于事件響應(yīng)以及對(duì)事件所引起狀況進(jìn)行穩(wěn)定的規(guī)程,包括建立和管理緊急事件運(yùn)作中心,該中心用于在緊急事件中發(fā)布命令。6。制定和實(shí)施業(yè)務(wù)連續(xù)性計(jì)劃
設(shè)計(jì)、制定和實(shí)施業(yè)務(wù)連續(xù)性計(jì)劃,以便在恢復(fù)時(shí)間目標(biāo)范圍內(nèi)完成恢復(fù)。7。意識(shí)培養(yǎng)和培訓(xùn)項(xiàng)目
準(zhǔn)備建立對(duì)機(jī)構(gòu)人員進(jìn)行意識(shí)培養(yǎng)和技能培訓(xùn)的項(xiàng)目,以便業(yè)務(wù)連續(xù)性計(jì)劃能夠得到制定、實(shí)施、維護(hù)和執(zhí)行。
8。維護(hù)和演練業(yè)務(wù)連續(xù)性計(jì)劃
對(duì)預(yù)先計(jì)劃和計(jì)劃間的協(xié)調(diào)性進(jìn)行演練、并評(píng)估和記錄計(jì)劃演練的結(jié)果。制定維持連續(xù)性能力和BCP文檔更新狀態(tài)的方法,使其與機(jī)構(gòu)的策略方向保持一致。通過(guò)與適當(dāng)標(biāo)準(zhǔn)的比較來(lái)驗(yàn)證BCP的效率,并使用簡(jiǎn)明的語(yǔ)言報(bào)告驗(yàn)證的結(jié)果。9。公共關(guān)系和危機(jī)通信
制定、協(xié)調(diào)、評(píng)價(jià)和演練在危機(jī)情況下與媒體交流的計(jì)劃;制定、協(xié)調(diào)、評(píng)價(jià)和演練與員工及其家庭、主要客戶、關(guān)鍵供應(yīng)商、業(yè)主/股東以及機(jī)構(gòu)管理層進(jìn)行溝通和在必要情況下提供心理輔導(dǎo)的計(jì)劃,確保所有利益群體能夠得到所需的信息。10。與公共當(dāng)局的協(xié)調(diào)
建立適用的規(guī)程和策略,用于同地方當(dāng)局協(xié)調(diào)響應(yīng)、連續(xù)性和恢復(fù)活動(dòng),以確保符合現(xiàn)行的法令和法規(guī)。
當(dāng)然,實(shí)際應(yīng)用中,如果受時(shí)間、成本等因素的限制,加之容災(zāi)目標(biāo)有限(企業(yè)不需要承擔(dān)應(yīng)由政府負(fù)責(zé)的國(guó)計(jì)民生之重任),我們可以簡(jiǎn)化并適當(dāng)改變上述標(biāo)準(zhǔn)流程。事實(shí)上,隨著IT系統(tǒng)在企業(yè)內(nèi)部應(yīng)用的深入,IT系統(tǒng)更容易受到各種災(zāi)難的傷害而導(dǎo)致中斷,特別是在許多情況下,關(guān)鍵資源可能屬于不可控范圍(如電力和電信)。對(duì)于倚仗IT系統(tǒng)的企業(yè)來(lái)說(shuō),從確保業(yè)務(wù)連續(xù)能力的角度出發(fā),可以依據(jù)下列容災(zāi)規(guī)劃步驟:
1. 災(zāi)難類型分析 2. 業(yè)務(wù)沖擊分析
3. 當(dāng)前業(yè)務(wù)環(huán)境及恢復(fù)能力分析 4. 容災(zāi)策略制訂 5. 容災(zāi)方案設(shè)計(jì) 6. 業(yè)務(wù)連續(xù)性流程設(shè)計(jì)
7. 業(yè)務(wù)連續(xù)性流程及容災(zāi)方案管理和測(cè)試
每一個(gè)步驟的相關(guān)職責(zé)一般會(huì)落在―計(jì)劃協(xié)調(diào)人‖或―應(yīng)急計(jì)劃制訂人‖的身上,他們通常是職能或資源部門的經(jīng)理。協(xié)調(diào)人在其他相關(guān)系統(tǒng)或業(yè)務(wù)處理部門的職能經(jīng)理和資源經(jīng)理的協(xié)助下制定應(yīng)急策略;應(yīng)急計(jì)劃協(xié)調(diào)人通常管理應(yīng)急計(jì)劃的制定和執(zhí)行。
2.3容災(zāi)的IT實(shí)現(xiàn)
除了詳盡的容災(zāi)計(jì)劃,實(shí)際上還需要合理的IT系統(tǒng)架構(gòu)來(lái)確保企業(yè)的容災(zāi)計(jì)劃得以實(shí)現(xiàn)。對(duì)于IT系統(tǒng)而言,在技術(shù)層面上,容災(zāi)需要考慮:
* 數(shù)據(jù)版本保護(hù) - 建立容災(zāi)的多版本保護(hù)底線(Bottom Line)* 實(shí)時(shí)數(shù)據(jù)保護(hù) - 數(shù)據(jù)復(fù)制,近乎0的數(shù)據(jù)丟失,數(shù)據(jù)一致性
* 應(yīng)用系統(tǒng)恢復(fù) - 恢復(fù)時(shí)間(包括數(shù)據(jù)庫(kù)恢復(fù))、應(yīng)用版本的一致性(PTF)等 * 網(wǎng)絡(luò)系統(tǒng)恢復(fù) - 數(shù)據(jù)訪問(wèn)點(diǎn)變化、建立新網(wǎng)絡(luò)路徑、動(dòng)態(tài)路由(收斂時(shí)間/穩(wěn)定性)* 容災(zāi)切換決策 - 及時(shí)發(fā)現(xiàn)災(zāi)難(容災(zāi)系統(tǒng)管理)、容災(zāi)切換的損失和補(bǔ)救辦法 * 容災(zāi)切換過(guò)程 - 變更管理
同時(shí),無(wú)論任何時(shí)候,備份都是非常重要的,并要定期測(cè)試備份的可靠性。一種技術(shù)只能減少或防止某些類型的災(zāi)難的影響。除了簡(jiǎn)單或一成不變的應(yīng)用,在沒(méi)有特別要求的情況下,盡量不要采用操作系統(tǒng)層面以上的數(shù)據(jù)復(fù)制技術(shù)。而沒(méi)有文檔化的流程就相當(dāng)于沒(méi)有流程,沒(méi)有流程的系統(tǒng)能夠在要求時(shí)間內(nèi)恢復(fù)完全靠運(yùn)氣(通常不能)。
另外,在通常情況下,IT系統(tǒng)相關(guān)的災(zāi)難備份方案設(shè)計(jì)都必須考慮以下五大因素,1,災(zāi)難類型
需要考慮哪些災(zāi)難?怎樣的災(zāi)難?會(huì)使業(yè)務(wù)中斷多久? 2,恢復(fù)速度
災(zāi)難發(fā)生后需要多久來(lái)啟動(dòng)及運(yùn)行系統(tǒng)?能否承受數(shù)天或數(shù)分鐘的等待? 3,恢復(fù)程度
需要恢復(fù)每條記錄和交易嗎?可以使用上星期或昨天的數(shù)據(jù)嗎?需要恢復(fù)一切嗎?有不相關(guān)的文件嗎?什么是合法隱含的要求?有少數(shù)的一組人輸入交易嗎?他們可以重新輸入災(zāi)難期間丟失的交易嗎?這些交易十分重要而不容許丟失嗎? 4,可用的技術(shù)
必須結(jié)合考慮所選技術(shù)在本地區(qū)的適用性、實(shí)現(xiàn)條件以及在實(shí)施時(shí)是否受某些現(xiàn)有條件的制約? 5,方案總體成本
實(shí)現(xiàn)災(zāi)難備份需要多少投資?不實(shí)現(xiàn)災(zāi)難備份會(huì)損失多少錢? 綜合以上所述,可以如圖2所示:
圖2.災(zāi)難備份方案選擇標(biāo)準(zhǔn)
2.3.1容災(zāi)的7個(gè)層次
據(jù)國(guó)際標(biāo)準(zhǔn)SHARE78的定義,災(zāi)難恢復(fù)解決方案可根據(jù)以下主要方面所達(dá)到的程度分為七級(jí),即從低到高有七種不同層次的災(zāi)難恢復(fù)解決方案??梢愿鶕?jù)企業(yè)數(shù)據(jù)的重要性以及您需要恢復(fù)的速度和程度,來(lái)設(shè)計(jì)選擇并實(shí)現(xiàn)您的災(zāi)難恢復(fù)計(jì)劃(參見圖3)。這取決于下列要求: 備份/恢復(fù)的范圍 災(zāi)難恢復(fù)計(jì)劃的狀態(tài)
在應(yīng)用中心與備份中心之間的距離
應(yīng)用中心與備份中心之間是如何相互連接的 數(shù)據(jù)是怎樣在兩個(gè)中心之間傳送的 有多少數(shù)據(jù)被丟失
怎樣保證更新的數(shù)據(jù)在備份中心被更新 備份中心可以開始備份工作的能力
現(xiàn)已證明,為實(shí)現(xiàn)有效的災(zāi)難恢復(fù),無(wú)需人工介入的自動(dòng)站點(diǎn)故障切換功能是一個(gè)必須被納入考慮范圍的重要事項(xiàng)。目前通用的異地遠(yuǎn)程恢復(fù)標(biāo)準(zhǔn)采用的是1992年Anaheim的SHARE78,M028會(huì)議的報(bào)告中所闡述的七個(gè)層次:
0層-沒(méi)有異地?cái)?shù)據(jù)(No off-site Data)Tier0即沒(méi)有任何異地備份或應(yīng)急計(jì)劃。數(shù)據(jù)僅在本地進(jìn)行備份恢復(fù),沒(méi)有數(shù)據(jù)送往異地。事實(shí)上這一層并不具備真正災(zāi)難恢復(fù)的能力。
1層-PTAM卡車運(yùn)送訪問(wèn)方式(Pickup Truck Access Method)Tier1的災(zāi)難恢復(fù)方案必須設(shè)計(jì)一個(gè)應(yīng)急方案,能夠備份所需要的信息并將它存儲(chǔ)在異地。PTAM指將本地備份的數(shù)據(jù)用交通工具送到遠(yuǎn)方。這種方案相對(duì)來(lái)說(shuō)成本較低,但難于管理。
2層-PTAM卡車運(yùn)送訪問(wèn)方式+熱備份中心(PTAM + Hot Center)Tier2相當(dāng)于Tier1再加上熱備份中心能力的進(jìn)一步的災(zāi)難恢復(fù)。熱備份中心擁有足夠的硬件和網(wǎng)絡(luò)設(shè)備去支持關(guān)鍵應(yīng)用。相比于Tier1,明顯降低了災(zāi)難恢復(fù)時(shí)間。3層-電子鏈接(Electronic Vaulting)Tier3是在Tier2的基礎(chǔ)上用電子鏈路取代了卡車進(jìn)行數(shù)據(jù)的傳送的進(jìn)一步的災(zāi)難恢復(fù)。由于熱備份中心要保持持續(xù)運(yùn)行,增加了成本,但提高了災(zāi)難恢復(fù)速度。4層-活動(dòng)狀態(tài)的備份中心(Active Secondary Center)Tier4指兩個(gè)中心同時(shí)處于活動(dòng)狀態(tài)并同時(shí)互相備份,在這種情況下,工作負(fù)載可能在兩個(gè)中心之間分享。在災(zāi)難發(fā)生時(shí),關(guān)鍵應(yīng)用的恢復(fù)也可降低到小時(shí)級(jí)或分鐘級(jí)。
5層– 兩個(gè)活動(dòng)的數(shù)據(jù)中心,確保數(shù)據(jù)一致性的兩階段傳輸承諾(Two-Site Two-Phase Commit)
Tier5則提供了更好的數(shù)據(jù)完整性和一致性。也就是說(shuō),Tier5需要兩中心與中心的數(shù)據(jù)都被同時(shí)更新。在災(zāi)難發(fā)生時(shí),僅是傳送中的數(shù)據(jù)被丟失,恢復(fù)時(shí)間被降低到分鐘級(jí)。6層-0數(shù)據(jù)丟失(Zero Data Loss),自動(dòng)系統(tǒng)故障切換
Tier6可以實(shí)現(xiàn)0數(shù)據(jù)丟失率,被認(rèn)為是災(zāi)難恢復(fù)的最高級(jí)別,在本地和遠(yuǎn)程的所有數(shù)據(jù)被更新的同時(shí),利用了雙重在線存儲(chǔ)和完全的網(wǎng)絡(luò)切換能力,當(dāng)發(fā)生災(zāi)難時(shí),能夠提供跨站點(diǎn)動(dòng)態(tài)負(fù)載平衡和自動(dòng)系統(tǒng)故障切換功能。
2.3.2容災(zāi)的業(yè)務(wù)恢復(fù)時(shí)間段
對(duì)于IT系統(tǒng)的容災(zāi)指標(biāo),我們可以通過(guò)下列參數(shù)表示: * 以恢復(fù)點(diǎn)為目標(biāo)(RPO--Recovery Point Object)– – 數(shù)據(jù)的完整性(無(wú)數(shù)據(jù)丟失)– – 數(shù)據(jù)的一致性(數(shù)據(jù)正確且可用)
* 以恢復(fù)時(shí)間為目標(biāo)(RTO---Recovery Time Object)* 以網(wǎng)絡(luò)恢復(fù)為目標(biāo)(NRO---Network Recovery Object)* 以服務(wù)支持能力為目標(biāo)(SDO---Serviceability Degrade Object)– – 性能
– – 地域/ 支持的客戶總數(shù) – – 功能的限制
圖4展示了業(yè)務(wù)恢復(fù)的不同時(shí)間段。
圖4.容災(zāi)的業(yè)務(wù)恢復(fù)時(shí)間段 2.3.3容災(zāi)所涉及的恢復(fù)技術(shù)
DR(容災(zāi) Disaster Recovery)項(xiàng)目的實(shí)施中涉及到多種技術(shù)。這些技術(shù)可以分為三類:應(yīng)用恢復(fù),網(wǎng)絡(luò)恢復(fù),數(shù)據(jù)恢復(fù)。應(yīng)用恢復(fù)技術(shù)
常用的應(yīng)用恢復(fù)技術(shù)或方法如下:
* 通過(guò)負(fù)載均衡提供永不停頓的系統(tǒng)運(yùn)行能力(Tier-7)例如:IBMS/390的GDPS技術(shù)給用戶提供一個(gè)無(wú)中斷的操作環(huán)境,來(lái)運(yùn)行那些關(guān)鍵業(yè)務(wù)的應(yīng)用程序,通過(guò)自動(dòng)應(yīng)用恢復(fù)能力來(lái)滿足其第7級(jí)容災(zāi)要求 * 通過(guò)事先寫好的腳本來(lái)實(shí)現(xiàn)自動(dòng)的熱接管(Tier-6)例如:GDPS也可以在熱待命狀態(tài)下運(yùn)行,來(lái)為S/390系統(tǒng)提供第6級(jí)解決方案。
HAGEO提供與GDPS熱待命相似的解決方案,并常被用來(lái)作為大型關(guān)鍵業(yè)務(wù)UNIX數(shù)據(jù)中心的DR解決方案
* 按預(yù)案手工實(shí)現(xiàn)站點(diǎn)接管(Tier 4/5)例如:有些設(shè)施的DR包括必須有人介入和決策的手動(dòng)應(yīng)用恢復(fù)程序。
在實(shí)際災(zāi)難發(fā)生時(shí),一些這樣的設(shè)施因?yàn)閷?duì)人工操作的依賴,造成恢復(fù)過(guò)程的延誤。因此,我們認(rèn)識(shí)到,容災(zāi)的實(shí)施必須包括一定程度的自動(dòng)化,這也是GDPS和HAGEO這樣的軟件的主旨。網(wǎng)絡(luò)恢復(fù)技術(shù)
常用的網(wǎng)絡(luò)恢復(fù)技術(shù)或方法如下: * 4-7 層交換機(jī)(Tier-7)例如:無(wú)中斷的第7級(jí)網(wǎng)絡(luò)恢復(fù)需要?jiǎng)討B(tài)網(wǎng)絡(luò)路由重選,來(lái)保證應(yīng)用能夠在不中斷最終用戶的情況下轉(zhuǎn)入備用數(shù)據(jù)中心。在SNA環(huán)境下通過(guò)APPN來(lái)完成,而在IP環(huán)境下則通過(guò)第4-7層轉(zhuǎn)換來(lái)完成。APPN是在IBM S/390 GDPS環(huán)境下,為動(dòng)態(tài)網(wǎng)絡(luò)恢復(fù)而開發(fā)的SNA網(wǎng)絡(luò)技術(shù)。通過(guò)標(biāo)準(zhǔn)的基于路由器的技術(shù),可以在通用的IP傳輸上使用APPN * 路由(Tier-6)例如:在第6級(jí)DR的實(shí)施中,網(wǎng)絡(luò)恢復(fù)可以通過(guò)APPN和/或標(biāo)準(zhǔn)的路由協(xié)議來(lái)完成(OSPF / EIGRP / BGP-4)在非GDPS環(huán)境中,APPN應(yīng)用路由在容災(zāi)系統(tǒng)備用路徑可用時(shí),自動(dòng)恢復(fù)網(wǎng)絡(luò)連接
* 2層 Reconnect(Tier-4/5)例如:SNA子網(wǎng)在以太網(wǎng)/SNA中通過(guò)ATM / 幀中繼 / DDN 鏈路進(jìn)行互聯(lián),如果發(fā)生鏈路故障,則可以通過(guò)手工切換來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)恢復(fù)
數(shù)據(jù)恢復(fù)技術(shù)
數(shù)據(jù)容災(zāi)系統(tǒng)的實(shí)現(xiàn)可以采用不同的技術(shù)。一種技術(shù)是采用硬件進(jìn)行遠(yuǎn)程數(shù)據(jù)復(fù)制,我們稱為硬件復(fù)制技術(shù)。這種技術(shù)的提供者是一些存儲(chǔ)設(shè)備廠商,其技術(shù)例如PPRC、SRDF。數(shù)據(jù)的復(fù)制完全通過(guò)專用線路實(shí)現(xiàn)物理存儲(chǔ)設(shè)備之間的交換;另一種技術(shù)是采用軟件系統(tǒng)實(shí)現(xiàn)遠(yuǎn)程的實(shí)時(shí)數(shù)據(jù)復(fù)制,并且實(shí)現(xiàn)遠(yuǎn)程的全程高可用體系(遠(yuǎn)程監(jiān)控和切換)。這種技術(shù)的代表則是一些存儲(chǔ)軟件廠商,其技術(shù)例如HAGEO、VVR。
數(shù)據(jù)復(fù)制是一個(gè)復(fù)雜的議題,但一般來(lái)說(shuō)這,它可以在硬件或軟件層上實(shí)施(參見圖5)。今天,市場(chǎng)上的硬件和軟件技術(shù)提供不同的第4級(jí)和第7級(jí)數(shù)據(jù)恢復(fù),對(duì)硬件或軟件的選擇取決于很多與設(shè)施相關(guān)的因素,如工作量、網(wǎng)絡(luò)成本要求、工作點(diǎn)和數(shù)據(jù)恢復(fù)點(diǎn)間的距離、同性或異性的平臺(tái)支持等等。我們將在下面的章節(jié)對(duì)以上兩種技術(shù)進(jìn)行詳細(xì)的論述。
圖5.數(shù)據(jù)復(fù)制技術(shù) 第三章 容災(zāi)方案分析
業(yè)務(wù)連續(xù)性開發(fā)模式 | 七層災(zāi)難恢復(fù)解決方案 | 如何選擇最優(yōu)的災(zāi)難恢復(fù)方案
在現(xiàn)代企業(yè)的IT系統(tǒng)管理過(guò)程中,常常會(huì)遇到各種有關(guān)災(zāi)難備份范疇的需求,例如:
―無(wú)論發(fā)生任何問(wèn)題,業(yè)務(wù)系統(tǒng)必須在最短的時(shí)間內(nèi)恢復(fù)!‖; ―無(wú)論發(fā)生任何問(wèn)題,數(shù)據(jù)絕對(duì)不能丟失!‖ ……
針對(duì)這些問(wèn)題,有經(jīng)驗(yàn)的管理人員可能會(huì)考慮到一系列由此引發(fā)的問(wèn)題: ―究竟有些什么因素可能導(dǎo)致業(yè)務(wù)中斷?‖ ―究竟最短的時(shí)間是多長(zhǎng)?‖
―是否所有的應(yīng)用系統(tǒng)數(shù)據(jù)都不能丟失?‖ ―這些恢復(fù)目標(biāo)是否合理?‖
―目前的IT架構(gòu)是否能夠滿足所要求的恢復(fù)目標(biāo)?‖
―是否IT系統(tǒng)得到恢復(fù),就意味著業(yè)務(wù)部門可以對(duì)客戶進(jìn)行服務(wù)?‖ ―如何衡量災(zāi)難備份方案的投入產(chǎn)出比?‖ ……
回答以上這些問(wèn)題的過(guò)程,就是考慮企業(yè)業(yè)務(wù)連續(xù)性的過(guò)程。事實(shí)上,隨著IT系統(tǒng)在企業(yè)內(nèi)部應(yīng)用的深入,災(zāi)難備份在企業(yè)中已不是IT一個(gè)部門的問(wèn)題,而是整個(gè)企業(yè)各業(yè)務(wù)部門與IT部門緊密合作的問(wèn)題。其內(nèi)容也不僅局限于數(shù)據(jù)的備份和應(yīng)用的接管,還包含了網(wǎng)絡(luò)的冗余、人員與組織架構(gòu)的整理、恢復(fù)流程的設(shè)計(jì)等一系列技術(shù)以外的范疇。目的在于保證在災(zāi)難環(huán)境下,企業(yè)真正從業(yè)務(wù)的角度得到保護(hù),而不僅僅是IT環(huán)境的恢復(fù)。
3.1業(yè)務(wù)連續(xù)性開發(fā)模式
各行各業(yè)的用戶,需要針對(duì)自身情況,設(shè)立可行的業(yè)務(wù)恢復(fù)目標(biāo),并制訂出切合實(shí)際、投資合理、可靠的業(yè)務(wù)連續(xù)性及技術(shù)方案。這種業(yè)務(wù)連續(xù)性開發(fā)模式,體現(xiàn)在業(yè)務(wù)連續(xù)性或?yàn)?zāi)難備份的項(xiàng)目中,就是災(zāi)難備份項(xiàng)目實(shí)施的步驟:
1.災(zāi)難類型分析 2.業(yè)務(wù)沖擊分析
3.當(dāng)前業(yè)務(wù)環(huán)境及恢復(fù)能力分析 4.容災(zāi)策略制訂 5.容災(zāi)方案設(shè)計(jì) 6.業(yè)務(wù)連續(xù)性流程設(shè)計(jì)
7.業(yè)務(wù)連續(xù)性流程及容災(zāi)方案管理和測(cè)試
其過(guò)程如下圖所示,是一個(gè)周而復(fù)始的過(guò)程,隨著企業(yè)內(nèi)部環(huán)境的變化隨時(shí)靈活變化:
圖一.災(zāi)難備份項(xiàng)目實(shí)施過(guò)程
3.1.1階段
一、災(zāi)難類型分析(風(fēng)險(xiǎn)分析)
在本階段,需要進(jìn)行詳細(xì)而量化的風(fēng)險(xiǎn)分析,以確定當(dāng)前IT環(huán)境之中存在哪些無(wú)法接受的物理威脅或者可能發(fā)生的災(zāi)難,并對(duì)災(zāi)難發(fā)生的可能性、目前可能的防護(hù)措施的有效性和該災(zāi)難所威脅的資產(chǎn)價(jià)值進(jìn)行分析,最終得到帶有優(yōu)先級(jí)別的需要防護(hù)的災(zāi)難列表,并制訂可能的處理方法,如接受該災(zāi)難發(fā)生的風(fēng)險(xiǎn)而不進(jìn)行防護(hù)、自行制訂該災(zāi)難的防護(hù)方法或者采取購(gòu)買保險(xiǎn)等風(fēng)險(xiǎn)轉(zhuǎn)嫁策略。其結(jié)果可以由下圖表示:
在該圖中,橫坐標(biāo)為風(fēng)險(xiǎn)發(fā)生的可能性,縱坐標(biāo)為風(fēng)險(xiǎn)發(fā)生所造成的損失。在某一風(fēng)險(xiǎn)發(fā)生的可能性極小時(shí),即使造成的損失極大,也可能屬于可接受的風(fēng)險(xiǎn)范疇,例如美國(guó)的―9?11‖事件。但該接受程度是與時(shí)俱進(jìn)的,在―9?11‖事件發(fā)生后,事實(shí)是大部分沒(méi)有考慮這種大范圍災(zāi)難性事件的企業(yè)基本沒(méi)有得到恢復(fù)的機(jī)會(huì)。目前業(yè)界也已經(jīng)將低概率事件逐漸納入防護(hù)的范圍。
3.1.2階段
二、業(yè)務(wù)沖擊分析
在本階段,應(yīng)該針對(duì)各種業(yè)務(wù)流程進(jìn)行分析,通過(guò)走訪各業(yè)務(wù)部門的相關(guān)人員,了解各種業(yè)務(wù)流程本身對(duì)該企業(yè)的重要程度。(例如在銀行業(yè)里,儲(chǔ)蓄和單據(jù)、網(wǎng)上支付、電話銀行等業(yè)務(wù)就具有不同的優(yōu)先等級(jí)。)同時(shí)根據(jù)一定的評(píng)判原則,得出在核心流程由于災(zāi)難的發(fā)生而無(wú)法正常進(jìn)行時(shí)對(duì)企業(yè)本身的損失情況。這種損失可能是可以量化的,例如單據(jù)的丟失、計(jì)算的錯(cuò)誤而導(dǎo)致的直接損失;也可以是無(wú)形的損失,例如客戶滿意度及競(jìng)爭(zhēng)優(yōu)勢(shì)的丟失。通過(guò)對(duì)可量化和不可量化損失的綜合考慮,得出各種核心業(yè)務(wù)流程由于災(zāi)難受損的可容忍程度及損失的決策依據(jù)。體現(xiàn)在IT系統(tǒng)上,是三個(gè)指標(biāo):
數(shù)據(jù)恢復(fù)點(diǎn)目標(biāo)(RECOVERY POINT OBJECTIVE):體現(xiàn)為該流程在災(zāi)難 發(fā)生后,恢復(fù)運(yùn)轉(zhuǎn)時(shí)數(shù)據(jù)丟失的可容忍程度;
恢復(fù)時(shí)間目標(biāo)(RECOVERY TIME OBJECTIE):體現(xiàn)為該流程在災(zāi)難發(fā)生后,需要恢復(fù)的緊迫性也即多久能夠得到恢復(fù)的問(wèn)題;
網(wǎng)絡(luò)恢復(fù)目標(biāo)(NETWORK RECOVERY OBJECTIVE):即營(yíng)業(yè)網(wǎng)點(diǎn)什么時(shí)候才能通過(guò)備份網(wǎng)絡(luò)與數(shù)據(jù)中心重新恢復(fù)通信的指標(biāo);
對(duì)于不同的業(yè)務(wù)流程,這三個(gè)指標(biāo)可能相差非常之大,各個(gè)流程本身對(duì)這三個(gè)目標(biāo)的優(yōu)先程度也是不一樣的,有的流程可能要求數(shù)據(jù)丟失的程度較小,但恢復(fù)時(shí)間可以較長(zhǎng),而另一些流程可能要求短時(shí)間內(nèi)恢復(fù),但數(shù)據(jù)的丟失程度可以放大一些。這三個(gè)指標(biāo)直接影響所使用的容災(zāi)策略及技術(shù)方案,并指導(dǎo)企業(yè)的投入成本??梢杂孟聢D表示:
圖3.業(yè)務(wù)沖擊分析曲線
在該圖中,橫坐標(biāo)為災(zāi)難持續(xù)時(shí)間,縱坐標(biāo)為災(zāi)難損失,在某一程度以下屬于可接受的程度,即橫虛線所示。這種可接受決策應(yīng)該由負(fù)責(zé)該流程的業(yè)務(wù)部門綜合考慮后做出。
3.1.3階段
三、企業(yè)容災(zāi)環(huán)境分析 本階段主要針對(duì)業(yè)務(wù)沖擊分析的結(jié)果,對(duì)目前的內(nèi)部環(huán)境進(jìn)行評(píng)估,得出與恢復(fù)目標(biāo)之間的差距。分析的對(duì)象為業(yè)務(wù)流程需要的資源,如IT環(huán)境等。通過(guò)本階段的工作,得出各業(yè)務(wù)流程所牽涉的企業(yè)資產(chǎn)及資源(人力資源、IT架構(gòu)、技術(shù)儲(chǔ)備、技術(shù)使用程度、網(wǎng)絡(luò)環(huán)境等),并分析得出目前的業(yè)務(wù)環(huán)境對(duì)容災(zāi)需求、冗余程度、可能造成的數(shù)據(jù)損失是否能夠支持等方面的報(bào)告。用下圖表示:
圖4.容災(zāi)環(huán)境分析
圖中右邊紅線為目前環(huán)境所支持的容災(zāi)能力,左邊紅線為經(jīng)過(guò)業(yè)務(wù)沖擊分析所得到的需要達(dá)到的恢復(fù)能力,在災(zāi)難恢復(fù)時(shí)間和災(zāi)難造成損失兩個(gè)方面都需要得到降低。
3.1.4階段
四、容災(zāi)策略制訂
在本階段,結(jié)合以上各階段的分析成果,以及企業(yè)本身在容災(zāi)上的投入能力,制訂企業(yè)短期、長(zhǎng)期范圍內(nèi)的容災(zāi)策略和目標(biāo),并有意識(shí)地將企業(yè)本身的人員組成和組織架構(gòu)做出調(diào)整以適應(yīng)策略要求。最重要的是制訂出容災(zāi)實(shí)施步驟,優(yōu)先解決最為重點(diǎn)的問(wèn)題。如下圖所示:
圖5.容災(zāi)策略制訂
3.1.5階段
五、容災(zāi)方案設(shè)計(jì)
容災(zāi)方案可供選擇的范圍很大,但所有的容災(zāi)方案都必須考慮的因素包括恢復(fù)時(shí)間、實(shí)施與維護(hù)容災(zāi)策略所需的投入等。容災(zāi)恢復(fù)時(shí)間的需求越短,所需的實(shí)施成本就越大,實(shí)施難度也就越高?;謴?fù)時(shí)間與投入的比值可以用以下這張曲線圖加以說(shuō)明:
圖6.容災(zāi)方案層次
圖中的各種層次方案可以分別滿足不同的數(shù)據(jù)恢復(fù)目標(biāo)和恢復(fù)時(shí)間目標(biāo),需要根據(jù)業(yè)務(wù)沖擊分析的結(jié)果,針對(duì)每一種業(yè)務(wù)流程,綜合選擇能夠滿足容災(zāi)目標(biāo)的方案。
3.1.6 階段
六、業(yè)務(wù)連續(xù)性流程設(shè)計(jì)
有了IT系統(tǒng)的恢復(fù)方案,只能夠保證在災(zāi)難環(huán)境下,IT系統(tǒng)的恢復(fù)能夠保證業(yè)務(wù)沖擊分析的目標(biāo),但是業(yè)務(wù)的連續(xù)性并不只是IT系統(tǒng)的恢復(fù),還包括辦公場(chǎng)地、辦公設(shè)備、緊急流程、指揮架構(gòu)、人員調(diào)度等等多方面、各部門的綜合考慮。只有業(yè)務(wù)流程執(zhí)行過(guò)程的每一個(gè)環(huán)節(jié)都達(dá)到容災(zāi)目標(biāo)的要求,才能夠認(rèn)為業(yè)務(wù)沖擊分析的目標(biāo)得到了滿足。一般來(lái)說(shuō),每個(gè)企業(yè)都應(yīng)該設(shè)立一個(gè)由領(lǐng)導(dǎo)掛帥,各業(yè)務(wù)部門和IT部門聯(lián)合組成的一個(gè)容災(zāi)指揮小組:
圖7.容災(zāi)組織架構(gòu)圖
由該小組指揮,IT部門和業(yè)務(wù)部門分別執(zhí)行,IT恢復(fù)計(jì)劃和業(yè)務(wù)連續(xù)性計(jì)劃才能得到同步,從而達(dá)到容災(zāi)設(shè)計(jì)的目標(biāo)。
3.1.7階段
七、業(yè)務(wù)連續(xù)性流程及容災(zāi)方案管理和測(cè)試
任何制訂的計(jì)劃,都必須經(jīng)過(guò)不斷的測(cè)試和修正,才能滿足企業(yè)不斷發(fā)展的需求。同時(shí),通過(guò)測(cè)試過(guò)程,也能夠使企業(yè)內(nèi)部各部門及人員熟悉自己在業(yè)務(wù)連續(xù)性計(jì)劃中所扮演的角色,做到胸有成竹,才能夠在災(zāi)難真正發(fā)生的時(shí)刻有條不紊地開展恢復(fù)的過(guò)程。
測(cè)試的過(guò)程可以分為―紙上談兵‖和實(shí)地演習(xí)兩種方式,根據(jù)企業(yè)需要及對(duì)業(yè)務(wù)影響的不同分別采用。
需要注意的是,無(wú)論平時(shí)的測(cè)試如何完善,也沒(méi)有辦法預(yù)測(cè)可能發(fā)生的災(zāi)難情況。關(guān)鍵人員的損失或者關(guān)鍵文檔的丟失,都有可能對(duì)災(zāi)難恢復(fù)計(jì)劃的執(zhí)行造成巨大影響。因此,在災(zāi)難演練過(guò)程中要注意到人員的交叉?zhèn)浞萸闆r,除了每個(gè)人自己所擔(dān)負(fù)的責(zé)任外,盡量做到關(guān)鍵步驟有后備人選作為應(yīng)變。
3.2七層災(zāi)難恢復(fù)解決方案
在談到災(zāi)難恢復(fù)方案時(shí),經(jīng)常提到災(zāi)難恢復(fù)解決方案的7個(gè)層次(tier)。那么什么是7層解決方案?該如何為關(guān)鍵的業(yè)務(wù)應(yīng)用選擇最優(yōu)的容災(zāi)方案?
3.2.1恢復(fù)的7個(gè)層次
災(zāi)難保護(hù)計(jì)劃的目的是,確保關(guān)鍵業(yè)務(wù)持續(xù)運(yùn)行以及減少非計(jì)劃宕機(jī)時(shí)間。所有與容災(zāi)方案相關(guān)的計(jì)劃都試圖在方案本身、宕機(jī)時(shí)間和實(shí)施方案所需成本三者之間找到一個(gè)平衡點(diǎn)。
圖8.三者的平衡關(guān)系
災(zāi)難恢復(fù)方案中的恢復(fù)時(shí)間與下列因素有關(guān): 數(shù)據(jù)有效性的恢復(fù) IT基礎(chǔ)設(shè)施的恢復(fù) 可操作流程的修復(fù) 關(guān)鍵業(yè)務(wù)的修復(fù)
圖9.災(zāi)難恢復(fù)的層次劃分
3.2.2細(xì)述7個(gè)層次
災(zāi)難恢復(fù)方案的7個(gè)層次提供了一個(gè)簡(jiǎn)單方法論--如何定義當(dāng)前的服務(wù)水平、風(fēng)險(xiǎn)以及期望的服務(wù)水平和環(huán)境。
0層:無(wú)異地備份數(shù)據(jù)(No off-site Data)對(duì)于使用0層災(zāi)難恢復(fù)解決方案的業(yè)務(wù),可稱其為沒(méi)有災(zāi)難恢復(fù)計(jì)劃,主要表現(xiàn)為: 數(shù)據(jù)僅在本地進(jìn)行備份恢復(fù),沒(méi)有任何數(shù)據(jù)信息和資料被送往異地,沒(méi)有處理意外 事故的計(jì)劃。恢復(fù)時(shí)間:在此種情況下,恢復(fù)時(shí)間不可預(yù)測(cè)。事實(shí)上也不可能恢復(fù)。
例如,目前我們通常在機(jī)房?jī)?nèi)所做的數(shù)據(jù)備份,備份介質(zhì)保留在機(jī)房?jī)?nèi),用于本地的數(shù)據(jù)恢復(fù)。當(dāng)災(zāi)難發(fā)生時(shí),數(shù)據(jù)備份和設(shè)備有可能一同被毀,無(wú)法進(jìn)行恢復(fù)。
1層:有數(shù)據(jù)備份,無(wú)備用系統(tǒng)(Data Backup with No Hot Site)
使用1層災(zāi)難恢復(fù)解決方案的業(yè)務(wù),通常將需要的數(shù)據(jù)備份到磁帶上,然后將這些介質(zhì)運(yùn)送到其它較為安全的地方。但在那里缺乏能恢復(fù)數(shù)據(jù)的系統(tǒng),若數(shù)據(jù)備份的頻率很高,則在恢復(fù)時(shí)丟失的數(shù)據(jù)就會(huì)少些。此類業(yè)務(wù)應(yīng)能忍受幾天乃至幾星期的數(shù)據(jù)丟失。
例如,PTAM(Pickup Truck Access Method)是一種許多數(shù)據(jù)中心所采用的標(biāo)準(zhǔn)備份方式。在完成所需的數(shù)據(jù)備份后,用適當(dāng)?shù)倪\(yùn)輸工具將它們送到遠(yuǎn)離本地的地方,同時(shí)備有數(shù)據(jù)恢復(fù)的程序。災(zāi)難發(fā)生后,一整套系統(tǒng)安裝需要在一臺(tái)未開啟的計(jì)算機(jī)上重新完成,系統(tǒng)和數(shù)據(jù)可以被恢復(fù)并重新與網(wǎng)絡(luò)相連。這種災(zāi)難恢復(fù)方案相對(duì)來(lái)說(shuō)成本較低(僅僅需要運(yùn)輸工具的消耗以及存儲(chǔ)設(shè)備的消耗)。但恢復(fù)的時(shí)間長(zhǎng),且數(shù)據(jù)不夠新。
2層:有數(shù)據(jù)備份,有備用系統(tǒng)(Data Backup with Hot Site)
使用2層容災(zāi)解決方案的業(yè)務(wù)會(huì)定期將數(shù)據(jù)備份到磁帶上,并將其運(yùn)到安全的地點(diǎn)。在備份中心有備用的系統(tǒng),當(dāng)災(zāi)難發(fā)生時(shí),可以使用這些數(shù)據(jù)備份磁帶來(lái)恢復(fù)系統(tǒng)。雖然還需要數(shù)小時(shí)或幾天的時(shí)間來(lái)恢復(fù)數(shù)據(jù)以使業(yè)務(wù)可用,但不可預(yù)測(cè)的恢復(fù)時(shí)間減少了。
2層相當(dāng)于在1層上增加了備份中心的災(zāi)難恢復(fù)。備份中心擁有足夠的硬件和網(wǎng)絡(luò)設(shè)備來(lái)維持關(guān)鍵應(yīng)用的安裝需求,這樣的應(yīng)用是十分的關(guān)鍵的,它必須在災(zāi)難發(fā)生的同時(shí),在異地有正運(yùn)行著的硬件提供支持。這種災(zāi)難恢復(fù)的方式依賴于PTAM方法去將日常數(shù)據(jù)放入倉(cāng)庫(kù),當(dāng)災(zāi)難發(fā)生的時(shí)候,再將數(shù)據(jù)恢復(fù)到備份中心的系統(tǒng)上。雖然備份中心的系統(tǒng)增加了成本,但明顯降低了災(zāi)難恢復(fù)時(shí)間,系統(tǒng)可在幾天內(nèi)得以恢復(fù)。
3層:電子鏈接(Electronic Vaulting)
使用3層容災(zāi)解決方案的業(yè)務(wù),是在2層解決方案的基礎(chǔ)上,又使用了對(duì)關(guān)鍵數(shù)據(jù)的電子鏈接技術(shù)。電子鏈接將磁帶備份后更改的數(shù)據(jù)進(jìn)行記錄,并傳到備用中心,使用此種方法會(huì)比使用傳統(tǒng)的磁帶備份更快地得到更新的數(shù)據(jù)。所以,當(dāng)災(zāi)難發(fā)生后,只有少量的數(shù)據(jù)需要重新恢復(fù),恢復(fù)時(shí)間會(huì)縮短。
由于備用中心要保持持續(xù)運(yùn)行,與生產(chǎn)中心間的通訊線路要保證暢通,增加了運(yùn)營(yíng)成本。但消除了對(duì)運(yùn)輸工具的依賴,提高了災(zāi)難恢復(fù)速度。
例如,某企業(yè)在每天下班后,將當(dāng)日的流水全部記錄下來(lái),通過(guò)網(wǎng)絡(luò)傳到備份中心;備份中心在備用系統(tǒng)上,重新將所有業(yè)務(wù)重做,保證與生產(chǎn)中心的一致性。這一領(lǐng)域的產(chǎn)品可以分四層:
1)存儲(chǔ)設(shè)備層:IBM-ESS-PPRC、IBM-DS4000-RM、EMC-SRDF、HP-EVA-StorageWorks Continuous Access、FALCONSTOR-IPSTOR、NETAPP等。
2)操作系統(tǒng)及系統(tǒng)軟件層:IBM-GEORM、VERITAS-Storage Replicator/Volume Replicator、LEGATAL-RepliStor。
3)數(shù)據(jù)庫(kù)層:IBM-DB2-HADR、IBM-INFORMIX-HDR、ORACLE-ORACLE-DATA GUARD等。
4)應(yīng)用程序?qū)樱簯?yīng)用程序開發(fā)時(shí)考慮到數(shù)據(jù)的復(fù)制。
4層:使用快照技術(shù)拷貝數(shù)據(jù)(Point-in-time Copies)
使用4層災(zāi)難恢復(fù)方案的業(yè)務(wù),對(duì)數(shù)據(jù)的實(shí)時(shí)性和快速恢復(fù)性要求更高些。1-3層的方案中較常使用磁帶備份和傳輸,在4層方案中開始使用基于磁盤的解決方案。此時(shí)仍然會(huì)出現(xiàn)幾個(gè)小時(shí)的數(shù)據(jù)丟失,但同基于磁帶的解決方案相比,通過(guò)加快備份頻率,使用最近時(shí)間點(diǎn)的快照拷貝恢復(fù)數(shù)據(jù)會(huì)更快。系統(tǒng)可在一天內(nèi)恢復(fù)。
4層災(zāi)難恢復(fù)可有兩個(gè)中心同時(shí)處于活動(dòng)狀態(tài)并管理彼此的備份數(shù)據(jù),允許備份行動(dòng)在任何一個(gè)方向發(fā)生。接收方硬件必須保證與另一方平臺(tái)在地理上分離,在這種情況下,工作負(fù)載可能在兩個(gè)中心之間分享,中心1成為中心2的備份,反之亦然。在兩個(gè)中心之間,彼此的在線關(guān)鍵數(shù)據(jù)的拷貝不停地相互傳送著。在災(zāi)難發(fā)生時(shí),需要的關(guān)鍵數(shù)據(jù)通過(guò)網(wǎng)絡(luò)可迅速恢復(fù),通過(guò)網(wǎng)絡(luò)的切換,關(guān)鍵應(yīng)用的恢復(fù)也可降低到小時(shí)級(jí)。支持這種工作方式的產(chǎn)品包括IBM-HAGEO、VARITAS-Global Cluster Manager。
5層:交易的完整性(Transaction Integrity)
使用5層災(zāi)難恢復(fù)方案的業(yè)務(wù),要求保證生產(chǎn)中心和數(shù)據(jù)備份中心的數(shù)據(jù)的一致性。在此層方案中只允許少量甚至是無(wú)數(shù)據(jù)丟失,但是該功能的實(shí)現(xiàn)完全依賴于所運(yùn)行的應(yīng)用。
5層除了使用4層的技術(shù)外,還要維護(hù)數(shù)據(jù)的狀態(tài)-要保證在本地和遠(yuǎn)端數(shù)據(jù)庫(kù)中都要更新數(shù)據(jù)。只有當(dāng)兩地的數(shù)據(jù)都更新完成后,才認(rèn)為此次交易成功。生產(chǎn)中心和備用中心是由高速的寬帶連接的,關(guān)鍵數(shù)據(jù)和應(yīng)用同時(shí)運(yùn)行在兩個(gè)地點(diǎn)。當(dāng)災(zāi)難發(fā)生時(shí),只有正在進(jìn)行的交易數(shù)據(jù)會(huì)丟失。由于恢復(fù)數(shù)據(jù)的減少,恢復(fù)時(shí)間也大大縮短。數(shù)據(jù)庫(kù)的數(shù)據(jù)復(fù)制功能一般可以工作在這樣的方式下:IBM-DB2-HADR、ORACLE-ORACLE-Replication等。
6層:少量或無(wú)數(shù)據(jù)丟失(Zero or little data loss)
6層災(zāi)難恢復(fù)方案可以保證最高一級(jí)數(shù)據(jù)的實(shí)時(shí)性。適用于那些幾乎不允許數(shù)據(jù)丟失并要求能快速將數(shù)據(jù)恢復(fù)到應(yīng)用中的業(yè)務(wù)。此種解決方案提供數(shù)據(jù)的一致性,不依賴于應(yīng)用而是靠大量的硬件技術(shù)和操作系統(tǒng)軟件來(lái)實(shí)現(xiàn)的。
這一級(jí)別的要求很高,一般需要整個(gè)系統(tǒng)應(yīng)用程序?qū)拥接布泳扇∠鄳?yīng)措施。
1)應(yīng)用程序?qū)硬捎没诮灰祝═RANSACTION)的方法開發(fā)。
2)數(shù)據(jù)庫(kù)可以采取數(shù)據(jù)復(fù)制。IBM-DB2-HADR、IBM-INFORMIX-HDR、ORACLE-ORACLE-DATA GUARD等。
3)操作系統(tǒng)使用集群軟件、站點(diǎn)遷移軟件、數(shù)據(jù)復(fù)制軟件:IBM-HACMP、VARITAS-Global Cluster Manager等。
4)硬件層使用同步的數(shù)據(jù)復(fù)制:IBM-ESS-PPRC、IBM-DS4000-RM、EMC-SRDF 或使用帶有CONSISTANCY-GROUP功能的異步數(shù)據(jù)復(fù)制IBM-ESS-PPRC、IBM-DS4000-RM。
7層:解決方案與具體業(yè)務(wù)相結(jié)合,實(shí)現(xiàn)自主管理(Highly Automated , Bussiness Integrated Solution)
7層災(zāi)難恢復(fù)方案在第6層的基礎(chǔ)上,集成了自主管理的功能。在保證數(shù)據(jù)一致性的同時(shí),又增加了應(yīng)用的自動(dòng)恢復(fù)能力,使得系統(tǒng)和應(yīng)用恢復(fù)的速度更快、更可靠(按照災(zāi)難恢復(fù)流程,手工操作也可實(shí)現(xiàn)整個(gè)恢復(fù)過(guò)程)。
7層可以實(shí)現(xiàn)0數(shù)據(jù)丟失率,同時(shí)保證數(shù)據(jù)立即自動(dòng)地被傳輸?shù)交謴?fù)中心。7層被認(rèn)為是災(zāi)難恢復(fù)的最高級(jí)別,在本地和遠(yuǎn)程的所有數(shù)據(jù)被更新的同時(shí),利用了雙重在線存儲(chǔ)和完全的網(wǎng)絡(luò)切換能力。7層是災(zāi)難恢復(fù)中最昂貴的方式,但也是速度最快的恢復(fù)方式。當(dāng)一個(gè)工作中心發(fā)生災(zāi)難時(shí),7層能夠提供一定程度的跨站點(diǎn)動(dòng)態(tài)負(fù)載平衡和自動(dòng)系統(tǒng)故障切換功能。現(xiàn)在已經(jīng)證明,為實(shí)現(xiàn)有效的災(zāi)難恢復(fù),無(wú)需人工介入的自動(dòng)站點(diǎn)故障切換功能需要一個(gè)應(yīng)該納入考慮范圍的重要事項(xiàng)。
3.3如何選擇最優(yōu)的災(zāi)難恢復(fù)方案
在選擇解決方案時(shí),非常重要的一點(diǎn)是,解決方案所需的投資在IT商業(yè)價(jià)值中應(yīng)占切實(shí)可行的部分,任何人都希望用較少的投資換取更多的利益--災(zāi)難恢復(fù)解決方案的投資一定要少于災(zāi)難本身帶來(lái)的財(cái)政損失。
按照下述目標(biāo),為一個(gè)商業(yè)應(yīng)用選擇解決方案時(shí),決定起來(lái)就會(huì)簡(jiǎn)單:
(按用戶的投入、希望恢復(fù)的速度等目標(biāo)來(lái)選擇,災(zāi)難恢復(fù)越快所需的投入就越多)* 恢復(fù)時(shí)間目標(biāo)(RTO – Recovery Time Objective)沒(méi)有應(yīng)用系統(tǒng),可以忍受多長(zhǎng)時(shí)間?
* 恢復(fù)時(shí)間點(diǎn)目標(biāo)(RPO – Recovery Point Objective)系統(tǒng)恢復(fù)后,可以允許重新創(chuàng)建多少數(shù)據(jù)?
* 降級(jí)操作目標(biāo)(DOO – Degraded Operations Objective)數(shù)據(jù)中心減少了,會(huì)有什么負(fù)面影響?
* 網(wǎng)絡(luò)恢復(fù)目標(biāo)(NRO – Network Recovery objective)網(wǎng)絡(luò)切換需要多長(zhǎng)時(shí)間?
通常,構(gòu)成應(yīng)用業(yè)務(wù)連續(xù)可用性的因素只適用于同一機(jī)房?jī)?nèi)的環(huán)境。機(jī)房本身就是一個(gè)單點(diǎn)故障。為了抵抗災(zāi)難,我們必須選擇一種比連續(xù)可用性考慮更多的恢復(fù)方案。
恢復(fù)方案一定是在全面衡量了實(shí)施費(fèi)用、維護(hù)費(fèi)用、災(zāi)難對(duì)財(cái)政的影響,并對(duì)業(yè)務(wù)影響進(jìn)行了分析后而得出的一個(gè)綜合方案。
3.3.1四個(gè)關(guān)鍵目標(biāo)
每一層災(zāi)難恢復(fù)方案的恢復(fù)時(shí)間通常是指恢復(fù)處理業(yè)務(wù)服務(wù)所需的安裝時(shí)間。然而在現(xiàn)實(shí)的災(zāi)難中,需要對(duì)其他更多的事項(xiàng)進(jìn)行考慮。例如,有些業(yè)務(wù)可以容忍較長(zhǎng)時(shí)間的停機(jī)服務(wù),但要求一旦業(yè)務(wù)開始就需要使用最多的實(shí)時(shí)數(shù)據(jù);有些業(yè)務(wù)必須在盡可能短的時(shí)間內(nèi)恢復(fù)服務(wù),而不考慮數(shù)據(jù)的實(shí)時(shí)性;還有一些既需要最短的時(shí)間內(nèi)恢復(fù)服務(wù),也需要最多的實(shí)時(shí)數(shù)據(jù)。
通過(guò)評(píng)估具體場(chǎng)地的實(shí)際災(zāi)難恢復(fù)需求,為恢復(fù)計(jì)劃開好頭。
3.3.2方案成本與業(yè)務(wù)停止帶來(lái)的損失
災(zāi)難恢復(fù)方案的成本是根據(jù)以下兩點(diǎn)得出的: * 客戶需要在多快的時(shí)間內(nèi)恢復(fù)數(shù)據(jù) * 不能繼續(xù)業(yè)務(wù)處理將帶來(lái)多少損失
恢復(fù)數(shù)據(jù)所需的時(shí)間越少,業(yè)務(wù)處理服務(wù)中斷的時(shí)間就越短,所需的方案成本就越多。
另一方面,不能進(jìn)行業(yè)務(wù)處理的時(shí)間越長(zhǎng),由此帶來(lái)的損失就越大。
最優(yōu)的方案就是,方案成本曲線和業(yè)務(wù)停止帶來(lái)的損失的曲線的交集。成本/時(shí)間窗口。
3.3.3與系統(tǒng)體系結(jié)構(gòu)的關(guān)系
為了災(zāi)難保護(hù),需要建立一個(gè)可靠并經(jīng)過(guò)驗(yàn)證的基礎(chǔ)結(jié)構(gòu),系統(tǒng)的每一級(jí)部件都一定要有冗余,這是必須的。
存儲(chǔ)設(shè)備級(jí)(Storage Device Level)
存儲(chǔ)設(shè)備級(jí),是指存儲(chǔ)的物理實(shí)體,如磁盤或磁帶機(jī)。為了實(shí)現(xiàn)設(shè)備級(jí)的可用性,使用嵌入在設(shè)備自身中的功能,這些冗余功能可通過(guò)在磁盤中使用備用磁道或在磁帶機(jī)中使用特定的寫機(jī)制來(lái)實(shí)現(xiàn)。
存儲(chǔ)服務(wù)器(存儲(chǔ)子系統(tǒng))控制器級(jí)
存儲(chǔ)控制器自身的接口用于連接SAN或服務(wù)器(Servers)和存儲(chǔ)設(shè)備。存儲(chǔ)控制器的內(nèi)置功能負(fù)責(zé)所有與存儲(chǔ)相關(guān)的執(zhí)行操作。
* 內(nèi)置的拷貝功能,如Point-in-Time 拷貝,遠(yuǎn)程鏡像 * 內(nèi)置高可用性機(jī)制(冗余、接管Fail over)
SAN(Storage Area Network)級(jí)
SAN級(jí)的冗余可通過(guò)冗余SAN的基本模塊--SAN交換機(jī)或使用導(dǎo)向器(Director)來(lái)實(shí)現(xiàn)。SAN交換機(jī)和導(dǎo)向器的主要區(qū)別在于可維護(hù)性和可用性。導(dǎo)向器類的產(chǎn)品可以在不中斷服務(wù)的同時(shí),在線進(jìn)行Microcode/Firmware的升級(jí)。在出現(xiàn)硬件故障時(shí),導(dǎo)向器通常只需更換一個(gè)部件。
操作系統(tǒng)中設(shè)備驅(qū)動(dòng)程序級(jí)
設(shè)備驅(qū)動(dòng)程序是存儲(chǔ)設(shè)備,服務(wù)器的操作系統(tǒng)和主機(jī)適配卡之間溝通的橋梁,它負(fù)責(zé)實(shí)施與操作系統(tǒng)中所展示的全部硬件功能相關(guān)的操作,并負(fù)責(zé)與存儲(chǔ)設(shè)備之間的通訊,如光纖通道環(huán)境中多路徑和通道接管功能。
操作系統(tǒng)級(jí)
在操作系統(tǒng)級(jí),通過(guò)使用群集技術(shù)可以實(shí)現(xiàn)操作系統(tǒng)級(jí)的高可用性,如 HACMP for AIX,STEELEYE for LINUX 和 Microsoft Windows Clustering。可以考慮將群集技術(shù)作為災(zāi)難保護(hù)的一部分。在災(zāi)難保護(hù)方案中群集本身不代表基礎(chǔ)設(shè)施。
應(yīng)用級(jí)
要想在應(yīng)用級(jí)實(shí)現(xiàn)冗余,在很大程度上依賴于應(yīng)用的類型。如在三層的SAN環(huán)境中,通過(guò)使用多個(gè)應(yīng)用服務(wù)器(Multi Application Server),應(yīng)用層可以做到高可用性。如果任何服務(wù)器發(fā)生故障,加在其上的負(fù)載就會(huì)被重新分布到其他運(yùn)行中的服務(wù)器上,業(yè)務(wù)可繼續(xù)進(jìn)行。
功能級(jí)
功能級(jí)是系統(tǒng)整體架構(gòu)中最重要的一級(jí),它依賴以下級(jí)的可用性: * IT基礎(chǔ)設(shè)施架構(gòu)的可用性(操作系統(tǒng)+服務(wù)器+存儲(chǔ)+網(wǎng)絡(luò))* 應(yīng)用的可用性(應(yīng)用+數(shù)據(jù))+IT基礎(chǔ)設(shè)施架構(gòu)的可用性 * 業(yè)務(wù)流程的可用性(應(yīng)用的可用性+外部相關(guān)條件)
在規(guī)劃災(zāi)難保護(hù)的功能級(jí)時(shí)必須包括所有外在因素,如不同企業(yè)間的相互協(xié)作等。
第四章 容災(zāi)系統(tǒng)的設(shè)計(jì)過(guò)程
災(zāi)難恢復(fù)計(jì)劃描述 | 災(zāi)難恢復(fù)計(jì)劃項(xiàng)目階段 | 數(shù)據(jù)收集和關(guān)鍵需求分析階段 | 風(fēng)險(xiǎn)分析階段 | 數(shù)據(jù)保護(hù)階段 | 恢復(fù)階段 | 測(cè)試和培訓(xùn)階段 | 維護(hù)和修改階段 | 選擇災(zāi)難恢復(fù)方案的步驟介紹
容災(zāi)方案的制定是一個(gè)系統(tǒng)的過(guò)程,包含一系列的工作及計(jì)劃的制訂,包括Business Continuity Planning(BCP),Business Recovery Plan(BRP),Continuity of Operations Plan(COOP),Incident Response Plan(IRP),Occupant Emergency Plan(OEP),Disaster Recovery Plan(DRP)等計(jì)劃,在此我們主要介紹災(zāi)難恢復(fù)計(jì)劃(Disaster Recovery Plan 或 DRP)的制訂過(guò)程及方法
相比于其它機(jī)構(gòu)和領(lǐng)域,IT系統(tǒng)更容易受到各種災(zāi)難的傷害而導(dǎo)致中斷,特別是在許多情況下,關(guān)鍵資源可能屬于不可控范圍(如電力和電信),于是有效的災(zāi)難恢復(fù)計(jì)劃、履行計(jì)劃和對(duì)計(jì)劃進(jìn)行有效地測(cè)試對(duì)于削減系統(tǒng)風(fēng)險(xiǎn)與各種服務(wù)的不可用性就顯得非常重要了。為了保證災(zāi)難恢復(fù)計(jì)劃的成功,管理者應(yīng)該做到以下幾點(diǎn):
1.理解災(zāi)難恢復(fù)計(jì)劃的全部過(guò)程及其在整個(gè)運(yùn)行連續(xù)性計(jì)劃和業(yè)務(wù)連續(xù)性計(jì)劃過(guò)程中的地位。2.制定或復(fù)查其應(yīng)急策略及計(jì)劃過(guò)程并運(yùn)用計(jì)劃周期要素,包括預(yù)備計(jì)劃、業(yè)務(wù)影響分析、備用站點(diǎn)選擇和恢復(fù)策略。
3.制定和復(fù)查其災(zāi)難恢復(fù)計(jì)劃策略,重點(diǎn)在于計(jì)劃的維護(hù)、培訓(xùn)以及對(duì)應(yīng)急計(jì)劃的演練。4.1災(zāi)難恢復(fù)計(jì)劃描述
簡(jiǎn)單地講,災(zāi)難恢復(fù)計(jì)劃的重點(diǎn)在于IT的恢復(fù),如系統(tǒng)、應(yīng)用、數(shù)據(jù)和相關(guān)的設(shè)施(如網(wǎng)絡(luò)等)。災(zāi)備的主要目標(biāo)是在事件發(fā)生時(shí),能夠保證全部或部分計(jì)算機(jī)服務(wù)的持續(xù)可用。災(zāi)難恢復(fù)計(jì)劃就是指,在災(zāi)難發(fā)生時(shí)需要采取的響應(yīng)步驟的詳細(xì)過(guò)程。
災(zāi)難恢復(fù)計(jì)劃包含了一系列災(zāi)難發(fā)生前、過(guò)程中和災(zāi)難發(fā)生后所采取的動(dòng)作,災(zāi)備方案計(jì)劃書應(yīng)該文檔化,并經(jīng)過(guò)充分的測(cè)試,以保證災(zāi)難處理過(guò)程中各種操作的連續(xù)性和關(guān)鍵資源的可用性。
根據(jù)災(zāi)難發(fā)生的時(shí)段或業(yè)務(wù)中斷的嚴(yán)重程度的不同,一個(gè)企業(yè)的生存能力也依賴于管理層重建其關(guān)鍵業(yè)務(wù)的能力。一般來(lái)講,這些業(yè)務(wù)功能的重建需要幾年的時(shí)間。但是,對(duì)于管理層,必須在幾個(gè)小時(shí)或幾天的時(shí)間內(nèi)重建,確實(shí)是一個(gè)難題。重建復(fù)雜的商業(yè)環(huán)境要求有一個(gè)經(jīng)過(guò)慎重考慮且具體的計(jì)劃,以備在災(zāi)難發(fā)生時(shí)執(zhí)行。從這份計(jì)劃中我們可以看到,為恢復(fù)初始環(huán)境,在重建過(guò)程中應(yīng)該采取的步驟。
在一個(gè)組織中,災(zāi)難的發(fā)生是不可預(yù)測(cè)的。對(duì)客戶而言,最想知道的事情是災(zāi)難什么時(shí)候發(fā)生。系統(tǒng)和工作人員可以應(yīng)對(duì)災(zāi)難,并對(duì)可預(yù)知的災(zāi)難進(jìn)行反應(yīng)是最終的目標(biāo)。換句話說(shuō),災(zāi)難發(fā)生時(shí),不需要等待,而只需要確定你的計(jì)劃是否可行。
災(zāi)難發(fā)生時(shí),客戶、供應(yīng)商和員工通常會(huì)關(guān)心中央處理設(shè)備的停機(jī)時(shí)間。在這種情況下,這些人都沒(méi)有什么過(guò)分的要求,只關(guān)心停機(jī)的等待時(shí)間,而停機(jī)時(shí)間的多少則依賴于災(zāi)難恢復(fù)方案。通常,這種停機(jī)時(shí)間可以分為以下兩個(gè)部分: a)服務(wù)丟失
表示從災(zāi)難發(fā)生到系統(tǒng)恢復(fù)正常所損失的時(shí)間。b)數(shù)據(jù)丟失
表示用戶數(shù)據(jù)的丟失,也就是說(shuō),系統(tǒng)恢復(fù)到災(zāi)難發(fā)生前的數(shù)據(jù)層面,要花費(fèi)多少時(shí)間可以重新工作。
一個(gè)組織的大部分收入,如果過(guò)分的依賴于生產(chǎn)系統(tǒng),一旦應(yīng)用和網(wǎng)絡(luò)停機(jī),則將會(huì)造成巨額收入的損失。在不同的行業(yè),如果以小時(shí)為單位計(jì)算收入損失,因?yàn)?zāi)難而造成的收入減少也是不同的,如能源、電信、制造行業(yè)和金融部門,造成巨額收入的損失并不驚奇。另外,實(shí)際收入損失所占的百分比也和運(yùn)營(yíng)的關(guān)鍵業(yè)務(wù)有關(guān)系
總之,災(zāi)備計(jì)劃就是要保證災(zāi)難發(fā)生后,能及時(shí)地按照一定的策略、過(guò)程和技術(shù)等方法迅速恢復(fù)IT系統(tǒng)、操作和數(shù)據(jù)。4.2災(zāi)難恢復(fù)計(jì)劃項(xiàng)目階段
如何制訂災(zāi)難恢復(fù)計(jì)劃,前面的章節(jié)中(參看3.1節(jié) 業(yè)務(wù)連續(xù)性)給出了指導(dǎo)性的建議步驟。上述步驟中,每一步都包含了相關(guān)方面的各項(xiàng)內(nèi)容。實(shí)際上,在制定災(zāi)難恢復(fù)計(jì)劃時(shí),我們可以將這些步驟細(xì)化為下圖的操作流程。在下圖的流程中,包含了災(zāi)難恢復(fù)計(jì)劃的各個(gè)階段,并直觀的告訴我們,災(zāi)難恢復(fù)計(jì)劃的制定是一個(gè)循環(huán)往復(fù)的過(guò)程。
圖1.災(zāi)備計(jì)劃不同階段圖表
對(duì)上圖的簡(jiǎn)單分析如下,更詳細(xì)的內(nèi)容,將在以下的章節(jié)中給出:
1)項(xiàng)目啟動(dòng)及項(xiàng)目組的選擇
此階段包括取得管理層的正式同意、選擇項(xiàng)目協(xié)調(diào)人員和項(xiàng)目組成員、信息收集方式的標(biāo)準(zhǔn)化以及項(xiàng)目資源的調(diào)度等方面的內(nèi)容。2)數(shù)據(jù)收集和需求分析
此階段包括收集業(yè)務(wù)過(guò)程的信息、技術(shù)基礎(chǔ)架構(gòu)的支撐環(huán)境、潛在的停機(jī)費(fèi)用消耗、災(zāi)難類型以及其它公司使用的相應(yīng)技術(shù)和策略等方面的內(nèi)容。3)風(fēng)險(xiǎn)分析
在風(fēng)險(xiǎn)分析階段,我們將對(duì)為達(dá)到災(zāi)難恢復(fù)計(jì)劃的設(shè)定目標(biāo)收集的數(shù)據(jù)進(jìn)行處理,以便對(duì)風(fēng)險(xiǎn)以及在可接受的時(shí)間范圍內(nèi)恢復(fù)所需要的資源有較深的理解。
作為風(fēng)險(xiǎn)分析的結(jié)果之一,災(zāi)難防范技術(shù)的實(shí)施可以幫助我們防止可以避免的災(zāi)難。比如:火災(zāi)的偵測(cè)和防止,不間斷電源系統(tǒng)等。4)數(shù)據(jù)保護(hù)
數(shù)據(jù)保護(hù)是災(zāi)難恢復(fù)計(jì)劃中的關(guān)鍵模塊。必須清晰、完整地表述出各類數(shù)據(jù)(記錄、膠片、電子及光學(xué)數(shù)據(jù)等)的保護(hù)方法。5)恢復(fù)計(jì)劃
恢復(fù)計(jì)劃是指對(duì)意外事件所采取的策略及明確的規(guī)劃。如替代的系統(tǒng)、網(wǎng)絡(luò)和終端用戶。6)培訓(xùn)和測(cè)試
培訓(xùn)和計(jì)劃性的測(cè)試可以對(duì)所設(shè)計(jì)的災(zāi)難恢復(fù)策略進(jìn)行測(cè)試,并且提供了一種可以對(duì)災(zāi)難恢復(fù)計(jì)劃中的不足方面進(jìn)行發(fā)現(xiàn)和修改的手段。7)計(jì)劃的維護(hù)管理
計(jì)劃的維護(hù)管理提供了一種機(jī)制,可以使災(zāi)難恢復(fù)計(jì)劃隨著業(yè)務(wù)和IT系統(tǒng)架構(gòu)的改變而改變。下面我們對(duì)各個(gè)階段給出較詳細(xì)的解釋。
項(xiàng)目啟動(dòng)和項(xiàng)目組選擇的階段可細(xì)分為以下幾個(gè)主要組成部分: 1 最高管理層的承諾
企業(yè)的最高管理層必須支持且參與計(jì)劃的制定和協(xié)調(diào),以確保災(zāi)難恢復(fù)計(jì)劃在本公司內(nèi)的有效作用。制定一個(gè)有效的計(jì)劃,必須要有時(shí)間和資源的保證,時(shí)間就是計(jì)劃的制定所需要的時(shí)間,而資源則包括預(yù)算和人力。2 建立計(jì)劃制定委員會(huì)
計(jì)劃制定委員會(huì)負(fù)責(zé)監(jiān)控計(jì)劃的制定和實(shí)施,由公司各個(gè)部門的代表組成,關(guān)鍵的委員會(huì)成員應(yīng)當(dāng)包括業(yè)務(wù)運(yùn)營(yíng)經(jīng)理和數(shù)據(jù)處理部門經(jīng)理。委員會(huì)還應(yīng)當(dāng)定義計(jì)劃的適用范圍。委員會(huì)的另一個(gè)職責(zé)是定期把項(xiàng)目信息通知給最高管理層,因?yàn)檫@是一個(gè)比較敏感的主題,可能需要花費(fèi)較多的人力和財(cái)力,這些都需要最高管理層來(lái)支持。3 范圍
盡管大多數(shù)災(zāi)難恢復(fù)計(jì)劃只包含數(shù)據(jù)處理相關(guān)的項(xiàng)目,但是一個(gè)復(fù)雜的計(jì)劃也包含數(shù)據(jù)處理以外的操作領(lǐng)域,如果同時(shí)考慮到災(zāi)難的其它方面,災(zāi)備計(jì)劃涉及的范圍是相當(dāng)廣泛的。4 假定
制定計(jì)劃要考慮的最基本問(wèn)題就是設(shè)想最壞的場(chǎng)景。對(duì)運(yùn)營(yíng)系統(tǒng)而言,最壞的場(chǎng)景就是主要設(shè)備的損壞。計(jì)劃的制定就是基于這樣一個(gè)前提,每一個(gè)災(zāi)難恢復(fù)計(jì)劃都基于一組假定的設(shè)想。這些假定對(duì)計(jì)劃所涉及的環(huán)境做了限制,這些限制定義了公司準(zhǔn)備接受的災(zāi)難量級(jí),它們可以通過(guò)以下問(wèn)題來(lái)識(shí)別:
a)哪些設(shè)備被破壞 b)中斷的時(shí)間是多少
c)哪些記錄、文件和資料需要保護(hù) d)災(zāi)難發(fā)生時(shí),哪些資源是可用的 1)員工 2)設(shè)備 3)通訊 4)傳輸 5)后備場(chǎng)地
在制定災(zāi)難恢復(fù)計(jì)劃時(shí),可以借鑒以下典型的假定: a)公司主要的生產(chǎn)設(shè)備被破壞
b)擁有在可以執(zhí)行計(jì)劃之內(nèi)的關(guān)鍵性功能的員工
c)員工可以被通知到,并且可以到備份地點(diǎn)執(zhí)行關(guān)鍵性的恢復(fù)和 重建工作
d)災(zāi)難恢復(fù)計(jì)劃是可用的
e)部分計(jì)劃可用于恢復(fù)相應(yīng)的環(huán)境中斷 f)備份設(shè)備是可用的
g)在異地或別的設(shè)備中保存有足夠多的備份 h)備份地點(diǎn)可以處理公司的工作 i)公司本地和遠(yuǎn)端的通訊鏈路是可用的 j)本地基本的傳輸是可用的
k)災(zāi)難發(fā)生時(shí),供應(yīng)商應(yīng)根據(jù)承諾對(duì)公司提供支持
以上的假定并不包含全部可能性,但在計(jì)劃制定的開始階段可供大家參考。5 項(xiàng)目組及其責(zé)任 災(zāi)難恢復(fù)計(jì)劃可以按照組的形式來(lái)制定,特定的任務(wù)可以分配給特定的組。意外發(fā)生時(shí)的公司架構(gòu)可能與現(xiàn)有的架構(gòu)有所不同,那時(shí)通常是以組為基礎(chǔ),不同的組負(fù)責(zé)不同的功能領(lǐng)域,這些組可能包括: a)管理組 b)業(yè)務(wù)恢復(fù)組 c)部門恢復(fù)組 d)計(jì)算機(jī)恢復(fù)組 e)損壞評(píng)估組 f)安全組 g)設(shè)備支持組 h)后勤支持組 i)行政支持組 j)用戶支持組 k)計(jì)算機(jī)備份組 l)異地?cái)?shù)據(jù)存儲(chǔ)組 m)軟件組 n)通訊組 o)應(yīng)用組 p)人力資源組 q)市場(chǎng)和客戶關(guān)系組
企業(yè)并不需要建立以上所有的這些組,但我們強(qiáng)烈建議與上述的每個(gè)組相關(guān)聯(lián)的功能都能被包含在其中。
根據(jù)員工的技能和領(lǐng)導(dǎo)能力,可以將其選入不同的組。一般來(lái)講,各組的成員所擁有的技能應(yīng)與其平時(shí)的工作相一致。例如,服務(wù)器恢復(fù)組的成員應(yīng)當(dāng)包含系統(tǒng)管理員。組成員不僅要知道計(jì)劃的目的,而且要知道執(zhí)行恢復(fù)策略的過(guò)程。考慮到可能會(huì)聯(lián)系不到某些成員的情況,成員的組建應(yīng)基于―互有備份‖的原則。同樣,成員也應(yīng)當(dāng)了解其它組的目的和執(zhí)行過(guò)程。
每一個(gè)組由組長(zhǎng)領(lǐng)導(dǎo),組長(zhǎng)要負(fù)責(zé)本組的運(yùn)行,承擔(dān)同其它組的協(xié)調(diào)工作,向組員及時(shí)傳達(dá)需要的信息,并在組內(nèi)做決定。另外,如果組長(zhǎng)不能行使其職能,必須指定代理組長(zhǎng)。在災(zāi)難恢復(fù)計(jì)劃中,最重要的組是管理組。他們?cè)谑鹿拾l(fā)生時(shí)負(fù)責(zé)協(xié)調(diào)所有組的工作。管理組一般由高級(jí)管理經(jīng)理負(fù)責(zé),如CIO。
以下是各個(gè)組的主要職能: a)負(fù)責(zé)計(jì)劃的執(zhí)行
b)促進(jìn)與其它組之間的交流,監(jiān)督計(jì)劃的測(cè)試和執(zhí)行 c)所有或是某一個(gè)成員可能領(lǐng)導(dǎo)特定的組 d)協(xié)調(diào)恢復(fù)過(guò)程
e)評(píng)估災(zāi)難,執(zhí)行恢復(fù)計(jì)劃,聯(lián)系組長(zhǎng) f)監(jiān)控并記錄恢復(fù)的過(guò)程
g)是最終決定優(yōu)先級(jí)設(shè)置、各種政策和過(guò)程的人
4.3數(shù)據(jù)收集和關(guān)鍵需求分析階段
要確定一個(gè)企業(yè)的關(guān)鍵性需求,每個(gè)部門應(yīng)該將本部門執(zhí)行的功能文檔化,經(jīng)過(guò)一定的分析來(lái)確認(rèn)部門內(nèi)部和外部的主要職能。
部門的日操作記錄可以對(duì)確定關(guān)鍵性需求起到輔助作用。以下是一些輔助問(wèn)題:
1)如果災(zāi)難發(fā)生而沒(méi)有現(xiàn)有的設(shè)備和部門架構(gòu),部門能運(yùn)轉(zhuǎn)多長(zhǎng)時(shí)間?
2)在部門內(nèi),什么任務(wù)的優(yōu)先級(jí)最高?(包括關(guān)鍵的手工功能和處理)這些任務(wù) 被執(zhí)行的頻率是多少?如每天、每星期或每月等。
3)執(zhí)行最高級(jí)別的任務(wù),需要那些人力、設(shè)備、和供應(yīng)等? 4)對(duì)于關(guān)鍵的設(shè)備及供應(yīng),在災(zāi)難的環(huán)境中應(yīng)如何替換? 5)上述這些關(guān)鍵信息的替換需要多長(zhǎng)時(shí)間?
6)部門內(nèi)有沒(méi)有可供參考的手冊(cè)和操作步驟?災(zāi)難發(fā)生時(shí)這些是如何替換的? 7)任何供應(yīng)、設(shè)備和操作過(guò)程或手冊(cè)等,有沒(méi)有在異地存放?
8)確定原始文檔的存儲(chǔ)設(shè)備和安全性。在災(zāi)難的時(shí)間中,這些信息如何被替代?有沒(méi)有更多的地方來(lái)保存?
9)當(dāng)前計(jì)算機(jī)的備份過(guò)程是什么?如何恢復(fù)備份?任何關(guān)鍵的備份拷貝有沒(méi)有在異地存放? 10)在災(zāi)難發(fā)生后,臨時(shí)性的操作步驟是什么? 11)一個(gè)部門的運(yùn)轉(zhuǎn)中斷,對(duì)其它的部門有什么影響? 12)依賴于正常運(yùn)轉(zhuǎn)的企業(yè)以外的服務(wù)商和供應(yīng)商有哪些? 13)有沒(méi)有經(jīng)過(guò)跨部門培訓(xùn)的人員? 14)誰(shuí)負(fù)責(zé)維護(hù)部門的異常計(jì)劃? 15)災(zāi)難恢復(fù)計(jì)劃有沒(méi)有其它的考慮?
在上述問(wèn)題的基礎(chǔ)上,我們列出了以下需要進(jìn)行文檔化的信息:備份地址列表,關(guān)鍵電話號(hào)碼記錄,通訊目錄,分發(fā)記錄,文檔目錄,設(shè)備目錄,表格目錄,保險(xiǎn)政策目錄,主要的計(jì)算機(jī)硬件目錄,主要客戶列表,主要供應(yīng)商列表,計(jì)算機(jī)硬件和軟件列表,通知列表,辦公用品供應(yīng)列表,異地存儲(chǔ)地址列表,軟件和數(shù)據(jù)文件備份和調(diào)度,電話目錄等資料和文檔。
關(guān)鍵性需求可以通過(guò)問(wèn)卷的方式來(lái)獲得,問(wèn)卷主要是將每個(gè)部門的關(guān)鍵性工作記錄在案,并找出最小的必備資源,如人力、設(shè)備、供應(yīng)商、文檔等資源。
確定了各部門的關(guān)鍵性需求并將其文檔化以后,管理層就可以為各部門在整個(gè)企業(yè)的災(zāi)難恢復(fù)過(guò)程中設(shè)置優(yōu)先級(jí)別。每一個(gè)部門的操作可以按照下面的方式給出優(yōu)先級(jí):
1)基本操作(必需):服務(wù)中斷超過(guò)一天,將嚴(yán)重地危害到公司的運(yùn)轉(zhuǎn)。2)推薦操作(關(guān)鍵):服務(wù)中斷超過(guò)一個(gè)禮拜,將嚴(yán)重的危害到公司的運(yùn)轉(zhuǎn)。
3)其它操作(非關(guān)鍵):這些信息的存在可以方便業(yè)務(wù)操作,如果 一旦丟失也不會(huì) 影響到業(yè)務(wù)的正常運(yùn)轉(zhuǎn)。
根據(jù)RTO和RPO的不同,各公司采取的策略也會(huì)有所不同。以下是一些通用的標(biāo)準(zhǔn),可以根據(jù)這些標(biāo)準(zhǔn)將應(yīng)用進(jìn)行分級(jí):
1)必需:從停機(jī)算起,RTO<8小時(shí),RPO在15分鐘以內(nèi) 2)關(guān)鍵:從停機(jī)算起,RTO<72小時(shí),RPO從停機(jī)的那一天開始 3)非關(guān)鍵:從停機(jī)算起,RTO<168小時(shí),RPO48小時(shí)以內(nèi)
4.4風(fēng)險(xiǎn)分析階段
計(jì)劃小組負(fù)責(zé)準(zhǔn)備風(fēng)險(xiǎn)管理的流程和業(yè)務(wù)影響的分析(Business Impact Analysis)。它們包括一定范圍內(nèi)的災(zāi)害,如自然、技術(shù)或人為的災(zāi)害。
針對(duì)于幾種假定的災(zāi)難設(shè)想,企業(yè)的每一個(gè)職能領(lǐng)域都應(yīng)當(dāng)分析和判斷相應(yīng)的潛在結(jié)果和影響,在風(fēng)險(xiǎn)分析階段還將評(píng)估關(guān)鍵文檔和重要記錄的安全性。
在多樣的中斷過(guò)程中,IT系統(tǒng)更容易受到損害。作為企業(yè)風(fēng)險(xiǎn)管理的一部分,有些風(fēng)險(xiǎn)是可以通過(guò)技術(shù)、管理和操作執(zhí)行方案來(lái)避免的,但不可能避免所有的風(fēng)險(xiǎn)。災(zāi)難恢復(fù)計(jì)劃就是一種用來(lái)彌補(bǔ)這些風(fēng)險(xiǎn)管理和安全操作不能涉及的災(zāi)難的高可用性方案。由此看來(lái),災(zāi)難恢復(fù)計(jì)劃可以提供一種緊急事件發(fā)生后的快速恢復(fù)手段。
4.4.1風(fēng)險(xiǎn)管理過(guò)程
風(fēng)險(xiǎn)管理過(guò)程范圍廣泛,包括確定、控制和減輕IT系統(tǒng)的潛在風(fēng)險(xiǎn)。從風(fēng)險(xiǎn)管理的行為分析,可以分為兩個(gè)大的主要功能:
1)通過(guò)減少或消除風(fēng)險(xiǎn),進(jìn)而避免或減少破壞性的事件。這些措施主要是對(duì)從自然、人為和技術(shù)方面的威脅進(jìn)行的安全控制,從而減少或消除風(fēng)險(xiǎn)。
2)降低或限制災(zāi)難對(duì)系統(tǒng)造成的后果。主要措施是預(yù)估可能的事件,并在相應(yīng)的事件 發(fā)生后采取相應(yīng)措施,建立基本的災(zāi)難恢復(fù)計(jì)劃。
下圖示意了預(yù)先采取安全控制和災(zāi)難恢復(fù)計(jì)劃實(shí)施的事件間流程:
4.4.2商業(yè)影響分析
商業(yè)風(fēng)險(xiǎn)分析是災(zāi)難恢復(fù)計(jì)劃過(guò)程中的重要步驟,隸屬于風(fēng)險(xiǎn)分析階段。這一過(guò)程集中分析系統(tǒng)需求、過(guò)程及其內(nèi)部的依賴關(guān)系,并使用這些信息判斷可能意外發(fā)生的事件及其優(yōu)先級(jí),圖示為風(fēng)險(xiǎn)分析的示例過(guò)程:
上圖的示例分為三個(gè)過(guò)程: 1)確定關(guān)鍵資源
2)確定中斷的影響及允許的停機(jī)時(shí)間 3)設(shè)計(jì)恢復(fù)的優(yōu)先級(jí)
4.4.3建立可靠的系統(tǒng)
業(yè)務(wù)恢復(fù)計(jì)劃的目的是保證員工和設(shè)備在災(zāi)難發(fā)生過(guò)程中的安全。風(fēng)險(xiǎn)分析的主要目的之一是確定在任何時(shí)候應(yīng)采取的正確防范措施。對(duì)災(zāi)難的防范和準(zhǔn)備工作應(yīng)從企業(yè)的最高管理層開始,管理層的支持體現(xiàn)在對(duì)先進(jìn)的安全和風(fēng)險(xiǎn)防范技術(shù)的選擇,以及對(duì)未知風(fēng)險(xiǎn)的準(zhǔn)備等方面。災(zāi)難預(yù)防技術(shù)包含兩個(gè)方面:流程方面的預(yù)防和物理方面的預(yù)防。流程方面的預(yù)防
流程方面的預(yù)防與日常的操作相關(guān),主要是操作規(guī)則的定義,相關(guān)主題為安全和恢復(fù)。流程防范是同每一個(gè)員工的行為相聯(lián)系的,公司為每一個(gè)員工分配相應(yīng)的職責(zé)。流程防范的目標(biāo)是針對(duì)于不同的災(zāi)難類型定義相應(yīng)的操作,并使得這些操作成為規(guī)則 物理方面的預(yù)防
從場(chǎng)所的建造就開始為災(zāi)害做準(zhǔn)備,包括為建筑物配備特殊設(shè)備。如為不同的設(shè)備配置火災(zāi)保護(hù)。這些特殊的考慮包括:計(jì)算機(jī)區(qū)域設(shè)置,火災(zāi)偵測(cè)裝置和滅火裝置,記錄保護(hù),空調(diào)設(shè)備,熱敏和通風(fēng)設(shè)備,電子供應(yīng)系統(tǒng)和UPS系統(tǒng),雙路電源保護(hù),突發(fā)事件過(guò)程和檔案系統(tǒng)。
4.5 數(shù)據(jù)保護(hù)階段
數(shù)據(jù)保護(hù)是指在公司內(nèi)部為保護(hù)公司資產(chǎn)、確保記錄的準(zhǔn)確性和可靠性以及操作的有效性而采取的措施??梢詮穆男斜kU(xiǎn)和分類記錄各種信息兩個(gè)方面來(lái)考慮。
4.6 恢復(fù)階段
恢復(fù)計(jì)劃是一種主要考慮在災(zāi)難發(fā)生后,如何快速有效的恢復(fù)IT系統(tǒng)的策略,策略的制定應(yīng)當(dāng)考慮商業(yè)影響分析中所涉及的風(fēng)險(xiǎn),而且在系統(tǒng)設(shè)計(jì)和實(shí)施的階段中,它與系統(tǒng)的架構(gòu)設(shè)計(jì)相集成。在設(shè)計(jì)恢復(fù)計(jì)劃時(shí),應(yīng)考慮下面的情況: 1)系統(tǒng)恢復(fù)
系統(tǒng)恢復(fù)應(yīng)針對(duì)于關(guān)鍵應(yīng)用主機(jī),如集中式和分布式 2)網(wǎng)絡(luò)恢復(fù)
網(wǎng)絡(luò)恢復(fù)計(jì)劃主要針對(duì)以下方面:
a)關(guān)鍵商業(yè)應(yīng)用系統(tǒng)的內(nèi)部局域網(wǎng)和網(wǎng)絡(luò)設(shè)備的支持 b)外部廣域網(wǎng)和電信服務(wù)
c)待恢復(fù)系統(tǒng)和終端用戶間的通訊 3)啟動(dòng)各災(zāi)難恢復(fù)小組
災(zāi)難恢復(fù)管理組負(fù)責(zé)協(xié)調(diào)恢復(fù)過(guò)程中所涉及的各個(gè)項(xiàng)目組。在異常情況下,準(zhǔn)確快速的決定會(huì)起到關(guān)鍵的作用。管理組將負(fù)責(zé)包括財(cái)務(wù)決定在內(nèi)的所有決定。成功的災(zāi)備計(jì)劃,即使在關(guān)鍵的成員不能工作的情況下,也可以恢復(fù)并維持業(yè)務(wù)的運(yùn)轉(zhuǎn)。4)最終用戶恢復(fù)
最終用戶的恢復(fù)計(jì)劃,在傳統(tǒng)的災(zāi)備計(jì)劃中常常被忽略掉,合理的災(zāi)備計(jì)劃為終端用戶提供了一種可工作的機(jī)制
4.7測(cè)試和培訓(xùn)階段
災(zāi)備計(jì)劃的測(cè)試是災(zāi)備方案準(zhǔn)備過(guò)程中的一個(gè)關(guān)鍵要素。測(cè)試可以暴露災(zāi)難恢復(fù)計(jì)劃的不足之處,測(cè)試也可以幫助我們?cè)u(píng)估計(jì)劃執(zhí)行人員的快速響應(yīng)能力和效率,災(zāi)難恢復(fù)計(jì)劃的每一個(gè)要素都必須測(cè)試,保證其恢復(fù)過(guò)程的準(zhǔn)確性。測(cè)試包含以下幾個(gè)方面: a)從備份磁帶恢復(fù)系統(tǒng)
b)執(zhí)行恢復(fù)計(jì)劃的各項(xiàng)目組之間的協(xié)調(diào) c)內(nèi)部和外部的互連
d)使用備份設(shè)備時(shí)的系統(tǒng)性能 e)正常業(yè)務(wù)操作的恢復(fù)
這里所推薦的測(cè)試過(guò)程是讓災(zāi)難恢復(fù)計(jì)劃的關(guān)鍵人員重復(fù)執(zhí)行災(zāi)難恢復(fù)計(jì)劃,這樣做可以不斷更新文檔,并修補(bǔ)可能的遺漏,以保證即使主要人員休假,災(zāi)難恢復(fù)計(jì)劃也可以執(zhí)行。
培訓(xùn)是對(duì)測(cè)試過(guò)程的補(bǔ)充,主要目的是明確災(zāi)難恢復(fù)計(jì)劃中各成員的責(zé)任,培訓(xùn)內(nèi)容包括: a)計(jì)劃的目的
b)跨項(xiàng)目組的協(xié)調(diào)和溝通 c)匯報(bào)制度的流程 d)安全要求
e)項(xiàng)目組特有的流程 f)成員的責(zé)任 4.8 維護(hù)和修改階段
災(zāi)難恢復(fù)計(jì)劃應(yīng)反映系統(tǒng)的需求、執(zhí)行的流程和規(guī)則。因?yàn)樯虡I(yè)需求、新技術(shù)的不斷升級(jí)以及新的內(nèi)部和外部規(guī)則的變化,IT系統(tǒng)也會(huì)隨之改變。所以,要確保災(zāi)難恢復(fù)計(jì)劃的有效性,就必須定期的檢查和修改計(jì)劃。一般來(lái)說(shuō),當(dāng)每年或當(dāng)計(jì)劃涉及到的內(nèi)容有重大改變時(shí),災(zāi)備計(jì)劃需要作相應(yīng)的檢查,而有些內(nèi)容更需要作頻繁的檢查,如人員的聯(lián)系途徑等。以下是至少需要定期檢查的幾個(gè)方面: a)運(yùn)行環(huán)境要求 b)安全要求 c)技術(shù)程序
d)硬件、軟件和其它的設(shè)備 e)各項(xiàng)目組的成員名稱及聯(lián)系方法 f)關(guān)鍵信息記錄(電子或書面文檔)
4.9選擇災(zāi)難恢復(fù)方案的步驟介紹
本節(jié)主要介紹制訂災(zāi)難恢復(fù)方案的簡(jiǎn)單過(guò)程,僅供參考。
1)按照一定的順序詢問(wèn)特定的問(wèn)題
按照一定的順序,詢問(wèn)一系列與商業(yè)災(zāi)備需求相關(guān)的問(wèn)題,通過(guò)這些問(wèn)題,可以確定災(zāi)備方案的基本環(huán)境、基礎(chǔ)構(gòu)件及期望的恢復(fù)時(shí)間。以下提供一些基本的問(wèn)題,部分問(wèn)題答案的給出需要基于風(fēng)險(xiǎn)評(píng)估和商業(yè)影響的分析。另外一些問(wèn)題則需要運(yùn)營(yíng)部分基于其IT基礎(chǔ)架構(gòu)給出答案: a)哪個(gè)或哪些應(yīng)用需要恢復(fù)? b)應(yīng)用運(yùn)行的平臺(tái)是哪些平臺(tái)? c)期望的RTO是什么? d)災(zāi)備實(shí)施場(chǎng)所之間的距離?
e)連通方式,或者在災(zāi)備地點(diǎn)傳輸數(shù)據(jù)的基礎(chǔ)架構(gòu)的傳輸 方式是什么?帶寬是多少?
f)有沒(méi)有特殊的硬件和軟件的配置需要恢復(fù)? g)RPO是什么?
h)需要恢復(fù)的數(shù)據(jù)量有多少?
i)期望的災(zāi)難恢復(fù)層次(計(jì)劃/未計(jì)劃/交易集成)? j)誰(shuí)來(lái)設(shè)計(jì)災(zāi)備方案? k)誰(shuí)來(lái)實(shí)施災(zāi)備方案?
以上并不是所有可能的問(wèn)題,但這是一個(gè)很好的開始,你可以設(shè)計(jì)其他一些問(wèn)題,這些問(wèn)題是如何使用的呢?參考下圖:
以上模型稱為沙漏模型,在沙漏瓶頸以上的問(wèn)題定義了基本的業(yè)務(wù)和IT需求,這些基本的問(wèn)題必須有充分的答復(fù),因?yàn)槿魏螁?wèn)題的缺少都意味著我們要投資的方案可能會(huì)沒(méi)有正確的評(píng)估。采用這樣的方式,在災(zāi)備方案實(shí)施前可確保收集到正確的業(yè)務(wù)和IT基礎(chǔ)架構(gòu)的需求。
我們必須保證這些問(wèn)題的答案已經(jīng)廣泛征求了企業(yè)管理部門、商務(wù)部門、應(yīng)用組合IT維護(hù)組的意見。
2)使用層/RTO(Tier/RTO)和恢復(fù)的層次定位災(zāi)備方案的子集
現(xiàn)在我們可以定義初步的方案,注意:在災(zāi)難恢復(fù)的七層中,一層總是建立在前一層的基礎(chǔ)之上。對(duì)應(yīng)于計(jì)劃停機(jī)、非計(jì)劃停機(jī)和交易一致性,相應(yīng)的災(zāi)備技術(shù)和方案也有所不同: 計(jì)劃停機(jī):這一方案只有助于計(jì)劃中的停機(jī)或者數(shù)據(jù)移植,對(duì)非計(jì)劃的停機(jī)沒(méi)有作用。非計(jì)劃停機(jī):在硬件和數(shù)據(jù)一致性的層面,這一方案有助于非計(jì)劃停機(jī)的恢復(fù),也意味著支持計(jì)劃停機(jī)。在應(yīng)用和數(shù)據(jù)庫(kù)層面,這一層次的恢復(fù)不支持交易一致性的恢復(fù)。
交易一致性:對(duì)于非計(jì)劃的停機(jī),方案要求在應(yīng)用和數(shù)據(jù)庫(kù)交易一致性的層面提供恢復(fù)的能力。這一方案隱性要求硬件層次支持計(jì)劃停機(jī)和非計(jì)劃停機(jī)。
確定了合適的恢復(fù)層次、結(jié)合RTO、參考下圖,可以很快的確定需要的災(zāi)難恢復(fù)方案。
3)排除非方案的東西
現(xiàn)在我們通過(guò)把第一步中收集到的問(wèn)題答案應(yīng)用于候選的方案并剔除不合適的方案,來(lái)定義初步、候選的災(zāi)難恢復(fù)方案。請(qǐng)參考下圖:
通過(guò)第一步中獲得的問(wèn)題答案,如距離、不支持的平臺(tái)等,可以剔除不符合要求的方案。
如果在這一步驟完成后存在多個(gè)災(zāi)備方案,這都是正常的,它們都是可用的方案。
4)將確定的方案提交給評(píng)估組
經(jīng)過(guò)第三步后,將一組初步的災(zāi)備方案和可用的技術(shù)提交給資深的評(píng)估組,這個(gè)組由一些資深的成員組成。他們將詳細(xì)的比較和分析這些備選方案,同時(shí)對(duì)有效的候選方案注明所需要的技能。
評(píng)估組需要充分詳細(xì)的配置每一個(gè)候選方案。最后,評(píng)估組將決定最終選擇最合適的災(zāi)備方案。
第五章 典型方案介紹
基于軟件的數(shù)據(jù)備份技術(shù) | HACMP高可靠性災(zāi)備方案 | 基于磁盤系統(tǒng)的PPRC數(shù)據(jù)級(jí)災(zāi)難備份解決方案
5.1 基于軟件的數(shù)據(jù)備份技術(shù)
在應(yīng)用軟件進(jìn)行災(zāi)難備份的解決方案中,應(yīng)從下面三個(gè)層次考慮: 用戶應(yīng)用程序
客戶機(jī)軟件 數(shù)據(jù)庫(kù)引擎
其中用戶應(yīng)用程序和客戶機(jī)軟件一般不包含關(guān)鍵數(shù)據(jù),幾乎所有數(shù)據(jù)都由數(shù)據(jù)庫(kù)引擎管理并放置在數(shù)據(jù)庫(kù)服務(wù)器中。在這三者之中,數(shù)據(jù)庫(kù)中的數(shù)據(jù)保護(hù)最為重要。
一般情況下,用戶應(yīng)用程序和客戶機(jī)軟件只需要將其執(zhí)行代碼和參數(shù)配置文件做以備份,當(dāng)災(zāi)難發(fā)生時(shí),可以通過(guò)這些備份重新安裝和配置用戶應(yīng)用程序和客戶機(jī)軟件。
對(duì)數(shù)據(jù)庫(kù)的備份,如果采用硬件級(jí)災(zāi)難備份有兩種方法:一是采用備份的方法,即定期地將數(shù)據(jù)備份到硬盤和磁帶/磁帶庫(kù)上,這些磁帶可以通過(guò)運(yùn)輸?shù)姆绞竭\(yùn)到遠(yuǎn)程,以防磁帶在本地的災(zāi)難中發(fā)生毀壞。這種方法的缺陷是實(shí)時(shí)性較差,恢復(fù)時(shí)間較長(zhǎng);另一種做法就是硬件鏡像的做法,這種做法在硬件的投資上較大,對(duì)兩點(diǎn)間的網(wǎng)絡(luò)帶寬有較大的要求。那么,有沒(méi)有一種兩者兼顧的解決方案呢?數(shù)據(jù)庫(kù)產(chǎn)品提供的數(shù)據(jù)庫(kù)復(fù)制技術(shù)就是一種兩者兼顧的災(zāi)難備份解決方案。在前面提到的災(zāi)難恢復(fù)方案的7個(gè)層次中屬于第5或第6層次。
數(shù)據(jù)庫(kù)復(fù)制技術(shù)在數(shù)據(jù)庫(kù)級(jí)別的災(zāi)難備份解決方案中可以實(shí)現(xiàn)遠(yuǎn)程容災(zāi)。目前已有的產(chǎn)品有IBM DB2 HADR、IBM INFORMIX HDR以及ORACLE DATA GUARD。
IBM DB2 HADR是High Availability Disaster Recovery 的縮寫,HADR 將HA(高可用性)和INFORMIX DR的技術(shù)緊密結(jié)合起來(lái)。INFORMIX HDR是High Availability Data Replication的縮寫。
HDR的工作原理是通過(guò)將主數(shù)據(jù)庫(kù)服務(wù)器(簡(jiǎn)稱為A)的邏輯日志緩沖區(qū)復(fù)制到備份數(shù)據(jù)庫(kù)服務(wù)器(簡(jiǎn)稱為B),而且能在主數(shù)據(jù)庫(kù)服務(wù)器操作失敗時(shí)自動(dòng)切換到備份數(shù)據(jù)庫(kù)服務(wù)器。復(fù)制方式有同步方式和異步方式兩種。我們將在下面詳細(xì)介紹HDR的工作原理以及同步方式和異步方式。
正常狀態(tài)下,主數(shù)據(jù)庫(kù)服務(wù)器做數(shù)據(jù)庫(kù)的讀寫操作,備份數(shù)據(jù)庫(kù)服務(wù)器為只讀方式。當(dāng)主數(shù)據(jù)庫(kù)服務(wù)器失敗時(shí),備份數(shù)據(jù)庫(kù)服務(wù)器會(huì)自動(dòng)接管主數(shù)據(jù)庫(kù)服務(wù)器的事務(wù)處理。此時(shí),備份數(shù)據(jù)庫(kù)服務(wù)器作為主數(shù)據(jù)庫(kù)服務(wù)器進(jìn)行數(shù)據(jù)庫(kù)的讀寫操作。當(dāng)主數(shù)據(jù)庫(kù)服務(wù)器被修復(fù)后,主數(shù)據(jù)庫(kù)服務(wù)器作為新的備份數(shù)據(jù)庫(kù)服務(wù)器。
此時(shí)備份數(shù)據(jù)庫(kù)服務(wù)器雖為只讀方式,但并不是空閑的。它可以分擔(dān)主數(shù)據(jù)庫(kù)服務(wù)器的負(fù)載,例如執(zhí)行查詢、出報(bào)表等任務(wù)。
數(shù)據(jù)庫(kù)復(fù)制對(duì)硬件的要求相對(duì)較低,只要主數(shù)據(jù)庫(kù)服務(wù)器和備份數(shù)據(jù)庫(kù)服務(wù)器的硬件配置相同即可,不是必須使用高端存儲(chǔ)設(shè)備,例如IBM ESS等。主數(shù)據(jù)庫(kù)服務(wù)器和備份數(shù)據(jù)庫(kù)服務(wù)器的距離不受限制,而且對(duì)網(wǎng)絡(luò)的壓力并不大,但需要更強(qiáng)的數(shù)據(jù)庫(kù)管理能力。
下面介紹一下HDR的工作原理。如下圖所示:
在邏輯日志緩沖區(qū)(Logical Log buffer)刷新之前,它里面所有的交易(Transaction)將拷貝到數(shù)據(jù)復(fù)制緩沖區(qū)(Data Replication Buffer)。數(shù)據(jù)復(fù)制緩沖區(qū)的大小和邏輯日志緩沖區(qū)相同。數(shù)據(jù)復(fù)制緩沖區(qū)通過(guò)TCP/IP網(wǎng)絡(luò)將數(shù)據(jù)發(fā)送到備份數(shù)據(jù)庫(kù)服務(wù)器的數(shù)據(jù)復(fù)制緩沖區(qū)中。在備份數(shù)據(jù)庫(kù)服務(wù)器端,一個(gè)數(shù)據(jù)復(fù)制線程接收數(shù)據(jù)復(fù)制緩沖區(qū)的數(shù)據(jù)并把他們放入到恢復(fù)緩沖區(qū)(Recovery Buffer).另一個(gè)數(shù)據(jù)復(fù)制線程(或一些線程)記錄數(shù)據(jù)庫(kù)日志信息。主數(shù)據(jù)庫(kù)服務(wù)器和備份數(shù)據(jù)庫(kù)服務(wù)器都有一個(gè)―Ping‖線程在運(yùn)行,它會(huì)定時(shí)喚醒并且檢查兩個(gè)數(shù)據(jù)庫(kù)服務(wù)器的連接。如果任何一臺(tái)服務(wù)器上的―Ping‖線程檢測(cè)到連接中斷,都會(huì)發(fā)一條出錯(cuò)信息到消息日志中。
HDR有兩種復(fù)制方式:同步方式(Synchronous)和異步方式(Asynchronous)
在同步復(fù)制的方式下,主數(shù)據(jù)庫(kù)服務(wù)器的邏輯日志緩沖區(qū)只有在下面的過(guò)程完成后才可以刷新:
1.Copy: 邏輯日志緩沖區(qū)數(shù)據(jù)拷貝到數(shù)據(jù)復(fù)制緩沖區(qū);
2.Send: 數(shù)據(jù)從主數(shù)據(jù)庫(kù)服務(wù)器的數(shù)據(jù)復(fù)制緩沖區(qū)通過(guò)網(wǎng)絡(luò)傳送到備份數(shù)據(jù)庫(kù)服務(wù)器; 3.Acknowledge:當(dāng)備份數(shù)據(jù)庫(kù)服務(wù)器接收到數(shù)據(jù)后發(fā)回確認(rèn)信息; 4.Flush: 此時(shí),主數(shù)據(jù)庫(kù)服務(wù)器才可以刷新其邏輯日志緩沖區(qū)的數(shù)據(jù)。
采用同步方式的優(yōu)點(diǎn)是兩邊數(shù)據(jù)庫(kù)服務(wù)器的數(shù)據(jù)一致,但是由于每筆在主數(shù)據(jù)庫(kù)服務(wù)期提交的交易需要發(fā)送到備份數(shù)據(jù)庫(kù)服務(wù)器而且得到確認(rèn)后才算真正成功完成,由此而產(chǎn)生的時(shí)間延遲會(huì)使性能受到一定的影響。
如果采用異步復(fù)制方式,主數(shù)據(jù)庫(kù)服務(wù)器的邏輯日志緩沖區(qū)只要在邏輯日志緩沖區(qū)的數(shù)據(jù)拷貝到數(shù)據(jù)復(fù)制緩沖區(qū)之后就可以進(jìn)行刷新了。這樣做的缺點(diǎn)是在某些系統(tǒng)失敗的情況下,可能會(huì)有一些數(shù)據(jù)還沒(méi)有來(lái)得及通過(guò)網(wǎng)絡(luò)傳送到備份數(shù)據(jù)庫(kù)服務(wù)器;優(yōu)點(diǎn)是主數(shù)據(jù)庫(kù)服務(wù)器的性能不受影響。
對(duì)于Oracle DATA GUARD的工作原理,大致上與IBM HADR 和INFORMIX HDR的工作原理類似。
Oracle9i DATA GUARD 通過(guò)使用稱為備份的數(shù)據(jù)庫(kù)來(lái)防止數(shù)據(jù)災(zāi)難的出現(xiàn)。它通過(guò)將源數(shù)據(jù)庫(kù)的重做日志傳輸并應(yīng)用到備份數(shù)據(jù)庫(kù)中,來(lái)使備份數(shù)據(jù)庫(kù)與源數(shù)據(jù)庫(kù)同步:
可以將重做日志直接從源數(shù)據(jù)庫(kù)同步的寫到備份數(shù)據(jù)庫(kù),來(lái)完成零數(shù)據(jù)損失的災(zāi)難保護(hù),這會(huì)給源數(shù)據(jù)庫(kù)的性能帶來(lái)一定的性能損失。
可以將歸檔的重做日志從源數(shù)據(jù)庫(kù)異步的寫到備份數(shù)據(jù)庫(kù),來(lái)使源數(shù)據(jù)庫(kù)在極少的損失性能的前提下,最小化地減少數(shù)據(jù)的丟失。
如果重做日志數(shù)據(jù)到達(dá)備份數(shù)據(jù)庫(kù)后就快速應(yīng)用到備份數(shù)據(jù)庫(kù),則在源數(shù)據(jù)庫(kù)出現(xiàn)問(wèn)題時(shí)便可以快速地切換到備份數(shù)據(jù)庫(kù)。然而,如果延緩一定時(shí)間后再應(yīng)用重做日志數(shù)據(jù),就可以避免源數(shù)據(jù)庫(kù)的錯(cuò)誤快速地傳播到備份數(shù)據(jù)庫(kù)。
DATA GUARD同樣也有同步和異步復(fù)制兩種方式可以選擇。
5.2 HACMP高可靠性災(zāi)備方案
HACMP容災(zāi)系統(tǒng)在世界范圍內(nèi)廣泛應(yīng)用,具有以下鮮明的特點(diǎn):
簡(jiǎn)單易用,7x24小時(shí)集群應(yīng)用技術(shù)
顯著減少停機(jī)時(shí)間,允許不間斷的進(jìn)行集群升級(jí)和系統(tǒng)維護(hù) 提供多種數(shù)據(jù)備份和恢復(fù)途徑,以滿足災(zāi)備的需求
HACMP經(jīng)過(guò)十多年的發(fā)展,從5.1版本開始,增加的一項(xiàng)新的功能HACMP/XD支持ESS/PPRC和基于IP連接的遠(yuǎn)端故障切換。
5.2.1 A.HACMP方案 a)介紹
HACMP對(duì)關(guān)鍵應(yīng)用提供良好的保護(hù),提供可信賴的高可靠性服務(wù)、監(jiān)控能力和對(duì)應(yīng)用的失敗監(jiān)測(cè),切換應(yīng)用環(huán)境到備份主機(jī)。借助于HACMP/XD功能,也可以將應(yīng)用切換到遠(yuǎn)端備份機(jī)器。在集群中,HACMP使用冗余的硬件配置以保持應(yīng)用的正常運(yùn)行,在需要時(shí)將應(yīng)用切換到備份主機(jī),最多可以有32臺(tái)服務(wù)器組成HACMP集群。HACMP也可以監(jiān)測(cè)應(yīng)用的錯(cuò)誤,但這些錯(cuò)誤應(yīng)當(dāng)不足以影響到系統(tǒng)的正常運(yùn)行,如進(jìn)程失敗、系統(tǒng)資源消耗過(guò)大等。對(duì)這些錯(cuò)誤事件,HACMP監(jiān)控、發(fā)現(xiàn)并采取相應(yīng)的措施以保證系統(tǒng)的運(yùn)行。HACMP可配置為響應(yīng)幾百個(gè)系統(tǒng)事件。
事實(shí)上,使用HACMP可以防止一些計(jì)劃中的停機(jī),如在停機(jī)維護(hù)的過(guò)程中,用戶、應(yīng)用和數(shù)據(jù)可以轉(zhuǎn)移到備份主機(jī)。HACMP可以滿足復(fù)雜的、各式各樣應(yīng)用的可靠性及其恢復(fù)的需要。
b)優(yōu)勢(shì)
HACMP充分利用了AIX操作系統(tǒng)的優(yōu)點(diǎn),并拓展了AIX系統(tǒng)和網(wǎng)絡(luò)的管理功能,提供了橫向和縱向的靈活性。c)功能增強(qiáng)
IBM HACMP在5.1的版本中,功能進(jìn)一步增強(qiáng),這些新的功能包括: 1)使用快速硬盤接管技術(shù),減少切換時(shí)間,限制在10秒鐘之內(nèi)
2)使用流水式配置界面,僅僅需要六次輸入就可以配置一個(gè)簡(jiǎn)單的 HACMP集群 3)基于硬盤的新的非IP心跳信號(hào)保護(hù)技術(shù),不需要額外的硬件支持 4)增強(qiáng)的安全機(jī)制,剔除了對(duì).rhosts的要求
5)增加快速的集群配置確認(rèn)和同步技術(shù),提高管理的效率 6)在集群的監(jiān)控中提供更多的集群狀態(tài)信息
7)增加災(zāi)難恢復(fù)技術(shù),保證在災(zāi)難發(fā)生時(shí)系統(tǒng)是可控制的
5.2.2 B.HACMP/XD
在災(zāi)備方案中,如果需要在異地做數(shù)據(jù)鏡像,HACMP/XD(Extended Distance)是必選的功能。對(duì)中小企業(yè)而言,HACMP/XD的高可靠性解決方案是極具吸引力的,從成本上看,也是可以負(fù)擔(dān)的。在關(guān)鍵的商業(yè)應(yīng)用中,高可靠性是最基本的功能。
HACMP/XD提供了多項(xiàng)技術(shù)以滿足遠(yuǎn)距離的數(shù)據(jù)鏡像、切換和信息同步:
a)支持IBM企業(yè)級(jí)存儲(chǔ)服務(wù)器ESS的PPRC,即HACMP/XD over PPRC。這允許HACMP集群自動(dòng)的切換PPRC鏡像組(PPRC pairs)中的硬盤,可以設(shè)計(jì)基于ESS PPRC的強(qiáng)大的容災(zāi)方案。HACMP/XD結(jié)合PPRC,可以保證集群環(huán)境中關(guān)鍵數(shù)據(jù)始終可用。
下圖為HACMP/XD PPRC方案的示意圖:
b)HACMP/XD基于IP的鏡像,提供遠(yuǎn)端數(shù)據(jù)鏡像,沒(méi)有距離限制,集成使用HAGEO 的技術(shù)?;贗P的鏡像技術(shù),允許HACMP集群中的pSeries UNIX服務(wù)器放置在任意位置,每臺(tái)服務(wù)器都維護(hù)一份精確的應(yīng)用和數(shù)據(jù)拷貝。HACMP/XD提供數(shù)據(jù)的同步、切換和恢復(fù)。HACMP/XD基于IP的數(shù)據(jù)鏡像是基于存儲(chǔ)介質(zhì)的邏輯層來(lái)實(shí)現(xiàn)的。也就是說(shuō),本地的數(shù)據(jù)可以使用RAID或本地鏡像保護(hù)。
HACMP/XD, HAGEO技術(shù)環(huán)境是一個(gè)分布式的集群,可以分布在兩個(gè)足夠遠(yuǎn)的地方,通過(guò)冗余的點(diǎn)對(duì)點(diǎn)的TCP/IP網(wǎng)絡(luò)連接,提供應(yīng)用數(shù)據(jù)的恢復(fù)功能。下圖為HACMP/XD:HAGEO的集群示例:
對(duì)關(guān)鍵的商業(yè)應(yīng)用和數(shù)據(jù),每一個(gè)場(chǎng)所都維護(hù)一份實(shí)時(shí)鏡像。因而,如果某一場(chǎng)所遭到破壞,HACMP/XD:HAGEO將自動(dòng)切換和同步,可以保證生產(chǎn)系統(tǒng)在較短的時(shí)間內(nèi)恢復(fù)運(yùn)行。使用HACMP/XD功能,需要具備以下條件:
i.HACMP V5.1.0(cluster.es.server.rte 5.1.0.0)或以上版本 ii.結(jié)合使用ESS/PPRC鏡像:
操作系統(tǒng)AIX 5L Java 運(yùn)行環(huán)境1.3.0.15, 或以上版本 IBM ESS 微碼 2.1.1, 或以上版本
IBM 2105 命令行接口(Command Line Interface,ibm2105cli.rte32.6.100.13)或者IBM 2105命令行接口(ibm2105esscli.rte 2.1.0.15)
注意:假定以上命令行接口命令安裝在其缺省的目錄下/usr/opt/ibm2105cli IBM 2105 子系統(tǒng)設(shè)備驅(qū)動(dòng)程序(Subsystem Device Driver),ibmSdd_510nchacmp.rte 1.3.3.6, 或以上版本 iii.使用基于IP的鏡像:沒(méi)有特殊要求
5.3 基于磁盤系統(tǒng)的PPRC數(shù)據(jù)級(jí)容災(zāi)解決方案
本節(jié)介紹的基于磁盤系統(tǒng)的PPRC(Peer-to-Peer Remote Copy)數(shù)據(jù)級(jí)容災(zāi)解決方案,是災(zāi)難恢復(fù)方案的7個(gè)級(jí)別中的第六個(gè)級(jí)別,可以保證少量或無(wú)數(shù)據(jù)丟失,實(shí)現(xiàn)最高一級(jí)數(shù)據(jù)的實(shí)時(shí)性,適用于那些幾乎不允許數(shù)據(jù)丟失和要求能快速將數(shù)據(jù)恢復(fù)到應(yīng)用中的業(yè)務(wù)。此種解決方案提供數(shù)據(jù)的一致性,不依賴于應(yīng)用而靠大量的硬件技術(shù)來(lái)實(shí)現(xiàn)。
目前業(yè)界有兩種基本的基于磁盤系統(tǒng)的遠(yuǎn)程拷貝形式:
同步PPRC遠(yuǎn)程拷貝(synchronous writes):來(lái)自主機(jī)的數(shù)據(jù)被寫往本地連接的磁盤系統(tǒng),該系統(tǒng)將數(shù)據(jù)轉(zhuǎn)發(fā)給遠(yuǎn)地點(diǎn)連接的磁盤系統(tǒng)。只有當(dāng)兩個(gè)系統(tǒng)都擁有數(shù)據(jù)的拷貝以后,本地系統(tǒng)才會(huì)向主機(jī)返回一個(gè)I/O完成指示。同步遠(yuǎn)程拷貝能夠在遠(yuǎn)地點(diǎn)提供最新的數(shù)據(jù),但應(yīng)用程序會(huì)因等待寫I/O操作的完成而被延遲。由于距離的限制這種方式也叫做―同城鏡像(Metro Mirror)‖
異步PPRC遠(yuǎn)程拷貝(Asynchronous Write):來(lái)自主機(jī)的數(shù)據(jù)被寫往本地連接的磁盤系統(tǒng),該系統(tǒng)立即向主機(jī)返回一個(gè)I/O完成指示。數(shù)據(jù)在很短的一段時(shí)間(在實(shí)際中通常在數(shù)秒鐘到一分鐘左右)以后被送往一個(gè)遠(yuǎn)程磁盤系統(tǒng)。異步遠(yuǎn)程拷貝對(duì)應(yīng)用程序性能的影響最小,但遠(yuǎn)程磁盤系統(tǒng)在數(shù)據(jù)的更新程度上與本地系統(tǒng)相比會(huì)有一個(gè)延遲。
單純的異步拷貝由于線路距離較遠(yuǎn)等原因,本地磁盤和遠(yuǎn)地磁盤可能會(huì)有邏輯卷讀寫順序上的差異。這種方式也叫做―全局拷貝(Global Copy)‖
在全局拷貝(Global Copy)的情況下,比如本地磁盤系統(tǒng)提供給主機(jī)5個(gè)邏輯卷,某一時(shí)刻主機(jī)對(duì)這些邏輯卷發(fā)起了A,B,C,D,E,5個(gè)寫盤請(qǐng)求,本地的磁盤系統(tǒng)的寫順序是A,B,C,D,E。但是由于線路等原因,遠(yuǎn)地的磁盤系統(tǒng)在接收寫請(qǐng)求時(shí),收到的順序可能是A,C,B,D,E。寫盤的順序也是A,C,B,D,E。我們假設(shè)災(zāi)難發(fā)生在這5個(gè)寫操作D,B的中間部分,那么這時(shí)遠(yuǎn)地的數(shù)據(jù)C很有可能是沒(méi)有意義的,甚至是無(wú)理的。
為了解決本地磁盤和遠(yuǎn)地磁盤可能存在的邏輯卷讀寫順序的差異,有的磁盤系統(tǒng)提供帶有一致性組的異步遠(yuǎn)程數(shù)據(jù)拷貝。在這種方式下,遠(yuǎn)地的磁盤系統(tǒng)會(huì)將先收到的寫請(qǐng)求緩存起來(lái)(比如上面的數(shù)據(jù)C),等到它前面的數(shù)據(jù)(A,B)到達(dá)后,再按照順序?qū)懕P。這種方式也叫做―全局鏡像(Global Mirror)‖。見下圖:
IBM異步PPRC遠(yuǎn)程拷貝提供帶有一致性組的異步遠(yuǎn)程數(shù)據(jù)拷貝。下面,分別針對(duì)兩種方案在IBM ESS中的實(shí)施方案予以介紹。
5.3.1 同步PPRC數(shù)據(jù)級(jí)災(zāi)難備份方案
IBM的PPRC提供了實(shí)現(xiàn)災(zāi)難備份的方案基礎(chǔ)。PPRC全稱Peer-to-Peer Remote Copy,是以存儲(chǔ)為基礎(chǔ)的實(shí)時(shí)且與應(yīng)用程序無(wú)關(guān)的數(shù)據(jù)遠(yuǎn)程鏡像功能。PPRC的實(shí)現(xiàn)較為簡(jiǎn)單,是無(wú)數(shù)據(jù)丟失且具有完全恢復(fù)功能的災(zāi)難恢復(fù)解決方案。
PPRC基于IBM ESS企業(yè)級(jí)存儲(chǔ)服務(wù)器,以邏輯卷為基本單位,通過(guò)光纖通道將本地ESS上的數(shù)據(jù)同步鏡像到遠(yuǎn)端的ESS上。
為了在保證數(shù)據(jù)的即時(shí)性、完整性和系統(tǒng)性能之間達(dá)到平衡,PPRC提供了多種工作方式。
同步方式下:點(diǎn)對(duì)點(diǎn)遠(yuǎn)程拷貝(PPRC)是一種同步遠(yuǎn)程鏡像的工具,可用于相隔距離達(dá)103公里的兩個(gè)ESS系統(tǒng)中指定的邏輯卷。這一距離可以通過(guò)第三方提供的通道擴(kuò)展器加以延長(zhǎng),ESS可以為所有連接的主機(jī)支持PPRC功能。
PPRC將確保如果備份卷不能被更新,那么即使源卷更新成功,整個(gè)寫操作也會(huì)返回失敗---保證源卷和目的卷的數(shù)據(jù)徹底一致。同步方式可以保證數(shù)據(jù)不會(huì)丟失,更重要的是數(shù)據(jù)的一致性在這種方式下能夠得到很好的保證---數(shù)據(jù)的不一致意味著相關(guān)數(shù)據(jù)的丟失,此時(shí)數(shù)據(jù)庫(kù)的數(shù)據(jù)安全機(jī)制無(wú)法保證數(shù)據(jù)的安全,嚴(yán)重時(shí)有可能造成數(shù)據(jù)庫(kù)無(wú)法啟動(dòng)。
PPRC的同步實(shí)現(xiàn)機(jī)制如下圖所示:
PPRC同步工作過(guò)程為:
1、應(yīng)用程序?qū)?shù)據(jù)寫入磁盤--在生產(chǎn)系統(tǒng)中的應(yīng)用程序?qū)?shù)據(jù)寫到生產(chǎn)系統(tǒng)的磁盤。
2、生產(chǎn)系統(tǒng)中的磁盤數(shù)據(jù)傳輸?shù)絺浞荽疟P--對(duì)每一個(gè)在生產(chǎn)系統(tǒng)的寫操作都要將這個(gè)寫操作送到備份磁盤。
3、備份機(jī)磁盤數(shù)據(jù)復(fù)制--備份磁盤復(fù)制生產(chǎn)系統(tǒng)的數(shù)據(jù)。
4、將寫完的操作信息返給生產(chǎn)磁盤--當(dāng)生產(chǎn)系統(tǒng)收到備份系統(tǒng)傳回的已寫信息之后,生產(chǎn)機(jī)的磁盤系統(tǒng)通知主機(jī)該寫操作已完畢,在此之后生產(chǎn)系統(tǒng)的應(yīng)用將繼續(xù)執(zhí)行。在同步PPRC的建立過(guò)程中,卷具有不同的狀態(tài),以保證數(shù)據(jù)的完整性。
5.3.2 異步PPRC數(shù)據(jù)級(jí)災(zāi)難備份方案
PPRC + FlashCopy數(shù)據(jù)備份方案
為了提高PPRC數(shù)據(jù)備份方案的效率,可以考慮結(jié)合IBM公司企業(yè)級(jí)存儲(chǔ)服務(wù)器ESS的FlashCopy功能軟件,采用異步方式實(shí)現(xiàn)PPRC數(shù)據(jù)備份。在異步工作方式下,PPRC能夠在遠(yuǎn)端更新沒(méi)有完成的情況下,只要本地更新成功,就可以向主機(jī)返回―寫成功‖的信號(hào)。好處是:在主備機(jī)房之間的數(shù)據(jù)鏈路帶寬成為瓶頸時(shí),采用異步方式可以不影響主機(jī)房生產(chǎn)系統(tǒng)的性能。壞處是:
1、數(shù)據(jù)將有可能丟失;
2、在異步同步不能最終成功完成的情況下,數(shù)據(jù)的一致性無(wú)法得到保證。所以當(dāng)采用異步方式時(shí),IBM建議先采用IBM ESS的快速拷貝功能FlashCopy備份需同步的數(shù)據(jù),再進(jìn)行數(shù)據(jù)同步。
ESS的FlashCopy的使用
ESS的FlashCopy提供了一個(gè)―時(shí)間點(diǎn)‖(Point in time)的拷貝服務(wù)功能,從源卷到目標(biāo)卷快速地復(fù)制數(shù)據(jù)。邏輯拷貝通常可以在數(shù)秒內(nèi)完成,然后就釋放源卷,進(jìn)行正常工作,而物理拷貝操作在后臺(tái)進(jìn)行。在物理拷貝的進(jìn)行過(guò)程中,拷貝和被拷貝的數(shù)據(jù)都能被用戶使用。
IBM ESS的FlashCopy支持兩個(gè)選項(xiàng),它提供NO COPY選項(xiàng)來(lái)支持災(zāi)備的應(yīng)用需求。以下的內(nèi)容討論了在移動(dòng)災(zāi)備的應(yīng)用環(huán)境中是如何使用這些選項(xiàng)的。
FlashCopy COPY選項(xiàng)