新聞中心
云時代下的企業(yè)災備建設(shè)思路
2022-12-06
越來越多的行業(yè)用戶選擇利用云計算技術(shù)構(gòu)建自己的數(shù)據(jù)中心,但業(yè)務集中、數(shù)據(jù)集中的同時,也意味著風險的集中。
一旦發(fā)生數(shù)據(jù)中心人為誤操作、網(wǎng)絡(luò)故障甚至災難時,企業(yè)及分支機構(gòu)將無法對外提供服務,甚至關(guān)鍵數(shù)據(jù)也會丟失。
從GitLab事件看企業(yè)災備現(xiàn)狀
去年,全球知名的開源托管服務平臺GitLab數(shù)據(jù)丟失事件可能大多數(shù)人還印象深刻,因為缺乏完善的災備方案,人為誤刪數(shù)據(jù)庫致使系統(tǒng)宕機,并且長時間無法恢復。慶幸的是,運維工程師利用一次偶然產(chǎn)出的LVM快照,使數(shù)據(jù)得以恢復到6個小時之前的狀態(tài),但中間丟失的那部分數(shù)據(jù)對用戶的潛在影響是無法用數(shù)字衡量的。
事實上,缺失災備方案的并不只有GitLab,諸多企業(yè)均存在類似的情況。由于成本和技術(shù)等原因,企業(yè)只應用傳統(tǒng)的本地備份方案,并且通常只針對企業(yè)重要的業(yè)務數(shù)據(jù)(數(shù)據(jù)庫、電子郵件等)進行備份,而不對操作系統(tǒng)及應用程序進行備份。故障發(fā)生后,需要耗費大量的時間在備份文件的導入恢復和配置上。業(yè)務恢復周期長、操作復雜,很多企業(yè)在做了災備方案后,卻束之高閣,無法應用。
因此,如何以更高的性價比實現(xiàn)企業(yè)業(yè)務連續(xù)性,平衡風險、效率與成本,是當前企業(yè)用戶的迫切期望。
企業(yè)災備建設(shè)需要“因地制宜”
不同類型的風險其影響程度、發(fā)生概率和造成的損失大小是不同的, 在討論企業(yè)災備建設(shè)方案之前,可以將企業(yè)各信息系統(tǒng)所面臨的風險因素、概率、影響和應對手段進行分析,以便于企業(yè)根據(jù)風險的抵御能力以及應用系統(tǒng)的重要程度,評估如何采取相應的災備措施來減低各種風險和威脅可能帶來的影響和損失。
企業(yè)信息化風險評估與應對措施
根據(jù)上面的分析,基于不同的風險抵御能力,災備的建設(shè)分為兩個維度、四個層次:
- 數(shù)據(jù)維度(本地、異地)
- 業(yè)務維度(同城連續(xù)性、異地連續(xù)性)
企業(yè)應用云計算技術(shù)之前,災備的建設(shè)更多還是解決數(shù)據(jù)層面的問題,主要是利用傳統(tǒng)存儲設(shè)備的數(shù)據(jù)復制特性,由存儲設(shè)備統(tǒng)一完成上層業(yè)務(包括數(shù)據(jù)庫系統(tǒng))的跨地域數(shù)據(jù)復制。但因為技術(shù)綁定和所有業(yè)務系統(tǒng)共吃一個”大鍋飯”的原因,建設(shè)成本高昂,災備效率不高,兼容性和數(shù)據(jù)一致性也存在一定的風險,并且由于只是數(shù)據(jù)級的復制,依舊無法解決數(shù)據(jù)備份和業(yè)務恢復復雜度高的問題。
那么,如何應用云計算技術(shù)解決這些問題,并且構(gòu)建業(yè)務維度的災備體系呢?
建設(shè)以云計算技術(shù)為核心的業(yè)務連續(xù)性災備架構(gòu)
首先對云計算技術(shù)進行定義,參考目前大型互聯(lián)網(wǎng)公司,例如Google、Facebook、阿里、騰訊的基礎(chǔ)設(shè)施架構(gòu)和應用架構(gòu),深信服認為下一代IT架構(gòu)應該具備基礎(chǔ)設(shè)施超融合、應用系統(tǒng)集群化兩大特征。云計算技術(shù)就是支撐這兩大關(guān)鍵特征的平臺技術(shù),例如分布式、虛擬化、應用編排、流量分發(fā)等。具備這樣技術(shù)能力的數(shù)據(jù)中心可以稱之為云數(shù)據(jù)中心。
其次,在數(shù)據(jù)中心領(lǐng)域,通常會從兩個方面去考慮業(yè)務可用性的實現(xiàn):
1)重新定義數(shù)據(jù)中心架構(gòu),尤其針對傳統(tǒng)集中式架構(gòu)的業(yè)務系統(tǒng),例如傳統(tǒng)ERP系統(tǒng)。此類系統(tǒng)非常關(guān)鍵,架構(gòu)無法輕易變動,需要在基礎(chǔ)架構(gòu)層面去實現(xiàn)高可靠和高可用。
由于云數(shù)據(jù)中心的超融合基礎(chǔ)架構(gòu)本身就具備高度容錯能力,以深信服企業(yè)級云的超融合基礎(chǔ)架構(gòu)為例,基礎(chǔ)架構(gòu)支持數(shù)據(jù)多副本、數(shù)據(jù)持續(xù)保護、虛擬機HA、支持數(shù)據(jù)庫集群化部署等多種高可靠機制。因此,對于此類傳統(tǒng)業(yè)務的業(yè)務連續(xù)性,重點考慮的是業(yè)務跨站點數(shù)據(jù)復制和業(yè)務切換的設(shè)計。
2)重新定義應用架構(gòu),使之具備分布式能力,通過應用層集群和流量分發(fā)技術(shù)構(gòu)建業(yè)務雙活,甚至多活能力,同時基于云計算資源池化、統(tǒng)一編排等能力,資源調(diào)配可以非常靈活,擴展也會非常容易。
因此,深信服認為云數(shù)據(jù)中心災備建設(shè)的核心在于如何構(gòu)建一個彈性安全可靠的基礎(chǔ)架構(gòu)去支撐分布式的業(yè)務集群,如何基于業(yè)務要求選擇合適的數(shù)據(jù)復制方式,如何對多個數(shù)據(jù)中心進行業(yè)務和流量感知,如何在出現(xiàn)故障時能夠統(tǒng)一地進行災備切換。
由此,得出了以業(yè)務連續(xù)性為中心的云數(shù)據(jù)中心災備參考架構(gòu):
首先,云數(shù)據(jù)中心通過超融合基礎(chǔ)架構(gòu)以軟件定義的方式進行構(gòu)建,超融合實現(xiàn)了物理拓撲的架構(gòu)極簡,硬件上只有x86服務器和交換機,所有的資源承載節(jié)點都是x86服務器,所有的網(wǎng)絡(luò)通道都是以太網(wǎng)絡(luò),包括其中的存儲網(wǎng)。超融合基礎(chǔ)架構(gòu)本身就具備高度的容錯能力,例如虛擬存儲的多副本機制、虛擬機HA、虛擬負載均衡等。
其次,在參考架構(gòu)中設(shè)計全局負載均衡和服務器負載均衡,對多個數(shù)據(jù)中心進行業(yè)務感知與流量分發(fā),可以根據(jù)不同的性能需求選擇用物理方式或者虛擬網(wǎng)元方式進行部署?;谪撦d均衡實現(xiàn)數(shù)據(jù)中心流量切換智能化,出現(xiàn)故障時能夠統(tǒng)一進行災備切換。
數(shù)據(jù)中心數(shù)據(jù)復制路徑基于IP網(wǎng)絡(luò),很容易實現(xiàn)通道冗余,降低成本,基于虛擬化環(huán)境的副本同步機制,從基礎(chǔ)架構(gòu)層面保證數(shù)據(jù)可靠。針對結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)特點,采用獨立的數(shù)據(jù)復制方式,并進行統(tǒng)一管理,高效低成本,也避免了單一基于底層存儲復制技術(shù)的技術(shù)風險。通過評估業(yè)務對連續(xù)性的要求、分析數(shù)據(jù)中心間的網(wǎng)絡(luò)狀況等因素,合理選擇同步或異步方式實現(xiàn)主備或雙活。
這樣的參考架構(gòu),更容易實現(xiàn)應用高性能、高可用的目標,降低IT投入成本,同時也可以平滑支撐應用架構(gòu)的演進。
寫在最后
災備建設(shè)是一個復雜的系統(tǒng)工程,深信服云IT秉承簡單、穩(wěn)定、安全、易用的產(chǎn)品宗旨,以業(yè)務為中心,融合多種災備技術(shù)到企業(yè)云管理平臺內(nèi),提供了面向海量虛擬機備份的數(shù)據(jù)備份、面向關(guān)鍵業(yè)務的持續(xù)數(shù)據(jù)保護、異地災備、VMware災備、公有云災備等多個解決方案,用戶可根據(jù)自己的業(yè)務特點,靈活地選擇合適的災備方式。
在不遠的將來,深信服企業(yè)級云平臺將內(nèi)置災備云服務,已經(jīng)使用深信服企業(yè)級云的用戶可以像使用蘋果手機iCloud服務一樣輕松享受災備服務,將關(guān)鍵業(yè)務的關(guān)鍵數(shù)據(jù)一鍵式備份到云端。
深信服除了提供自身產(chǎn)品的完善災備解決方案外,還與業(yè)界優(yōu)秀的廠商進行生態(tài)合作,對Veritas、愛數(shù)、火星高科等廠商的災備產(chǎn)品都進行了兼容性測試或認證,消除用戶的后顧之憂。
更多資訊
廣東三合電子實業(yè)有限公司 版權(quán)所有 粵ICP備12042065號
電話:020-38880414 / 85511159
服務熱線:400-900-3138
傳真號碼:020-85519986
公司地址:廣州市黃埔區(qū)科學大道48號綠地中央廣場E棟8樓