アリ・技術専門家:5 PPTは徹底的に、二次レベルのデータ・リカバリ・メカニズムの下で」足の上に「削除ライブラリを公開!

ソース|アリ・テクノロジー(ali_tech)

著者|ファン6月

REVIEW:データセキュリティは前例のない高さに言及され、データ保護の話題はますます敏感になります。ますます大きなによるビジネスユーザーのためのダウンタイムの影響ので。継続的なデータ保護と継続的なデータは弾力性の検証提示しているものを記載する問題定義、従来のソリューション、現在のクラウドベンダーのソリューションを、直面するセキュリティの状況と開発からアリ6月のデータに挑戦技術の専門家、保護方式(弾性確実な継続的なデータ保護)。

I.概要

従来の連続データ保護ソリューションは、多かれ少なかれ、データ変更ログを書き込むときに取得され、ゲストOSのレベルにまたは独自のストレージレベルで必要と比較すると、ストレージのパフォーマンス製造機に大きな影響を与えますクラウドたら、それは顧客の計算コストや保管コストが増加します。でも、ハイブリッド展開アーキテクチャ、ネットワーク帯域幅、および実装の複雑さのレベルがクラウドと比較して実装することも非常に困難であり、伝統的な企業顧客が低下満たすことは困難であるRPO(リカバリポイント目標)とRTO(リカバリ時間目標)のアピール。継続的なデータ保護製品のポジショニングとスナップショット、ものの、レプリケーション(複製)機能には多少重複するが、CDPより広範なポジショニング、データ保護、回復、より効率的なビジネスの継続性に焦点を当て、およびスナップショットに限定されるものではなく、データを移動します。

新たなデータ書き込みモード、ログストレージを新しいストレージ・ブロックの新しいアーキテクチャがPangu2.0ドライブ含む特定のログ構造ブロックデバイス(ログ構造ブロック・デバイス)に、継続的データ保護を実現するための機会を提供しますそのスナップショットとは大幅に継続的なデータ保護の実現を促進します。低RTOは、伝統的なビジネスユーザーや低RPOの高度なデータ保護の緊急のニーズを満たす一方で、私は、両方のストレージのパフォーマンスでクラウドビジネスの加速、と信じています。しかし、運用を考慮し、同時にデータのバックアップやデータのバックアップは、運用データは、データ保護の有効性を決定大幅に回復させることができます。

第二に、データ保護の課題

今日のデータセキュリティでは前例のない高さ、もっともっと敏感になり、データ保護のトピックと呼ばれていました。ますます大きなによるビジネスユーザーのためのダウンタイムの影響ので。2017年には、このようなWannCry、ペタとLockyと頻繁に誤用削除ライブラリ、およびデータセキュリティとデータ保護のためのクラウドユーザーの期待を作り、ユーザーのバックアップソフトウェアにも、いくつかの直接攻撃、ウイルスなどのウイルス、ランサムウェアは、ますます高くなっています。

データは、ますます重要になってきている:データ=データ=資源資産

2017年1月、「Gitlab誤って削除ライブラリの事の業界と主要な情報セキュリティ上のリスクに起因する敏感な神経の作品」。バックアップメカニズムの他の5種類が利用できない間、それは、Gitlab回復の過程で、唯一db1.stagingデータベースを回復するために使用することができることを見出し、ことは注目に値します。緩やかな回復過程で結果として6時間のデータの前にdb1.stagingが、限られた伝送速度は、Gitlabは、最終的にデータのほぼ6時間を失いました。

そのため、データ損失のリスクを軽減する方法、効率的な回復メカニズム、ユーザーの緊急のニーズを提供し、ユーザーの損失を低減、データ保護ウィンドウを減らします。また、片側から見ることができ、かつ検証可能な低RTOの復旧、データ保護の重要性;この時点で、ストレージ・コストの回収可能位相データは非常に重要なわらです。

第三に、定義されたデータ保護の継続性

ストレージネットワーキング協会の継続的なデータ保護の定義については、(SNIA):継続的なデータ保護は、過去に復元することができますキャプチャしたり、データの変更を追跡し、そのデータを確保するために外部の独立した生産データに保存することができます方法であり、任意の時点。継続的データ保護は、ブロック、ファイル、またはアプリケーションの実装に基づくことができるリカバリポイントのほとんど無限数を達成するために、回復の回復のために十分な粒度を提供することができます。

世界で最も権威のIT調査・コンサルティング会社(ガートナー)が定義されます。継続的なデータ保護は、回収方法であることを、ログの形で同時に連続またはほぼ連続的なデータキャプチャまたはトレースファイルまたは変更データブロック、セーブ。この機能は、データの損失を低減するために、よりきめ細かい、リアルタイムのポイントを提供し、任意のリカバリポイントを可能にします。いくつかのCDPソリューションは、クロール、連続データ変更(真CDP)、または特定の時間変化データキャプチャ(準CDP)で構成することができます。

RPOとRTO:CDPの状態を表現するために、2つの概念の導入を必要とします。

  • RPO(目標復旧ポイント):リカバリポイント目標、バックアップ間隔でどのくらいのデータが失われることになる災害、を参照。

  • RTO(目標復旧時間):回復時間は目的は、災害時にはビジネスが回復時間であること、動作を継続できるようにすることができますどのくらいを指します。

  • 真のCDPの概念は、CDPになるようにするためにRPO = 0、ゼロにRTO近い、と定義されます。コールはゼロRPOときではありません。近くCDP(準CDP)。                                                                                                                                       

第四に、継続的なデータ保護機能

従来のデータ保護ソリューションは、データの定期的なバックアップに焦点を当て、それはように、バックアップウィンドウ、データの一貫性と生産システムへの影響との問題が伴っています。CDPは、新たなデータ保護ツールをユーザーに提供し、システム管理者は、(システムが継続的に継続的に自動化、データ保護のために、重要なデータの変化を監視するので、CDP)バックアッププロセスデータを懸念する必要はありませんが、唯一の災害後単にデータの迅速な復旧のためのタイムバックアップのポイントにデータをリストアする必要性を選択します。 

従来、継続的なデータ保護と比べて、継続的なデータ保護と災害復旧技術は、以下の特徴的な機能を備えています。

図1において、第1の時間が大幅にデータリカバリポイント目標(RPO)を改善することができます。ユーザーは、スナップショットテクノロジを使用して、24時間までのデータ損失のリスクに直面することになるので、バックアップ間隔のデータ保護技術は、一般的に24時間(一日一回バックアップ)で、データ損失のリスクは、数時間に短縮、およびCDPすることができますデータ損失の量を達成することができる数秒(もちろん、CDP異なる製品およびソリューションの時間精度は同じではない)に還元することができます。実際には、(任意の時点で」従来の任意のポイントインを用いたデータは、管理モード、継続的データ保護および保護を達成することができるコピーのために、データ保護が「時間内の単一点(シングルポイント・イン・タイム)」であります-time)「データ保護。 

2、虽然复制(Replication)技术可以通过与生产数据的同步获得数据的最新状态,但其无法规避由人为的逻辑错误或病毒攻击所造成的数据丢失。当生产数据由于以上原因导致数据遭到破坏时(例如数据被误删除),复制技术会将遭到破坏的数据状态同步到后备数据存储系统,使后备数据也受到破坏。CDP系统可以使数据状态恢复到数据遭到破坏之前的任意一个时间点,也就可以消除前者具有的风险。 

3、由于恢复时间和恢复对象的粒度更细,所以连续数据保护保护的数据恢复也更加灵活。目前的部分产品和解决方案允许最终用户(而不仅仅是系统管理员)直接对数据进行恢复操作,这在很大程度上方便了使用者。 

五、实现方式

连续数据保护实现的关键技术是对数据变化的记录和保存,以便实现任意时间点的快速恢复。一般来讲,有三种实现方式:

  • 基准参考数据模式。建立参考数据拷贝,根据生产数据变化记录数据差异日志,根据日志差异按需恢复数据。基准参考数据模式原理简单,实现起来比较容易,但由于数据恢复时需要从最原始的参考数据开始,逐步进行数据恢复,因此恢复时间比较长,尤其是恢复时间点越靠近当前的时间,恢复所需要的时间就越长。  

  • 复制参考数据模式。生产数据和参考数据副本实时同步,在同步的同时记录回退日志或事件,基于回退日志(Undo     Log)差异实现数据按需恢复。复制参考数据模式和基准参考数据模式在实现原理上恰好相反。复制参考数据模式在数据恢复时,恢复的时间点越靠近当前,所需要的恢复时间越短。但在数据的保存过程中,需要同时进行数据和日志记录的同步,需要较多的系统资源。 

  • 合成参考数据模式。合成参考数据模式是以上两种模式的折衷,较好地实现了以上两种模式的妥协,因此可以得到较好的资源占用和恢复时间效果。但需要复杂的软件管理和数据处理功能,实现起来比较复杂。 连续数据保护技术或解决方案的实现有多种模式。

不同的传统厂商建立了不同的连续数据保护保护模型,参考SNIA的存储共享模型, 可以将实现连续数据保护的产品或解决方案分为基于应用、基于文件和基于数据块的连续数据保护保护。本文主要从数据块层面讲CDP的实现。基于块的CDP功能直接运行在物理的存储设备或逻辑的卷管理器上,甚至也可以运行在数据传输层上。当数据块写入生产数据的存储设备时,CDP系统可以捕获数据的拷贝并将其存放在另外一个存储设备中。 基于数据块的数据保护又有基于主机层、基于传输层和基于存储层三类实现方式

六、传统数据保护产品的CDP

 下面以FalconStorCDP、VeeamCDP及EMC RecoverPoint这3个厂商,从不同背景进行分析,具有一定的代表性:飞康是传统的连续数据保护产品的代表。EMC传统的存储厂商,收购以前的RecoverPoint打造自己的数据保护套件, 方案建立在自己的存储上,提供物理机到虚拟机的保护方案。Veeam 是虚拟机保护的后起之秀,主打虚拟化平台上,VMWARE 及 HYPERV的数据保护,扩展到云端,目前的方案依赖于VMWare的VAIO 虚拟化数据获取框架。

 

EMCRecoverPoint/SE 是针对 EMC CLARiiON 系列阵列的全面解决方案,而 EMC RecoverPoint则是针对整个数据中心的全面解决方案。两种产品都提供了使用连续数据保护 (CDP)的同步本地复制,以及具有任意时间点恢复功能的同步和异步连续远程复制 (CRR)。在RecoverPoint 应用装置上同时运行CDP和CRR实现本地和远程(CLR) 数据保护,使您能够用单个解决方案同时在本地和远程保护相同数据。 飞康CDP解决方案整合了数据备份、系统恢复、灾难恢复、本地及异地容灾等多项功能。飞康CDP是基于磁盘的备份与容灾一体化解决方案,实现文件/数据库/操作系统的实时备份与瞬间恢复;实现了验证、演练的本地/异地容灾功能整合。

 

七、主要云厂商的数据保护方式

AWS仅提供原生的快照功能及帮助客户上云的手段,数据备份等功能依赖于传统的数据保护厂商;Azure提供基于虚拟机的基本的备份及恢复方式,没有提供CDP等高级功能。

八、可验证的弹性的连续数据保护CDP

根据Gartner的描述的弹性的云备份引擎,其中规定的了成功弹性备份的几个特征:

  • 弹性的云备份引擎需要快速的RTO,这就要求备份引擎和数据恢复在一个数据中心。

  • 弹性的云备份引擎需要有全备份,没有过大的WAN数据传输,将备份与生产机职责分开。

  • 并且要确保数据的可恢复性。

连续数据保护CDP本质上作为一种高级的数据保护方案,由云厂商进行,具有传统备份所不具有的弹性。传统厂商为了上云,必然需要将数据经过WAN传输到云端,必然耗费CPU资源,必然耗费IO资源。为了躲避资源的耗费,可能采取定时开启的任务方式,连基本的弹性的备份都保证不了,更谈不上CDP。可验证性,强调了CDP方案的可靠性,可操作性。为了保证应用程序的数据的跨卷一致性,需要卷之间建立一致性组(Consistency Group)及应用程序的一致性(Application Consistency)。

 

九、结论

数据保护不是亡羊补牢,需要未雨绸缪。随着企业上云的快速增长,传统企业对云端数据保护的诉求更加突出;随着数据重要性的日益提高,用户对数据丢失的敏感程度前所未有,从而使得云端数据保护与用户需求之间的矛盾更加凸显。

传统的基于块存储的连续数据保护因为大多依赖于特定的存储设备,并不具有云端实现所具有的弹性,并不适应云端分布式环境的复杂性。

连续数据保护作为传统或者混合云数据保护的重要补充,定会以新的解决方案的出现而被企业用户所重视。全新的Pangu2.0的块存储的架构为实现云端连续性数据保护提供了契机,

随着企业上云的加速,在兼顾存储性能的同时,将会满足传统高级企业用户的低RTO及低RPO的数据保护的紧迫需求。

后续文章将会着重阐述基于基准参考数据模型的云端连续数据保护,该方案基于Pangu2.0的Block Storage实现连续性数据保护,着重描述连续数据保护的秒级数据恢复机制。

 -END- 

关注“技术领导力”公众号

老K主理,文出过畅销书、武做过CTO

用故事讲技术,有趣,有料!

想加入社区,跟100位互联网大咖学习?

添加群助理Emma,注明“加群”

技术领导力社群


大家在看:

1.从微盟的5张架构PPT,分析“删库跑路“原罪

1.马化腾:普通人追求安全感,高手拥抱不确定

2.张一鸣:为什么 BAT 挖不走我们的人才?

3.迷信中台是一种病,得治

4.李开复:职场人35岁以后,真诚比面子重要

5.阿里中台架构15篇干货,100页ppt精选

6.雷军、张一鸣,价值千亿的6个思维模式

喜欢就点在看!

发布了152 篇原创文章 · 获赞 732 · 访问量 19万+

おすすめ

転載: blog.csdn.net/yellowzf3/article/details/104568322