알리 기술 전문가 : 5 PPT 철저, 초 수준의 데이터 복구 메커니즘에 따라 '발에 "삭제 라이브러리를 홍보!

소스 | 알리 기술 (ali_tech)

저자 | 팬 6월

REVIEW : 데이터 보안은 전례없는 높이라고, 데이터 보호의 주제는 점점 더 민감하게된다. 때문에 점점 더 비즈니스 사용자를위한 다운 타임의 영향 때문입니다. 지속적인 데이터 보호 및 지속적인 데이터 탄력 검증 선물이 무엇인지 규정 할 수있는 문제 정의, 기존의 솔루션, 현재 클라우드 공급 업체의 솔루션을 직면 한 안보 상황 및 개발에서 알리 6 월 데이터에 도전 기술 전문가, 보호 체계 (탄성 피보험자 지속적인 데이터 보호).

I. 개요

기존의 지속적인 데이터 보호에 비해 솔루션은 데이터 변경 로그가 더 많거나 적은 스토리지 성능 생산 시스템에 큰 영향을 작성할 때, 얻을 수 게스트 OS 수준이나 독점적 인 스토리지 수준에서 필요 클라우드되면, 고객의 컴퓨팅 비용과 스토리지 비용을 증가시킬 것이다. 심지어 하이브리드 배포 아키텍처, 네트워크 대역폭 및 구현의 복잡성의 수준이 클라우드에 비해 구현하는 것이 매우 어렵습니다, 기존의 기업 고객이 낮은 충족하기 어려운 RPO (복구 시점 목표) 및 RTO (복구 시간 목표)의 호소. 연속 데이터 보호 제품 포지셔닝과 스냅 샷, 복제 있지만 (복제) 기능은 약간 오버랩되지만 CDP 광범위한 위치는 데이터 보호, 회복,보다 효율적인 업무 연속성에 집중하고는 스냅 샷에 한정되지 데이터를 이동합니다.

새로운 데이터 기록 모드, 및 로그 저장 : 새로운 저장 블록 새로운 아키텍처 Pangu2.0 드라이브 포함 특정 로그 구조 블록 장치 (로그 구조 블록 장치)에서의 연속적인 데이터의 보호를 실현할 수있는 기회를 제공한다 그래서 크게 스냅 샷 및 지속적인 데이터 보호의 실현을 용이하게합니다. 낮은 RTO는 전통적인 비즈니스 사용자와 낮은 RPO의 고급 데이터 보호의 긴급한 요구를 충족하면서 나는 모두 스토리지 성능의 클라우드 비즈니스의 가속과 믿을. 그러나, 동작을 고려하여 동시에 데이터 백업 및 데이터 백업, 운용 데이터는 데이터 보호의 효과를 판단 큰 정도로 회복 될 수있다.

둘째, 데이터 보호 문제

오늘날의 데이터 보안이 전례없는 높이로 불렸다에서 데이터 보호의 주제는 점점 더 민감하게된다. 때문에 점점 더 비즈니스 사용자를위한 다운 타임의 영향 때문입니다. 2017 년, 같은 WannCry, 상세 설명 및 Locky 자주 오용 삭제 라이브러리, 데이터 보안 및 데이터 보호를위한 클라우드 사용자의 기대를 작성하는 사용자의 백업 소프트웨어에 심지어 직접 공격으로 바이러스, 랜섬은 점점 더 높다.

데이터는 점점 더 중요 해지고있다 : 데이터 = 데이터 = 자원 자산

2017년 1월, "Gitlab 실수로 삭제 라이브러리 물건 의 조각"산업과 주요 정보 보안 위험으로 인한 민감한 신경. 그것은 Gitlab 복구하는 과정에서, 백업 메커니즘의 나머지 다섯 종류의 사용할 수없는 동안 만 db1.staging 데이터베이스를 복구하는 데 사용할 수 있습니다 발견 주목할 만하다. db1.staging 6 시간 데이터,하지만 느린 복구 프로세스의 결과로 제한된 전송 속도, 전, Gitlab은 결국 데이터의 거의 6 시간 잃었다.

따라서, 데이터 손실의 위험을 줄이는 방법, 효율적인 복구 메커니즘, 사용자의 긴급한 요구 사항을 제공, 사용자의 손실을 줄이고, 데이터 보호 창을 줄일 수 있습니다. 또한, 하나 개의 측면에서 볼 수 있으며, 검증 낮은 RTO의 복구, 데이터 보호의 중요성,이 시점에서 스토리지 비용을 회수 위상 데이터는 매우 중요 짚이다.

셋째, 데이터 보호의 연속성 정의

스토리지 네트워킹 협회에 대한 지속적인 데이터 보호의 정의 (SNIA) : 지속적인 데이터 보호는 과거에 복원 할 수 있습니다 캡처하거나 데이터 변경 사항을 추적하고, 데이터를 확인하기 위해 외부의 독립적 인 생산 데이터를 저장할 수있는 방법이다 어떤 시점. 연속 데이터 보호, 회복 점의 거의 무한한 수를 달성하기 위해, 복구 복구 충분한 입도 (granularity)를 제공 할 수있는 블록, 파일이나 애플리케이션의 구현에 기초 할 수있다.

로 세계에서 가장 권위있는 IT 연구 및 컨설팅 회사 (가트너) 정의 : 지속적인 데이터 보호 복구 방법입니다 로그의 형태로 동시에 연속 또는 거의 지속적인 데이터 캡처 또는 추적 파일 또는 변경 데이터 블록, 저장. 이 기능은 데이터의 손실을 줄이기 위해, 좀 더 세분화 된 실시간 포인트를 제공하고, 어떤 복구가 불가능 지적한다. 일부 CDP 솔루션은 지속적으로 데이터 변경 (참 CDP) 또는 특정 시간 변경 데이터 캡처 (준 CDP)에서 크롤링하도록 구성 할 수 있습니다.

RPO와 RTO : CDP의 상태를 표현하기 위해 두 가지 개념의 도입이 필요합니다.

  • RPO (복구 시점 목표) : 복구 시점 목표, 백업 간격 시간에서 데이터가 손실됩니다 재해, 참조.

  • RTO (복구 시간 목표) : 복구 시간 목표는, 재해시의 사업은 복구 시간입니다, 계속 작동 할 수 있도록 수있는 기간을 의미합니다.

  • CDP 진정한 개념을 위해 RPO = 0, 0에 가까울 RTO로 정의는 CDP되어있다. : 통화가 제로 RPO하지 않을 때 니어 CDP (준의 CDP는).                                                                                                                                       

넷째, 지속적인 데이터 보호 기능

기존의 데이터 보호 솔루션은 데이터의 정기적 인 백업에 초점을 맞추고, 그것은 등등 백업 윈도우, 데이터 일관성 및 생산 시스템에 미치는 영향과 문제를 동반하고있다. (시스템이 계속 지속적으로 자동화 된 데이터 보호를 위해 키 데이터의 변화를 모니터링하기 때문에 CDP)를 CDP를 새로운 데이터 보호 도구를 사용자에게 제공, 시스템 관리자 만 재해 후, 백업 프로세스 데이터를 염려 할 필요가 없습니다 단순히 데이터의 빠른 복구 시간 백업 특정 시점으로 데이터를 복원 할 필요를 선택합니다. 

기존의 지속적인 데이터 보호에 비해 지속적인 데이터 보호 및 재해 복구 기술은 다음과 같은 독특한 기능을 가지고 있습니다 :

(1) 처음 크게 데이터 복구 시점 목표 (RPO)를 향상시킬 수있다. 사용자가 스냅 샷 기술을 사용하여 24 시간까지 데이터 손실의 위험에 직면하게 될 것이다 있도록 백업 간격 데이터 보호 기술은 일반적으로 24시간 (하루에 한 번 백업)이며, 데이터 손실의 위험은 몇 시간 감소 및 CDP 할 수있다 달성 될 수있는 데이터 손실의 양은 (물론, CDP 다른 제품 및 솔루션의 시간 정밀도는 동일하지 않다) 몇 초 감소 될 수있다. 데이터가 관리 모드를 복사에 대한 사실, 종래 기술에 사용, 데이터 보호가이다 "시간에 단일 지점 (단일 점 -에 - 시간)", 지속적인 데이터 보호 및 보호 (어떤 포인트에서 어느 시점에서 "달성 될 수있다 - 시간) "데이터 보호. 

2、虽然复制(Replication)技术可以通过与生产数据的同步获得数据的最新状态,但其无法规避由人为的逻辑错误或病毒攻击所造成的数据丢失。当生产数据由于以上原因导致数据遭到破坏时(例如数据被误删除),复制技术会将遭到破坏的数据状态同步到后备数据存储系统,使后备数据也受到破坏。CDP系统可以使数据状态恢复到数据遭到破坏之前的任意一个时间点,也就可以消除前者具有的风险。 

3、由于恢复时间和恢复对象的粒度更细,所以连续数据保护保护的数据恢复也更加灵活。目前的部分产品和解决方案允许最终用户(而不仅仅是系统管理员)直接对数据进行恢复操作,这在很大程度上方便了使用者。 

五、实现方式

连续数据保护实现的关键技术是对数据变化的记录和保存,以便实现任意时间点的快速恢复。一般来讲,有三种实现方式:

  • 基准参考数据模式。建立参考数据拷贝,根据生产数据变化记录数据差异日志,根据日志差异按需恢复数据。基准参考数据模式原理简单,实现起来比较容易,但由于数据恢复时需要从最原始的参考数据开始,逐步进行数据恢复,因此恢复时间比较长,尤其是恢复时间点越靠近当前的时间,恢复所需要的时间就越长。  

  • 复制参考数据模式。生产数据和参考数据副本实时同步,在同步的同时记录回退日志或事件,基于回退日志(Undo     Log)差异实现数据按需恢复。复制参考数据模式和基准参考数据模式在实现原理上恰好相反。复制参考数据模式在数据恢复时,恢复的时间点越靠近当前,所需要的恢复时间越短。但在数据的保存过程中,需要同时进行数据和日志记录的同步,需要较多的系统资源。 

  • 合成参考数据模式。合成参考数据模式是以上两种模式的折衷,较好地实现了以上两种模式的妥协,因此可以得到较好的资源占用和恢复时间效果。但需要复杂的软件管理和数据处理功能,实现起来比较复杂。 连续数据保护技术或解决方案的实现有多种模式。

不同的传统厂商建立了不同的连续数据保护保护模型,参考SNIA的存储共享模型, 可以将实现连续数据保护的产品或解决方案分为基于应用、基于文件和基于数据块的连续数据保护保护。本文主要从数据块层面讲CDP的实现。基于块的CDP功能直接运行在物理的存储设备或逻辑的卷管理器上,甚至也可以运行在数据传输层上。当数据块写入生产数据的存储设备时,CDP系统可以捕获数据的拷贝并将其存放在另外一个存储设备中。 基于数据块的数据保护又有基于主机层、基于传输层和基于存储层三类实现方式

六、传统数据保护产品的CDP

 下面以FalconStorCDP、VeeamCDP及EMC RecoverPoint这3个厂商,从不同背景进行分析,具有一定的代表性:飞康是传统的连续数据保护产品的代表。EMC传统的存储厂商,收购以前的RecoverPoint打造自己的数据保护套件, 方案建立在自己的存储上,提供物理机到虚拟机的保护方案。Veeam 是虚拟机保护的后起之秀,主打虚拟化平台上,VMWARE 及 HYPERV的数据保护,扩展到云端,目前的方案依赖于VMWare的VAIO 虚拟化数据获取框架。

 

EMCRecoverPoint/SE 是针对 EMC CLARiiON 系列阵列的全面解决方案,而 EMC RecoverPoint则是针对整个数据中心的全面解决方案。两种产品都提供了使用连续数据保护 (CDP)的同步本地复制,以及具有任意时间点恢复功能的同步和异步连续远程复制 (CRR)。在RecoverPoint 应用装置上同时运行CDP和CRR实现本地和远程(CLR) 数据保护,使您能够用单个解决方案同时在本地和远程保护相同数据。 飞康CDP解决方案整合了数据备份、系统恢复、灾难恢复、本地及异地容灾等多项功能。飞康CDP是基于磁盘的备份与容灾一体化解决方案,实现文件/数据库/操作系统的实时备份与瞬间恢复;实现了验证、演练的本地/异地容灾功能整合。

 

七、主要云厂商的数据保护方式

AWS仅提供原生的快照功能及帮助客户上云的手段,数据备份等功能依赖于传统的数据保护厂商;Azure提供基于虚拟机的基本的备份及恢复方式,没有提供CDP等高级功能。

八、可验证的弹性的连续数据保护CDP

根据Gartner的描述的弹性的云备份引擎,其中规定的了成功弹性备份的几个特征:

  • 弹性的云备份引擎需要快速的RTO,这就要求备份引擎和数据恢复在一个数据中心。

  • 弹性的云备份引擎需要有全备份,没有过大的WAN数据传输,将备份与生产机职责分开。

  • 并且要确保数据的可恢复性。

连续数据保护CDP本质上作为一种高级的数据保护方案,由云厂商进行,具有传统备份所不具有的弹性。传统厂商为了上云,必然需要将数据经过WAN传输到云端,必然耗费CPU资源,必然耗费IO资源。为了躲避资源的耗费,可能采取定时开启的任务方式,连基本的弹性的备份都保证不了,更谈不上CDP。可验证性,强调了CDP方案的可靠性,可操作性。为了保证应用程序的数据的跨卷一致性,需要卷之间建立一致性组(Consistency Group)及应用程序的一致性(Application Consistency)。

 

九、结论

数据保护不是亡羊补牢,需要未雨绸缪。随着企业上云的快速增长,传统企业对云端数据保护的诉求更加突出;随着数据重要性的日益提高,用户对数据丢失的敏感程度前所未有,从而使得云端数据保护与用户需求之间的矛盾更加凸显。

传统的基于块存储的连续数据保护因为大多依赖于特定的存储设备,并不具有云端实现所具有的弹性,并不适应云端分布式环境的复杂性。

连续数据保护作为传统或者混合云数据保护的重要补充,定会以新的解决方案的出现而被企业用户所重视。全新的Pangu2.0的块存储的架构为实现云端连续性数据保护提供了契机,

随着企业上云的加速,在兼顾存储性能的同时,将会满足传统高级企业用户的低RTO及低RPO的数据保护的紧迫需求。

后续文章将会着重阐述基于基准参考数据模型的云端连续数据保护,该方案基于Pangu2.0的Block Storage实现连续性数据保护,着重描述连续数据保护的秒级数据恢复机制。

 -END- 

关注“技术领导力”公众号

老K主理,文出过畅销书、武做过CTO

用故事讲技术,有趣,有料!

想加入社区,跟100位互联网大咖学习?

添加群助理Emma,注明“加群”

技术领导力社群


大家在看:

1.从微盟的5张架构PPT,分析“删库跑路“原罪

1.马化腾:普通人追求安全感,高手拥抱不确定

2.张一鸣:为什么 BAT 挖不走我们的人才?

3.迷信中台是一种病,得治

4.李开复:职场人35岁以后,真诚比面子重要

5.阿里中台架构15篇干货,100页ppt精选

6.雷军、张一鸣,价值千亿的6个思维模式

喜欢就点在看!

发布了152 篇原创文章 · 获赞 732 · 访问量 19万+

추천

출처blog.csdn.net/yellowzf3/article/details/104568322