背景
有关HBase集群如何做不停服的数据迁移一直都是云HBase被问的比较多的一个问题,目前有许多开源的工具或者HBase本身集成的方案在性能、稳定性、使用体验上都不是很好,因此阿里云提供了BDS迁移服务,可以帮助云上客户实现TB级数据规模不停机迁移
支持场景
- HBase大版本升级, 1.x升级2.x
- 集群配置升级,8核16G升级为16核32G
- 集群网络环境变更,经典网络迁移到VPC
- 异地跨机房迁移
- HBase业务拆分
方案介绍
开源方案
HBase不停机迁移主要包括三个部分:表结构的迁移、实时数据同步、历史全量数据迁移
表结构迁移
对于表结构迁移来说,开源的DataX还是HBase本身都不提供表结构迁移的功能,只能进行手动建表,手动建表会存在几个问题:
- 如果源集群表数据较多,客户手动建表比较麻烦
- 手动建表可能忽略表分区,导致目标表分区很不合理,迁移完之后