MyCAT让人诟病的配置文件,说说破局的思路

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/yangjianrong1985/article/details/102618109

这是学习笔记的第 2135 篇文章


640?wx_fmt=gif

 最近在做MySQL分布式环境的统筹管理,目前碰到的痛点是对于集群的配置管理目前是松散的,几套环境还能忍受,如果环境多了之后还是很容易凌乱,所以我们需要一套机制来保证。

  在中间件层面,Mycat的配置管理是很让人诟病的。第一层就是文件配置管理方面,我想这应该是受到诟病最多的地方了。比如增加一个周期表,按照日期来做拆分,那么每隔一段时间就需要特意维护一次,一来是扩展新表,来是清理数据,这个过程中会操作schema.xml文件,在里面新增一些行,删除一些行,这个工作看起来繁琐而且重复度极高。

 就是这样的任务配置,在最近的一些操作中竟然碰到了钉子,在此推荐的第一要则就是修改配置文件前请先备份schema.xml文件,大体来说schema.xml的配置是重中之重,但是很容易出现一些意料之外的问题

第一种情况是出现异常导致,schema.xml文件被刷掉;

第二种情况是在schema.xml文件里面使用vim编辑,如果出现格式问题,重新加载配置文件是失败的,但是不会提示你哪一行出现了问题。 

第三种情况比较诡异,即没有任何明显的配置问题,就是新增了几行,删除了几行,但是就是提示加载配置文件失败

第四种情况是逻辑问题,比如我们按照日期来进行分表,那么会产生test_20191016,test_20191017这样的表,但是每个月不是都有31天,所以我们配置的时候还是可能配置错误,比如10月份漏了第31天,导致业务写入不了数据就比较尴尬了。

  对于MyCAT的这个问题,有两类解决的思路:

第一类是从上往下,也算是MyCAT创建表的一个小技巧,在较新的版本中是支持create table的。我们可以在schema.xml文件中配置记录,然后在中间件中使用create table来创建表。

这一层的难点是处理好schema.xml文件的问题。

大体来说有如下的一些流程需要注意: 

创建表流程

1.备份已有的schema.xml配置文件

2.根据逻辑生成新增的对象配置

3.刷新配置文件

4.执行SQL脚本创建表

5.同步配置文件至其他中间件服务

6.检查稽核表是否连续

7.检查表是否在安全期以内

周期表删除

1.备份已有的schema.xml配置文件

2.执行SQL脚本删除表

3.根据逻辑删除对象配置

4.刷新配置文件

5.同步配置文件至其他中间件服务

6.检查稽核表是否连续

7.检查表是否在安全期以内

可以看到流程中有很多的共通之处,如果细化处理好每一个步骤,是可以很快构建出这个流程的。

第二类解决思路是从下往上,即通过底层的配置开始逐步完善,然后上推到配置中,这是一种更加通用的方式,如果配置出现一些问题,我们依然可以通过底层的逻辑关系很快构建出来。

  我们可以设想几个场景,比如我们要新增一个表,那么在配置层面生效之外,还需要在数据库层面生效,至于分片的规则策略,数据节点的配置管理应该是一体化的工作,比如新建表应该是关联主从复制环境的主库来执行。

比如对一张表做变更,则不会涉及配置层面的变动,需要映射相关的数据节点即可。

比如需要对分布式环境的数据做数据流转和归档,则映射到数据节点应该是从库端去抽取数据。

比如开放集群的元数据给业务方,则对所有的业务场景都需要做到信息融合,比如开通权限,要对中间件节点开通权限即可,如果要创建账号,则需要映射到相关的数据节点上面。

所以对于这个分布式管理模式,操作层面我倒不是很担心,主要是担心这个模型层面该怎么玩。从目前我梳理的信息来看,主要包含如下的几个维度:

元数据信息涉及:集群,路由,实例,数据库,表,如下图所示:

640?wx_fmt=png

我们分为创建表,变更表,元数据访问入口,数据流转和归档四个场景来进行模型的说明。

首先是创建表,是目前的模型设计中最为复杂的。对于元数据的整理和梳理,可以参考如下的映射关系。

640?wx_fmt=png

最后的部分是对于配置生效,我们可以刷新中间件的配置信息生效。而纵观整个方案,其实是分成了三个较大的维度。

640?wx_fmt=png

对于变更表来说,操作复杂度会低很多,主要涉及中间件配置和实例层的配置变动。

640?wx_fmt=png

对于元数据提取的需求,则对中间件配置层的信息是弱化的,主要对接的是集群层面的信息。

640?wx_fmt=png

有的同学可能会有疑问:为什么中间件层和集群层的配置都会各搞一套,其中一个原因是他们的角色和定位不同,而本质上集群层面的信息是更加通用的。

对于数据流转和归档,则主要是中间件配置和实例,表层面的信息对接,映射到从库,从从库中提取数据。

640?wx_fmt=png

整个模型的设计需要很多细化的工作和API模式管理。

相关链接:

个人新书 《MySQL DBA工作笔记》

个人公众号:jianrong-notes

QQ群号:763628645

QQ群二维码如下,个人微信号:jeanron100, 添加请注明:姓名+地区+职位,否则不予通过

640?wx_fmt=png640?wx_fmt=png

在看,让更多人看到

猜你喜欢

转载自blog.csdn.net/yangjianrong1985/article/details/102618109