MyCat专题(十)-MyCat分片规则之枚举分片

1.简介

在MyCat中，有许多分片规则，比如枚举分片、取模分片、范围分片、一致性hash分片等等，每一种分片规则都需要根据项目中具体的业务已经数据量来决定，所以说没有哪一种分片规则很好，哪一种分片规则就不好，都是依业务来定。本文将对其中一种，也是比较简答的分片规则 - 枚举分片进行简单的介绍，并通过一个示例说明其用法以及规则。

2.实现方式

按照partition-hash-int-enum.txt配置的枚举匹配规则，将符合条件的记录分配到对应节点上，不满足条件的分配到默认节点（简单来讲，就是根据某个值，决定这条数据放到哪一个库里面）。

3.使用场景

比如有些业务需要按照省份或区县来进行保存，而全国省份区县是固定的，这时候可以考虑将使用枚举分片规则，具体使用场景可根据自己具体的业务场景确定。

4.实现步骤

【a】创建数据库以及表：

create database testEnum1;
create database testEnum2;
 
use testEnum1;
create table order_info(id int not null,name varchar(32),province varchar(32));
 
 
use testEnum2;
create table order_info(id int not null,name varchar(32),province varchar(32));

在这里插入图片描述
【b】配置server.xml指定逻辑库，用户名密码等

<mycat:server xmlns:mycat="http://io.mycat/">
	<system>
	<property name="useSqlStat">0</property>  <!-- 1为开启实时统计、0为关闭 -->
	<property name="useGlobleTableCheck">0</property>  <!-- 1为开启全加班一致性检测、0为关闭 -->
 
		<property name="sequnceHandlerType">2</property>
      <!--  <property name="useCompression">1</property>--> <!--1为开启mysql压缩协议-->
        <!--  <property name="fakeMySQLVersion">5.6.20</property>--> <!--设置模拟的MySQL版本号-->
	<!-- <property name="processorBufferChunk">40960</property> -->
	<!-- 
	<property name="processors">1</property> 
	<property name="processorExecutor">32</property> 
	 -->
		<!--默认为type 0: DirectByteBufferPool | type 1 ByteBufferArena-->
		<property name="processorBufferPoolType">0</property>
		<!--默认是65535 64K 用于sql解析时最大文本长度 -->
		<!--<property name="maxStringLiteralLength">65535</property>-->
		<!--<property name="sequnceHandlerType">0</property>-->
		<!--<property name="backSocketNoDelay">1</property>-->
		<!--<property name="frontSocketNoDelay">1</property>-->
		<!--<property name="processorExecutor">16</property>-->
		<!--
			<property name="serverPort">8066</property> <property name="managerPort">9066</property> 
			<property name="idleTimeout">300000</property> <property name="bindIp">0.0.0.0</property> 
			<property name="frontWriteQueueSize">4096</property> <property name="processors">32</property> -->
		<!--分布式事务开关，0为不过滤分布式事务，1为过滤分布式事务（如果分布式事务内只涉及全局表，则不过滤），2为不过滤分布式事务,但是记录分布式事务日志-->
		<property name="handleDistributedTransactions">0</property>
		
			<!--
			off heap for merge/order/group/limit      1开启   0关闭
		-->
		<property name="useOffHeapForMerge">1</property>
 
		<!--
			单位为m
		-->
		<property name="memoryPageSize">1m</property>
 
		<!--
			单位为k
		-->
		<property name="spillsFileBufferSize">1k</property>
 
		<property name="useStreamOutput">0</property>
 
		<!--
			单位为m
		-->
		<property name="systemReserveMemorySize">384m</property>
 
 
		<!--是否采用zookeeper协调切换  -->
		<property name="useZKSwitch">true</property>
 
 
	</system>
	
	<!-- 全局SQL防火墙设置 -->
	<!-- 
	<firewall> 
	   <whitehost>
	      <host host="127.0.0.1" user="mycat"/>
	      <host host="127.0.0.2" user="mycat"/>
	   </whitehost>
       <blacklist check="false">
       </blacklist>
	</firewall>
	-->
	
	<user name="root">
		<property name="password">123456</property>
		<property name="schemas">TESTENUM</property>
		
		<!-- 表级 DML 权限设置 -->
		<!-- 		
		<privileges check="false">
			<schema name="TESTDB" dml="0110" >
				<table name="tb01" dml="0000"></table>
				<table name="tb02" dml="1111"></table>
			</schema>
		</privileges>		
		 -->
	</user>
 
	<user name="user">
		<property name="password">123456</property>
		<property name="schemas">TESTENUM</property>
		<property name="readOnly">true</property>
	</user>
 
</mycat:server>

【c】配置schema.xml指定逻辑表，枚举分片规则、分片节点等

<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">
 
        <schema name="TESTENUM" checkSQLschema="false" sqlMaxLimit="100">
                <table name="order_info" dataNode="dn$1-2" rule="sharding-by-intfile-enum"/>
        </schema>
 
        <dataNode name="dn1" dataHost="localhost1" database="testEnum1" />
        <dataNode name="dn2" dataHost="localhost1" database="testEnum2" />
 
        <dataHost name="localhost1" maxCon="1000" minCon="10" balance="0"
                          writeType="0" dbType="mysql" dbDriver="native" switchType="1"  slaveThreshold="100">
                <heartbeat>select user()</heartbeat>
                <!-- can have multi write hosts -->
                <writeHost host="hostM1" url="192.168.70.128:3306" user="root" password="123">
                </writeHost>
        </dataHost>
 
</mycat:schema>

【d】配置rule.xml指定分片规则为枚举分片

<tableRule name="sharding-by-intfile-enum">
	<rule>
		<columns>province</columns>
		<algorithm>hash-int-enum</algorithm>
	</rule>
</tableRule>
 
<function name="hash-int-enum" class="io.mycat.route.function.PartitionByFileMap">
	<property name="mapFile">partition-hash-int-enum.txt</property>
	<property name="type">1</property>
	<property name="defaultNode">0</property>
</function>

mapFile属性： 切分规则匹配配置文件
type属性： 类型 ，1表示字符串，0表示是int类型
defaultNode属性： 默认的节点 ，小于0表示不设置默认节点，大于等于0表示设置默认节点

【e】配置partition-hash-int-enum.txt，指定哪个枚举值对应到哪个分片节点
在这里插入图片描述

[root@centos1 conf]# chmod 777 partition-hash-int-enum.txt

在这里插入图片描述
添加自定义的分片规则配置文件 vim partition-hash-int-enum.txt

gz=0
sz=1

【f】测试插入数据

重启mycat, 然后登录mycat：
在这里插入图片描述
然后插入数据进行测试：

insert into order_info(id,name,province) values('1111','1','gz');
insert into order_info(id,name,province) values('2222','2','sz');

根据枚举匹配结果，正常第一条记录应该匹配到第一个分片节点dn1, 第二条记录应该被保存在dn2节点。

逻辑库TESTENUM：
在这里插入图片描述
可见，逻辑库中已经成功插入了两条数据，下面我们分别查看这两条数据到底插入到哪个真实物理数据库中。

testEnum1数据库：
在这里插入图片描述
testEnum2数据库：

如上面两个图，说明数据确实按照预期枚举分片的规则进行路由了。province=gz的数据被路由到dn1, province=sz的数据被路由到dn2中。

如果碰到无法匹配的枚举值，将会走默认分片节点dn1,如下所示：

insert into order_info(id,name,province) values('3333','3','zh');

在这里插入图片描述
逻辑库：
testEnum1数据库：

【g】查询测试

explain select * from order_info where province = 'sz';

使用分片字段进行查询：
在这里插入图片描述

不使用分片字段进行查询：

explain select * from order_info where name = '1';

在这里插入图片描述
可见，如果没有使用分片字段进行查询的话，则查询sql语句会发送到所有的分片节点上去查询。

5.总结

以上就是关于枚举分片的详细实现步骤，总结需要注意的几点：

a. 自定义规则配置文件rule.xml，指定分片字段、分片函数以及mapFile；
b. schema.xml声明逻辑表的时候指定rule=“xxx”, xxx对应rule.xml中tableRule的name；
c. 添加自定义的分片规则配置文件 vim partition-hash-int-enum.txt；

另外，补充一下rule.xml配置文件说明：

rule.xml: 定义了很多各种分片算法和规则，在声明逻辑表的时候进行制定分片规则。
(1) tableRule 标签：

<tableRule name="mod-long"> 
    <rule> 
        <columns>order_id</columns> 
        <algorithm>mod-long</algorithm> 
    </rule> 
</tableRule>

name属性：指定分片规则的名字，与schema.xml中table标签rule的名字对应
columns属性: 指定具体的分片字段
algorithm属性：指定分片函数，即分片算法，与funciton标签的name对应

(2) function 标签

<function name="hash-int" 
class="org.opencloudb.route.function.PartitionByFileMap">                 
    <property name="mapFile">partition-hash-int.txt</property> 
</function>

name属性： 指定分片算法的名字，在rule标签中algorithm属性中使用
class属性： 指定分片算法具体的实现类名字
property属性： 指定分片算法需要用到的一些属性

bruceliu9527

发布了301 篇原创文章 · 获赞 82 · 访问量 2万+

私信关注