MySQL分表

MySQL分表

为什么要分表

       当一张的数据达到几百万时,你查询一次所花的时间会变多,如果有联合查询的话,我想有可能会死在那儿了。分表的目的就在于此,减小数据库的负担,缩短查询时间。

    根据个人经验,mysql执行一个sql的过程如下:

  • 接收到sql;
  • 把sql放到排队队列中 ;
  • 执行sql;
  • 返回执行结果。

    在这个执行过程中最花时间在什么地方呢?第一,是排队等待的时间,第二,sql的执行时间。其实这二个是一回事,等待的同时,肯定有sql在执行。所以我们要缩短sql的执行时间。

mysql中有一种机制是表锁定和行锁定,为什么要出现这种机制,是为了保证数据的完整性,我举个例子来说吧,如果有二个sql都要修改同一张表的同一条数据,这个时候怎么办呢,是不是二个sql都可以同时修改这条数据呢?很显然mysql对这种情况的处理是,一种是表锁定(myisam存储引擎),一个是行锁定(innodb存储引擎)。表锁定表示你们都不能对这张表进行操作,必须等我对表操作完才行。行锁定也一样,别的sql必须等我对这条数据操作完了,才能对这条数据进行操作。如果数据太多,一次执行的时间太长,等待的时间就越长,这也是我们为什么要分表的原因。

什么时候分区什么时候分表

1. 其实分区分表都是为了提高MySQL的性能,为了提高并发性

2. 大访问量,并且表数据比较多的情况,建议分表和分区结合

3. 访问量不大,但是数据很多,可以只是分区

分表的方法(大致分三种)

做mysql集群,例如:利用mysql cluster ,mysql proxy,mysql replication,drdb等等

也不算真正意义上的分表,只是做了主从数据库。

优点:读写分离,数据同步,扩展性好,没有多个分表后的复杂操作(php代码)

缺点:单个表的数据量还是没有变,一次操作所花的时间还是那么多,硬件开销大。

预先估计会出现大数据量并且访问频繁的表,将其分为若干个表

将一个表拆分成了多个表

1.按自然时间来分表(按年月拆分)

2.按数字数据分表数求余

3.按md5值来分表

优点:避免一张表出现几百万条数据,缩短了一条sql的执行时间

缺点:当一种规则确定时,打破这条规则会很麻烦,上面的例子中我用的hash算法是crc32,如果我现在不想用这个算法了,改用md5后,会使同一个用户的消息被存储到不同的表中,这样数据乱套了。扩展性很差。

利用merge存储引擎来实现分表

这种方法比较适合,那些没有事先考虑,而已经出现了得,数据查询慢的情况。这个时候如果要把已有的大数据量表分开比较痛苦,最痛苦的事就是改代码,因为程序里面的sql语句已经写好了,现在一张表要分成几十张表,甚至上百张表,这样sql语句是不是要重写呢?

CREATE TABLE t1 (  a INT NOT NULL AUTO_INCREMENT PRIMARY KEY,  message CHAR(20))engine=myisam ;
CREATE TABLE t2 (  a INT NOT NULL AUTO_INCREMENT PRIMARY KEY,  message CHAR(20))engine=myisam ;
CREATE TABLE total (a INT NOT NULL AUTO_INCREMENT PRIMARY KEY, message CHAR(20)) ENGINE=MERGE UNION=(t1,t2) INSERT_METHOD=LAST;

 参考:http://blog.csdn.net/rorntuck7/article/details/50668060

参考:

http://www.cnblogs.com/freeliver54/archive/2011/01/28/1947167.html

http://www.jb51.net/article/68990.htm

猜你喜欢

转载自youyu4.iteye.com/blog/2338199