Day27-MySQL下


title: Day27-MySQL下
date: 2020-08-14 16:43:47
author: 子陌


MySQL - 下

应用优化

使用连接池

对于访问数据库来说,建立连接的代价是比较昂贵的,因为我们频繁的创建关闭连接,是比较耗费资源的,我们有必要建立数据库连接池,以提高访问的性能。

减少对MySQL的访问

  1. 在编写应用代码时,需要能够理清对数据库的访问逻辑。能够一次连接就获取到结果的,就不用两次连接,这样可以大大减少对数据库无用的重复请求。
  2. 增加cache层
    • 在应用中,我们可以在应用中增加缓存层来达到减轻数据库负担的目的。缓存层有很多种,也有很多实现方式,只要能达到降低数据库的负担又能满足应用需求就可以。
    • 因此可以部分数据从数据库中抽取出来放到应用端以文本方式存储,或者使用框架(Mybatis,Hibernate)提供的一级缓存/二 级缓存,或者使用redis数据库来缓存数据。

负载均衡

负载均衡是应用中使用非常普遍的一种优化方法,它的机制就是利用某种均衡算法,将固定的负载量分布到不同的服务器上,以此来降低单台服务器的负载,达到优化的效果。

  1. 利用MySQL赋值分流查询

    通过MySQL的主从复制,实现读写分离,使增删改操作走主节点,查询操作走从节点,从而可以降低单台服务器的读写压力。

赋值分流查询

  1. 采用分布式数据库架构

    分布式数据库架构适合大数据量、负载高的情况,它有良好的拓展性和高可用性。通过在多台服务器之间分布数据,可以实现在多台服务器之间的负载均衡,提高访问效率。

MySQL中查询缓存优化

开启Mysg|的查询缓存,当执行完全相同的SQL语句的时候,服务器就会直接从缓存中读取结果,当数据被修改,之前的缓存会失效,修改比较频繁的表不适合做查询缓存。

查询缓存

  1. 客户端发送一条查询给服务器
  2. 服务器先会检查查询缓存,如果命中了缓存,则立即返回存储在缓存中的结果。否则进入下一阶段
  3. 服务器端进行SQL解析、预处理,再由优化器生成对应的执行计划

查询缓存参数配置

  • 查看当前的MySQL数据库是否支持查询缓存:

    SHOW VARIABLES LIKE 'have_query_cache';

  • 查看当前MySQL是否开启了查询缓存:

    SHOW VARIABLES LIKE 'query_cache_type';

  • 查看查询缓存的占用大小:

    SHOW VARIABLES LIKE 'query_cache_size';

  • 查看查询缓存的状态变量:

    SHOW STATUS LIKE 'Qcache%';

查询缓存变量

开启查询缓存

MvSQL的查询缓存默认是关闭的,需要手动配置参数query_cache_type来开启查询缓存。query_cache_type该参数的可取值有三个:

含义
OFF或0 查询缓存功能关闭
ON或1 查询缓存功能开启,select的结果符合缓存条件即会缓存,否则,不予缓存,显式指定SQL_NO_CACHE,不予缓存
DEMAND或2 查询缓存功能按需进行,显式指定SQL_CACHE的SELECT语句才会缓存;其它均不予缓存

在/usr/my.cnf配置中,增加以下配置:query_cache_type = 1,重启服务即可生效

查询缓存SELECT选项

可以在SELECT语句中指定两个与查询缓存相关的选项:

SQL_CACHE:如果查询结果是可缓存的,并且query_cache_type系统变量的值为ON或DEMAND,则缓存查询结果。

SQL_NO_CACHE:服务器不使用查询缓存。它既不检查查询缓存,也不检查结果是否已缓存,也不缓存查询结果。

查询缓存失效

  1. SQL语句不一致的情况,要想命中查询缓存,查询的SQL语句必须一致。
  2. 当查询语句中有一些不确定的时,则不会缓存。如:now(),current date(),curdate(),curtime(),rand(),uuid(),user(),database()。
  3. 不使用任何表查询语句
  4. 查询mysql,information_schema或performance_schema数据库中的表时,不会走查询缓存。
  5. 在存储的函数,触发器或事件的主体内执行的查询。
  6. 如果表更改,则使用该表的所有高速缓存查询都将变为无效并从高速缓存中删除。这包括使用MERGE映射到已更改表的表的查询。一个表可以被许多类型的语句,如被改变INSERT,UPDATE,DELETE,TRUNCATE TABLE,ALTER TABLE,DROP TABLE或DROP DATABASE。

MySQL中内存管理及优化

内存优化原则

  1. 将尽量多的内存分配给MySQL做缓存,但要给操作系统和其他程序预留足够内存。
  2. MyISAM 存储引擎的数据文件读取依赖于操作系统自身的IO缓存,因此,如果有MyISAM表,就要预留更多的内存给操作系统做IO缓存。
  3. 排序区、连接区等缓存是分配给每个数据库会话( session )专用的,其默认值的设置要根据最大连接数合理分配,如果设置太大,不但浪费资源,而且在并发连接较高时会导致物理内存耗尽。

MyISAM内存优化

MyISAM存储引擎使用key_buffer缓存索引块,加速MyISAM索引的读写速度。对于MyISAM表的数据块,mysq|没有特别的缓存机制,完全依赖于操作系统的IO缓存。

  • key_buffer_size:

    key_buffer_size决定MyISAM索引块缓存区的大小,直接影响到MylSAM表的存取效率。可以在MySQL参数文件中设置key_buffer_size的值,对于一般MyISAM数据库,建议至少将1/4可用内存分配给key_buffer_size。

    在/usr/my.cnf中设置key_buffer_size = 512M

    查看默认大小:show variables like 'key_buffer_size'

  • read_buffer_size:

    如果需要经常顺序扫描MyISAM表,可以通过增大read_buffer_size的值来改善性能。但需要注意的是read_buffer_size是每个session独占的,如果默认值设置太大,就会造成内存浪费。

  • read_rnd_buffer_size:

    对于需要做排序的MyISAM表的查询,如带有order by子句的sql,适当增加read_rnd_buffer_size的值,可以改善此类的sql性能。但需要注意的是read_rnd_buffer_size是每个session独占的,如果默认值设置太大,就会造成内存浪费。

InnoDB内存优化

innodb用一块内存区做IO缓存池,该缓存池不仅用来缓存innodb的索引块,而且也用来缓存innodb的数据块。

  • innodb_buffer_pool_size:
    该变量决定了innodb存储引擎表数据和索引数据的最大缓存区大小。在保证操作系统及其他程序有足够内存可用的情况下,innodb_buffer_pool_size的值越大,缓存命中率越高,访问InnoDB表需要的磁盘I/O就越少,性能也就越高。
    innodb_buffer_pool_size=512M
  • innodb_log_buffer_size:
    决定了innodb重做日志缓存的大小,对于可能产生大量更新记录的大事务,增加innodb_log_buffer_size的大小,可以避免innodb在事务提交前就执行不必要的日志写入磁盘操作。
    innodb_log_buffer_size=10M

MySQL并发参数调整

从实现上来说,MySQL Server是多线程结构,包括后台线程和客户服务线程。多线程可以有效利用服务器资源,提高数据库的并发性能。在Mysq|中,控制并发连接和线程的主要参数包括max_connections、back log、thread_cache_size、table_open_cahce。

  1. max_connections:允许连接MySQL数据库的最大连接数,MySQL默认151
    • connection_errors_max_connections:达到最大连接数时,报错。如果这个值不为0,且一直增长,则说明不断有连接请求因数据库连接数已达到允许最大值而失败,这是可以考虑增大max_connections的值。
    • MySQL最大可支持的连接数,取决于很多因素,包括给定操作系统平台的线程库的质量、内存大小、每个连接的负荷、CPU的处理速度,期望的响应时间等。在Linux 平台下,性能好的服务器,支持500-1000个连接不是难事,需要根据服务器性能进行评估设定。
  2. back_log:MySQL监听TCP端口时设置的挤压请求栈大小。
    • 当max_connections满时,新来的请求会被存在堆栈中,等待某一连接释放资源,该对堆栈数量为back_log,如果超过back_log,将不会授予连接资源,会报错5.6.6前默认50,之后版本默认50+(max_connections / 5),最大不超过900
    • 如果需要数据库在较短的时间内处理大量连接请求,可以考虑适当增大back_log的值。
  3. table_open_cache:控制SQL语句执行线程可打开表缓存的数量,而在执行SQL语句时,每一个SQL执行线程至少要打开1个表缓存。
  4. thread_cache_size:为了加快连接数据库的速度,MySQL会缓存一定数量的客户服务线程以备重用,通过参数thread_cache_size可控制MySQL缓存客户服务线程的数量。
  5. innodb_lock_wait_timeout:该参数是用来设置InnoDB事务等待行锁的时间,默认值是50ms,可以根据需要进行动态设置。对于需要快速反馈的业务系统来说,可以将行锁的等待时间调小,以避免事务长时间挂起;对于后台运行的批量处理程序来说,可以将行锁的等待时间调大,以避免发生大的回滚操作。

MySQL锁问题

锁概述

锁是计算机协调多个进程或线程并发访问某一资源的机制。

在数据库中,除传统的计算资源(如CPU、RAM、I/O 等)的争用以外,数据也是一种供许多用户共享的资源。如何保证数据并发访问的一致性、有效性是所有数据库必须解决的一个问题,锁冲突也是影响数据库并发访问性能的一个重要因素。从这个角度来说,锁对数据库而言显得尤其重要,也更加复杂。

锁分类

  • 从对数据操作的力度分:
    1. 表锁:操作时,会锁定整个表。
    2. 行锁:操作时,会锁定当前操作行。
  • 从对数据操作的类型分:
    1. 读锁(共享锁):针对同一份数据,多个读操作可以同时进行而不会互相影响。
    2. 写锁(排它锁):当前操作没有完成之前,它会阻断其他写锁和读锁。

MySQL锁

相对其他数据库而言,MySQL的锁机制比较简单,其最显著的特点是不同的存储引擎支持不同的锁机制。下表中罗列出了各存储引擎对锁的支持情况:

存储引擎 表级锁 行级锁 页面锁
MyISAM 支持 不支持 不支持
InnoDB 支持 支持 不支持
MEMORY 支持 不支持 不支持
BDB 支持 不支持 支持
  • MySQL这三种锁的特性大致归纳如下:
锁类型 特点
表级锁 偏向MyISAM存储引擎,开销小,加锁快;不会出现死锁;锁定力度大,发生锁冲突的概率最高,并发度最低。
行级锁 偏向InnoDB存储引擎,开销大,加锁慢;会出现死锁;锁定力度最小,发生锁冲突的概率最低并发度也最高。
页面锁 开销和加锁时间界于表锁和行锁之间;会出现死锁;锁定力度界于表锁和行锁之间,并发度一般。

从上述特点可见,很难笼统地说哪种锁更好,只能就具体应用的特点来说哪种锁更合适!仅从锁的角度来说:表级锁更适合于以查询为主,只有少量按索引条件更新数据的应用,如Web应用;而行级锁则更适合于有大量按索引条件并发更新少量不同数据,同时又有并查询的应用,如一些在线事务处理( OLTP )系统。

MyISAM表锁

MyISAM存储引擎只支持表锁,这也是MySQL开始几个版本中唯一支持的锁类型。

  • 如何加表锁

    MyISAM在执行查询语句(SELECT )前,会自动给涉及的所有表加读锁,在执行更新操作(UPDATE、DELETE、INSERT等)前,会自动给涉及的表加写锁,这个过程并不需要用户干预,因此,用户一般不需要直接用LOCK TABLE命令给MyISAM表显式加锁。

显示加表锁语法:

加读锁: lock table tbl_name read;
加写锁: lock table tbl_name write;

MyISAM表锁兼容性

由上表可见:

  1. 对MyISAM表的读操作,不会阻塞其他用户对同一表的读请求,但会阻塞对同一表的写请求

  2. 对MyISAM表的写操作,则会阻塞其他用户对同一表的读和写操作

    简而言之,就是读锁会阻塞写,但是不会阻塞读。而写锁,则既会阻塞读,又会阻塞写。

此外,MyISAM的读写锁调度是写优先,这也是MyISAM不适合做写为主的表的存储引擎的原因。因为写锁后,其他线程不能做任何操作,大量的更新会使查询很难得到锁,从而造成永远阻塞。

查看锁定的征用情况
  • show open tables

    In_user:表当前被查询使用的次数。如果该数为零,则表是打开的,但是当前没有被使用。

    Name_locked:表名称是否被锁定。名称锁定用于取消表或对表进行重命名等操作。

  • show status like 'Table_locks%'

    Table_locks_jimmediate:指的是能够立即获得表级锁的次数,每立即获取锁,值加1。
    Table_locks_waited:指的是不能立即获取表级锁而需要等待的次数,每等待一次,该值加1,此值高说明存在着较为严重的表级锁争用情况。

InnoDB行锁

行锁特点:偏向InnoDB存储引擎,开销大,加锁慢;会出现死锁;锁定力度最小,发生锁冲突的概率最低,并发度也最高。

InnoDB与MyISAM的最大不同有两点:一是支持事务,二是采用了行级锁。

事务及其ACID属性
  • 事务是由一组SQL语句组成的逻辑处理单元。

    事务具有以下4个特性,简称为事务ACID属性。

ACID属性 含义
原子性(Atomicity) 事务是一个原子操作单元,其对数据的修改,要么全部成功,要么全部失败。
一致性(Consistent) 在事务开始和完成时,数据都必须保持一致状态
隔离性(Isolation) 数据库系统提供一定的隔离机制,保证事务在不受外部并发操作影响的“独立”环境下运行。
持久性(Durable) 事务完成之后,对于数据的修改是永久的
并发事务处理带来的问题
问题 含义
丢失更新(Lost Update) 当两个或多个事务选择同一行,最初的事务修改的值,会被后面的事务修改的值覆盖。
脏读(Dirty Reads) 当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个事务也访问这个数据,然后使用了这个数据。
不可重复读(Non-Repeatable Reads) 一个事务在读取某些数据后的某个时间,再次读取以前读过的数据,却发现和以前读出的数据不一致。
幻读(Phantom Reads) 一个事务按照相同的查询条件重新读取以前查询过的数据,却发现其他事务插入了满足其查询条件的新数据。
事务隔离级别

为了解决上述提到的事务并发问题,数据库提供一定的事务隔离机制来解决这个问题。数据库的事务隔离越严格,并发副作用越小,但付出的代价也就越大,因为事务隔离实质上就是使用事务在一定程度上“串行化”进行,这显然与"并发"是矛盾的。
数据库的隔离级别有4个,由低到高依次为Read uncommitted、Read committed、Repeatable read、Serializable,这四个级别可以逐个解决脏写、脏读、不可重复读、幻读这几类问题。

隔离级别 丢失更新 脏读 不可重复读 幻读
Read uncommitted ×
Read committed × ×
Repeatable read × × ×
Serializable × × × ×
  • √:代表可能出现,×:代表不会出现
InnoDB行锁模式

InnoDB实现了以下两种类型的行锁。

  • 共享锁(S):又称为读锁,简称S锁,共享锁就是多个事务对于同一数据可以共享一把锁,都能访问到数据,但是只能读不能修改。
  • 排他锁(X):又称为写锁,简称X锁,排他锁就是不能与其他锁并存,如一个事务获取了一个数据行的排他锁,其他事务就不能再获取该行的其他锁,包括共享锁和排他锁,但是获取排他锁的事务是可以对数据就行读取和修改。

对于UPDATE、DELETE和INSERT语句,InnoDB会自动给涉及数据集加排他锁(X),对于普通SELECT语句,InnoDB不会加任何锁

共享锁(s): select * from tb_name where ... LOCK IN SHARE MODE 
排它锁(x): select * from tb_name where ... FOR UPDATE
无索引行锁升级为表锁

如果不通过索引条件检索数据,那么InnoDB将对表中的所有记录加锁,实际效果跟表锁一样。

由于执行更新时,字段本来为varchar类型,我们是作为数组类型使用,存在类型转换,索引失效,最终行锁变为表锁

间隙锁危害

当我们用范围条件,而不是使用相等条件检索数据,并请求共享或排他锁时,InnoDB会给符合条件的已有数据进行加锁;对于键值在条件范围内但并不存在的记录,叫做"间隙( GAP )",InnoDB也会对这个"间隙"加锁,这种锁机制就是所谓的间隙锁( Next-Key锁)。

(1,2,3,4,6,9)
id < 10
# 间隙为:5,7,8
# 其他的用户无法操作id为5,7,8的行
InnoDB行锁争用情况

show status like 'innodb_row_lock%'

参数 说明
Innodb_row_lock_current_waits 当前正在等待锁定的数量
Innodb_row_lock_time 从系统启动到现在锁定总时间长度
Innodb_row_lock_time_avg 每次等待所花平均时长
Innodb_row_lock_time_max 从系统启动到现在等待最长的一次所花的时间
Innodb_row_lock_wait 系统启动后到现在总共等待的次数

当等待的次数很高,而且每次等待的时长也不小的时候,我们就需要分析系统中为什么会有如此多的等待,然后根据分析结果着手制定优化计划。

总结

InnoDB存储引擎由于实现了行级锁定,虽然在锁定机制的实现方面带来了性能损耗可能比表锁会更高一些,但是在整体并发处理能力方面要远远由于MyISAM的表锁的。当系统并发量较高的时候,InnoDB的整体性能和MyISAM相比就会有比较明显的优势。
但是,InnoDB的行级锁同样也有其脆弱的一面,当我们使用不当的时候,可能会让InnoDB的整体性能表现不仅不能比MyISAM高,甚至可能会更差。

优化建议:

  • 尽可能让所有数据检索都能通过索引来完成,避免无索引行锁升级为表锁。
  • 合理设计索引,尽量缩小锁的范围
  • 尽可能减少索引条件,及索引范围,避免间隙锁
  • 尽量控制事务大小,减少锁定资源量和时间长度
  • 尽可使用低级别事务隔离(但是需要业务层面满足需求)

常用SQL技巧

SQL执行顺序

# 编写顺序
SELECT DISTINCT
	<select_list>						-- 查询哪些字段
FROM
	<left_table><join_type>				 -- 从哪里查询
JOIN
	<right_table> ON <join_condition>	  -- 多表连接查询,查询条件
WHERE
	<where_condition>				   	 -- 查询条件 
GROUP BY
	<group_by_list> 				     -- 分组
HAVING
	<having_condition>					 -- 过滤
ORDER BY
	<order_by_condition>				 -- 排序
LIMIT
	<limit_params>					     -- 分页
# 执行顺序
FROM <left_table>					 # 从哪张表中
ON <join_condition>					 # 查询条件
<join_type> JOIN <right_table>		  # 关联哪些表
WHERE <where_condition>				 # where查询条件
GROUP BY <group_by_list>			 # 分组
HAVING <having_condition>			 # 过滤
SELECT DISTINCT <select_list>		 # 查询哪些字段
ORDER BY <order_by_condition>		 # 排序
LIMIT <limit_params>			    # 分页

正则表达式

select * from t_book where name like 'j%';	-- 匹配j开头的书名
select * from t_book where name like '%j';	-- 匹配j结尾的书名
# 正则表达式
select * from t_book where name regexp '^j';
select * from t_book where name regexp 'j$';

select * from t_book where name regexp '[vuw]';	-- 书名中包含uvw

MySQL支持正则表达式

MySQL常用函数

  1. 数字函数:

    数字函数

  2. 字符串函数:
    字符串函数

  3. 日期函数:
    日期函数

  4. 聚合函数:
    聚合函数

MySQL中常用工具

该mysql不是指mysql服务,而是指mysql的客户端工具

mysql [options] [database]

  • 连接选项
参数:
	-u: -- user=name			指定用户名	
	-p: -- password[=name]	     指定密码
	-h:	-- host=name			指定服务器IP或域名
	-P:	-- port=#			    指定连接端口
示例:
	mysql -h 127.0.0.1 -P 3306 -u root -p
	mysql -h127.0.0.1 -P3306 -uroot -p123456
  • 执行选项:-e --execute=name //执行SQL语句并退出

    此选项可以在mysql客户端执行sql语句,而不用连接到MySQL数据库再执行,对一些批处理脚本,这种方式尤为方便

mysql -uroot -p123456 db_test -e "select * from tb_book"

mysqladmin

mysqladmin是一个执行管理操作的客户端程序。可以用它来检查服务器的配置和当前状态、创建并删除数据库等,

  • 可以通过:mysqladmin --help 指令直看帮助文档
mysqladmin -uroot -p123456 create 'test1';
mysqladmin -uroot -p123456 drop 'test1';
mysqladmin -uroot -p123456 version;

mysqlbinlog

由于服务器生成的二进制日志文件以二进制格式保存,所以如果想要检查这些文本的文本格式,就会使用到mysqlbinlog日志管理工具。

mysqlbinlog [options] log-files1 log-files2 ...

# 选项:
	-d,		-- database=name:		指定数据库名称,只列出指定的数据库相关操作
	-o, 	-- offset=#:		    忽略日志中的前n行命令
	-r,		-- result-file=name:	将输出的文本格式日志输出到指定文件
	-s,		-- short-form:		    显示简单格式,省略掉一些信息
	--start-datatime=data1  --stop-datetime=date2:		指定日期间隔内的所有日志
	--start-position=pos1   --stop-position=pos2:		指定位置间隔内的所有日志

mysqldump

rmysqldump客户端工具用来备份数据库或在不同教据库之间进行数据迁移。备份内容包含创建表,及插入表的SQL语句。

# 连接选项options
	-u: -- user=name			指定用户名	
	-p: -- password[=name]	     指定密码
	-h:	-- host=name			指定服务器IP或域名
	-P:	-- port=#			    指定连接端口

# 示例:
	mysqldump [options] db_name [tables]

	mysqldump [options] --database/B db1 [db2 db3 ...]

	mysqldump [options] --all-databases/-A
	
# 输出内容选项
	--add-drop-database		# 在每个数据库创建语句前加上drop database 语句
	--add-drop-table	    # 在每个表创建语句前加上drop table 语句,默认开启; 不开启(--skip-add-drop-table)
	
	-n,		--no-create-db		# 不包含数据库的创建语句
	-t,		--no-create-info	# 不包含数据表的创建语句
	-d,		--no-data		    # 不包含数据
	-T,		--tab=name		    # 自动生成两个文件:一个.sql文件,创建表结构的语句;
						   	   #			    一个.txt文件,数据文件,相当于select into outfile
						   	   
# 案例:
	mysqldump -uroot -p123456 test tb_book > tb_book_bf.sql
	mysqldump -uroot -p123456 test tb_book --skip-add-drop-table > tb_book_bf.sql
	mysqldump -uroot -p123456 test tb_book -T /tmp test tb_book 

mysqlimport/source

mysqlimport是客户端数据导入工具,用来导入mysqldump加 -T参数后导出的文本文件

  • 语法:mysqlimport [options] db_name textfile1 [textfile2...]
  • 示例:mysqlimport -uroot -p123456 test /tmp/city.txt

如果需要导入sql文件,可以使用mysql中的source指令:

source /root/tb_book.sql

mysqlshow

mysqlshow客户端对象查找工具,用来很快地查找存在哪些数据库、数据库中的表、表中的列或者索引。

# 语法:
	mysqlshow [options] [db_name [table_name [col_name]]]

# 参数:
	--count		# 显示数据库表的统计信息(数据库,表,均可以不指定)
	-i		    # 显示指定数据库或者指定表的状态信息
	
# 示例:
	#查询每个数据库的表的数量及表中记录的数量
	mysqlshow -uroot -p123456 --count

	#查询test库中每个表中的字段书,及行数
	mysqlshow -uroot -p123456 test --count

	#查询test库中book表的详细情况
	mysq1show -uroot -p123456 test book --count

MySQL日志

在任何一种数据库中,都会有各种各样的日志,记录着数据库工作的方方面面,以帮助数据库管理员追踪数据库曾经发生过的各种事件。MySQL也不例外,在MySQL中,有4种不同的日志,分别是错误日志、二进制日志( BINLOG日志)、查询日志和慢查询日志,这些日志记录着数据库在不同方面的踪迹。

错误日志

错误日志是MySQL中最重要的日志之一,它记录了当mysqld启动和停止时,以及服务器在运行过程中发生任何严重错误时的相关信息。当数据库出现任何故障导致无法正常使用时,可以首先查看此日志。
该日志是默认开启的,默认存放目录为mysql的数据目录(var/lib/mysql),默认的日志文件名为hostname.err(hostname是主机名)。

  • 查看日志位置指令:show variables like 'log_error%';
  • 查看日志内容:tail -f /var/lib/mysql/hostname.err

二进制日志

二进制日志(BINLOG)记录了所有的DDL(数据定义语言)语句和DML(数据操纵语言)语句,但是不包括数据查询语句。此日志对于灾难时的数据恢复起着极其重要的作用,MySQL的主从复制,就是通过该binlog实现的。
二进制日志,默认情况下是没有开启的,需要到MySQL的配置文件中开启,并配置MySQL日志的格式。

  • 配置文件位置:/usr/my.cnf
  • 日志存放位置:配置时,给定了文件名但是没有指定路径,日志默认写入Mysq|的数据目录。
#配置开启bin1og日志,日志的文件前缀为mysqlbin -----> 生成的文件名如: mysq1bin.000001, mysqlbin.000002
log_bin=mysqlbin 
#配置二进制日志的格式
binlog_format=STATEMENT/ROW/MIXED
  • 日志格式

    • STATEMENT

      该日志格式在日志文件中记录的都是SQL语句(statement),每一条对数据进行修改的SQL都会记录在日志文件中,通过Mysq|提供的mysqlbinlog工具,可以清晰的查看到每条语句的文本。主从复制的时候,从库(slave)会将日志解析为原文本,并在从库重新执行一次。

    • ROW

      该日志格式在日志文件中记录的是每一行的数据变更,而不是记录SQL语句。比如,执行SQL语句:update tb_book set status=‘1’,如果是STATEMENT日志格式,在日志中会记录一行SQL文件;如果是ROW,由于是对全表进行更新,也就是每一行记录都会发生变更,ROW格式的日志中会记录每一行的数据变更。

    • MIXED

      这是目前MySQL默认的日志格式,即混合了STATEMENT和ROW两种格式。默认情况下采用STATEMENT,但是在一些特殊情况下采用ROW来进行
      记录。MIXED格式能尽量利用两种模式的优点,而避开他们的缺点。

  • 日志读取

    由于日志以二进制方式存储,不能直接读取,需要用mysqlbinlog工具来查看,语法如下:

    mysqlbinlog log-file

    • 查看STATEMENT格式日志:mysqlbin.index该文件是日志索引文件,记录日志的文件名;mysqlbing.000001日志文件

      mysqlbinlog mysqlbing.000001

    • 查看ROW格式日志:直接查看数据看不清楚;可以在mysqlbinlog后加上参数-vv

      mysqlbinlog -vv mysqlbin.000002

日志删除

对于比较繁忙的系统,由于每天生成日志量大,这些日志如果长时间不清楚,将会占用大量的磁盘空间。下面我们将会讲解几种删除日志的常见方法:

  1. 通过Reset Master指令删除全部binlog日志,删除之后,日志编号,将从xxxx.000001重新开始。
  2. 执行指令purge master logs to 'mysqlbin.*******',该指令将删除mysqlbin.*******编号之前的所有日志
  3. 执行指令purge master logs before 'yyyy-mm-dd hh24:mi:ss',该指令将删除日志为"yyyy-mm-dd hh24:mi:ss"之前产生的所有日志
  4. 设置参数--expire_logs_days=#,此参数的含义是设置日志的过期天数,过了指定的天数后日志将会被自动删除,这样将有利于减少DBA管理日志的工作量。

查询日志

查询日志中记录了客户端的所有操作语句,而二进制日志不包含查询数据的SQL语句。

默认情况下,查询日志是未开启的。如果需要开启查询日志,可以设置以下配置:

# 该选项用来开启查询日志,可选值: 0或1;  0代表关闭,1代表开启
general_log=1

# 设置日志的文件名,如果没有指定,默认的文件名为host_name.log
general_log_file=file_ name

慢查询日志

慢查询日志记录了所有执行时间超过参数long_query_time设置值并且扫描记录数不小于min_examined_row_limit的所有的SQL语句的日志。long_query_time默认为10秒,最小为0,精度可以到微秒。

  • 文件位置和格式

    慢查询日志默认是关闭的。可以通过两个参数来控制慢查询日志:

    # 该参数用来控制慢查询日志是否开启,可取值:1和0   1代表开启,0代表关闭
    slow_query_log=1
    # 该参数用来指定慢查询日志的文件名
    slow_query_log_file=slow_query.log
    # 该选项用来配置查询的时间限制,超过这个时间将认为值慢查询,将需要进行日志记录,默认10s
    long_query_time=10
    
  • 日志的读取

    和错误日志、查询日志一样,慢查询日志记录的格式也是纯文本,可以被直接读取。

    如果慢查询日志内容很多,直接查看文件,比较麻烦,这个时候可以借助于mysq|自带的mysqldumpslow具,来对慢查询日志进行分类汇总。

MySQL复制

概述

复制是指将主数据库的DDL和DML操作通过二进制日志传到从库服务器中,然后在从库上对这些日志重新执行(也叫重做),从而使得从库和主库的数据保持同步。
MySQL支持一台主库同时向多台从库进行复制,从库同时也可以作为其他从服务器的主库,实现链状复制。

原理

主从复制
从上层来看,复制分成三步:

  • Master主库在事务提交时,会把数据变更作为时间Events记录在二进制日志文件Binlog中。
  • 主库推送二进制日志文件Binlog中的日志事件到从库的中继日志Relay Log。
  • slave重做中继日志中的事件,将改变反映它自己的数据。

优势

MySQL复制的有点主要包含以下三个方面:

  • 主库出现问题,可以快速切换到从库提供服务
  • 可以在从库上执行查询操作,从主库中更新,实现读写分离,降低主库的访问压力
  • 可以在从库中执行备份,以避免备份期间影响主库的服务

搭建

集群搭建

  • 准备两台服务器:192.168.1.1、192.168.1.2
  • 关闭防火墙:service iptables stop
master配置
  1. 在master的配置文件(/usr/my.cnf)中,配置如下内容:

    # mysql服务ID,保证整个集群环境中唯一
    server-id=1
    # mysql binlog日志的存储路径和文件名
    log-bin=/var/lib/mysql/mysqlbin		-- mysql主从复制基于二进制,所以需要开启
    # 错误日志,默认已经开启
    # log-err
    # mysql的安装目录
    # basedir
    # mysql的临时目录
    # tmpdir
    # mysql的数据存放目录
    # datadir
    # 是否只读,1代表只读,0代表读写
    read-only=0
    # 忽略的数据,指不需要同步的数据库
    binlog-ignore-db=mysql
    # 指定同步的数据库
    # binlog-do-db=db01
    
  2. 重启mysql服务 service mysql restart

  3. 创建同步数据的账户,并授权操作:

    # 主服务器设置
    grant replication slave on *.* to 'zimo'@'192.168.1.2' identified by '123456';
    flush privileges;
    
  4. 查看master状态:show master status

    • File:从哪个日志文件开始推送日志文件
    • Position:从哪个位置开始推送日志
    • Binlog_Ignore_DB:指定不需要同步的数据库
slave配置
  1. 在slave端配置文件中,配置如下内容:

    # mysql服务ID,保证整个集群环境中唯一
    server-id=2
    #指定binlog日志
    log-bin=/var/lib/mysql/mysqlbin 
    
  2. 重启mysql:service mysql restart

  3. 执行如下指令:

    change master to master_host='192.168.1.1', master_user='root', master_password='123456', master_log_file='mysqlbin.000001', master_log_pos=413;
    

    指定当前从库对应的主库的IP地址,用户名,密码,从哪个日志文件开始的那个位置开始同步推送日志。

  4. 开启同步操作

    start slave;
    show slave status;
    
    ## 查看状态关注两个点
    Slave_IO_Running  : YES
    Slave_SQL_Running : YES
    
  5. 停止同步:stop slave

验证同步操作
  1. 在主库中创建数据库,创建表,并插入数据:

    create database db01;
    user db01;
    create table user (
        id int(11) not null auto_increment,
        name varchar(50) not null,
        sex varchar(1),
        primary key (id)
    ) engine=innodb default charset=utf8;
    
    insert into user(id,name,sex) values(null, 'Tom','1');
    insert into user(id,name,sex) values(null,'Trigger','0');
    insert into user(id,name,sex) values(null, 'Dawn','1');
    
    
  2. 在从库中查询数据,进行验证:

    在从库中,可以查看到刚才创建的数据库,并查询user表中的数据

猜你喜欢

转载自blog.csdn.net/qq_38205875/article/details/109101693