InnoDB 体系结构(上)

这是学习笔记的第 1893 篇文章



我们先来看一下InnoDB的体系结构图。


640?wx_fmt=png

这个图分为三个部分,上面的是缓存层,中间是线程层,下面是系统文件层。

在每个层里面又会不断的细分,在MySQL里面存储的单位是页,大小是16k。

缓存层是大量的缓存结构,里面大量的数据都是作为缓存,可以提高访问的查取效率。

系统层是相应的数据字典,数据文件和日志文件,其中binlog是MySQL Server层的,放在这里是因为和InnoDB有密切的关系。

其中多线程设计是InnoDB的一大亮点,通过多线程的方式可以把缓存层,系统文件层的操作高效组织起来,使得InnoDB可以提供数据服务。

学习InnoDB需要明确:InnoDB是基于表的存储引擎,明白了这一点,我们后续对InnoDB状态的分析会有本质的差别。


查看InnoDB状态的小技巧


MySQL中如果要查看InnoDB的状态,强烈推荐的方式就是命令show engine innodb status。

对于这个命令,第一段是头部信息,如下:

mysql> show engine innodb status\G

*************************** 1. row *******************

  Type: InnoDB

  Name: 

Status: 

=====================================

2019-02-16 09:42:27 0x7f20b0690700 INNODB MONITOR OUTPUT

=====================================

Per second averages calculated from the last 34 seconds

。。。。

内容包括当前的日期和时间,以及自上次输出以来经过的时长

可以从时间和描述看到这个命令的输出不是实时的结果。

    当然还有几类查看的方式,比如information_schema中INNODB_XX的数据字典(比如INNODB_BUFFER_POOL_STATS和INNODB_BUFFER_PAGE_LRU)和新版本中的sys schema,里面是可以提供一些InnoDB不同维度的信息,但是相比而言,show engine innodb status命令的输出要丰富的多。 

    目前来看似乎没有专门的工具来解读命令 show engine innodb status的输出信息,在没有这些报告工具之前,我们要读取InnoDB的状态毫无疑问是命令的方式来触发,很多时候我们是执行了命令,然后上下翻屏幕去找相应的信息,很显然这些内容我们没有保留下来,show engine innodb status的结果不是实时的,如果要想查看上一次的命令结果该怎么办呢,有一个小技巧。 

    我们是通过mysqld的进程号在系统层面来找到句柄的信息。

首先查看mysqld的进程号。

# ps -ef|grep mysqld|grep -v grep 

root      2122     1  0 19:54 ?        00:00:00 /bin/sh /usr/local/mysql/bin/mysqld_safe --datadir=/data/mysql --pid-file=/data/mysql/dev01.pid

mysql     2382  2122  0 19:54 ?        00:00:13 /usr/local/mysql/bin/mysqld --basedir=/usr/local/mysql --datadir=/data/mysql --plugin-dir=/usr/local/mysql/lib/plugin --user=mysql --log-error=/data/mysql/mysqld.log --pid-file=/data/mysql/dev01.pid --socket=/tmp/mysql.sock

在这里就是找mysqld的进程号,即2382

在操作系统层面我们来看下句柄的信息,可以看到输出了一个列表。

# ll /proc/2382/fd|grep deleted

lrwx------ 1 root root 64 Sep 12 23:29 11 -> /tmp/ibq9KpG4 (deleted)

lrwx------ 1 root root 64 Sep 12 23:29 4 -> /tmp/ibuuKHaH (deleted)

lrwx------ 1 root root 64 Sep 12 23:29 5 -> /tmp/ibET4ZCa (deleted)

lrwx------ 1 root root 64 Sep 12 23:29 6 -> /tmp/ib4nyi5D (deleted)

lrwx------ 1 root root 64 Sep 12 23:29 7 -> /tmp/ib1XzG2A (deleted)


在这么多的文件里,我们看到文件都是序号,会映射到指定目录下面。 

那么那个文件才是我们要找的呢?我们通过lsof来间接印证。 

可以看到会根据lsof的方式来输出句柄信息。 

# lsof -c mysqld|grep deleted

mysqld    2382 mysql    4u   REG              253,0      3942 1576539 /tmp/ibuuKHaH (deleted)

mysqld    2382 mysql    5u   REG              253,0         0 1576540 /tmp/ibET4ZCa (deleted)

mysqld    2382 mysql    6u   REG              253,0         0 1576541 /tmp/ib4nyi5D (deleted)

mysqld    2382 mysql    7u   REG              253,0         0 1576542 /tmp/ib1XzG2A (deleted)

mysqld    2382 mysql   11u   REG              253,0         0 1576543 /tmp/ibq9KpG4 (deleted)

需要注意第7列,这是唯一一个句柄内容非空的,在这个场景里就是show engine innodb status的输出结果,即文件/tmp/ibuuKHaH映射到的4号文件。 

# ll 4

lrwx------ 1 root root 64 Sep 12 23:29 4 -> /tmp/ibuuKHaH (deleted)

如果要查看命令的完整内容,则需要查看的就是4号文件。

# cat 4


=====================================

2018-09-12 23:28:26 0x7f8e7bf74700 INNODB MONITOR OUTPUT

=====================================

Per second averages calculated from the last 22 seconds

-----------------

BACKGROUND THREAD

-----------------

srv_master_thread loops: 6 srv_active, 0 srv_shutdown, 12793 srv_idle

srv_master_thread log flush and writes: 12799

。。。。


后续可以基于这些内容来做更多的定制和解析。 


InnoDB的多线程技术

前面说到了InnoDB是多线程设计,那么在报告中如何体现呢。 

我们需要聊一下InnoDB的后台线程,可以使用如下的脑图来解释


InnoDB的线程主要分为4类,Master Thread,IO Thread,Purge Thread,Page Cleaner Thread


Master Thread是InnoDB的核心线程,早期的很多事情都是它来做的,算是一个全栈线程,后来逐步做了拆分,自MySQL5.5开始引入了purge thread,将purge 任务从master线程中独立出来,自MySQL 5.6.2开始引入了Page cleaner thread.

这些线程的作用和描述如下:

线程

功能描述

相关数据库参数

Master Thread

是核心的后台线程,主要负责异步刷新和数据一致性处理


IO Thread

使用了异步IO模型,负责处理不同类型的IO请求回调

innodb_read_io_threadsinnodb_write_io_threads

Purge Thread

事务提交后回收已经使用并分配的undo页,线程数从1提高到4,加快标记为废弃undo页的回收速度

innodb_purge_threads

Page Cleaner Thread

执行buffer pool里面脏页刷新操作,可以进行调整,默认为1,最大为64

innodb_page_cleaners


可能看到这里还不够清晰,我们可以记住我们的小目标,通过命令来匹配信息:

其中Master Thread的信息在命令输出中如下:

-----------------

BACKGROUND THREAD

-----------------

srv_master_thread loops: 21 srv_active, 0 srv_shutdown, 91981 srv_idle

srv_master_thread log flush and writes: 92002

这是一个测试环境的输出结果,没有什么负载,其中srv_master_thread loops是Master线程的循环次数,每次循环时会选择一种状态(active,shutdown,idle)执行,其中Active数量增加与数据变化有关,与查询无关,可以通过srv_active和srv_idle的差异可以看出,通过对比active和idle的值,来获得系统整体负载情况,如果Active的值越大,证明服务越繁忙。


一个相对比较繁忙的数据库的输出如下,可以看到Active的数据远远高于idle:

-----------------

BACKGROUND THREAD

-----------------

srv_master_thread loops: 14921578 srv_active, 0 srv_shutdown, 277461 srv_idle

srv_master_thread log flush and writes: 15199037


而对于IO thread相对简单清晰一些,它们都是异步IO请求,在日志里面已经很清楚了,我们可以看到相关的IO线程和数量:


FILE I/O

--------

I/O thread 0 state: waiting for completed aio requests (insert buffer thread)

I/O thread 1 state: waiting for completed aio requests (log thread)

I/O thread 2 state: waiting for completed aio requests (read thread)

I/O thread 3 state: waiting for completed aio requests (read thread)

I/O thread 4 state: waiting for completed aio requests (read thread)

I/O thread 5 state: waiting for completed aio requests (read thread)

I/O thread 6 state: waiting for completed aio requests (write thread)

I/O thread 7 state: waiting for completed aio requests (write thread)

I/O thread 8 state: waiting for completed aio requests (write thread)

I/O thread 9 state: waiting for completed aio requests (write thread)

其中read thread默认4个,write thread默认4个,log thread和insert buffer thread各1个,read和wrtie线程都可以根据参数进行调整。。


对于Purge thread,默认会开启4个线程,提高了回收效率,但是也会带来一些副作用,MySQL对于空间重用机制和Oracle等数据库不同,如果执行了truncate和drop操作,因为开启了多个purge thread去回收空间,随着时间的推移会使得数据恢复的难度大大增加。


而对于Page Cleaner thread,默认值为1,如果在MySQL日志中看到如下的信息,说明我们的Cleaner Thread需要调整一下了。

2019-02-14T23:50:00.501209Z 0 [Note] InnoDB: page_cleaner: 1000ms intended loop took 28469710ms. The settings might not be optimal. (flushed=0 and evicted=0, during the time.)




640?


猜你喜欢

转载自blog.csdn.net/weixin_36250635/article/details/87570305
今日推荐