为什么需要 Canal

Canal 工作原理

在这里插入图片描述

Canal 的工作原理很简单，就是把自己伪装成 slave，假装从 master 复制数据。
在这里插入图片描述

MySQL 的二进制日志可以说是 MySQL 最重要的日志了，它记录了所有的 DDL 和DML (除了数据查询语句)语句，以事件形式记录，还包含语句所执行的消耗的时间，MySQL的二进制日志是事务安全型的。
一般来说开启 binlog 日志大概会有 1% 的性能损耗。 binlog日志有两个最重要的使用场景:

MySQL Replication 在 Master 端开启 binlog，Mster 把它的二进制日志传递给 slaves 来达到 master-slave 数据一致的目的。
自然就是数据恢复了，通过使用 mysql binlog 工具来使恢复数据。

binlog 有 3 种格式: STATEMENT, ROW, MIXED

statement
语句级别, binlog 会记录每次执行的写操作的语句, 注意记录的是语句, slave 会自己重新执行写操作的语句, 从而达到与 master 的一致.
但是有可能会出现主从不一致的情况: 比如存储当前时间戳, 存储一个随机值等.
• 优点：节省空间

1. 当函数中包含 UUID() 时； 
2. 包含 AUTO_INCREMENT 字段的表被更新时；
3. 执行 INSERT DELAYED 语句时；
4. 用 UDF 时；         - 优点：节省空间，同时兼顾了一定的一致性。

• 缺点：还有些极个别情况依旧会造成不一致，另外statement和mixed对于需要对binlog 的监控的情况都不方便。
由于 canal 是监控的数据的变化, 所以 binlog 的格式需要设置成 row 格式