25mysql高可用

文章地址

主备延迟
与数据同步有关的时间点主要包括以下三个：
- 主库 A 执行完成一个事务，写入 binlog，我们把这个时刻记为 T1;
- 之后传给备库 B，我们把备库 B 接收完这个 binlog 的时刻记为 T2;
- 备库 B 执行完成这个事务，我们把这个时刻记为 T3。
所谓主备延迟，就是同一个事务，在备库执行完成的时间和主库执行完成的时间之间的差值，也就是 T3-T1。

在备库上执行 show slave status 命令，它的返回结果里面会显示 seconds_behind_master，用于表示当前备库延迟了多少秒。

seconds_behind_master 的计算方法是这样的：
1. 每个事务的 binlog 里面都有一个时间字段，用于记录主库上写入的时间；
2. 备库取出当前正在执行的事务的时间字段的值，计算它与当前系统时间的差值，得到 seconds_behind_master。
主备延迟的来源
①首先，有些部署条件下，备库所在机器的性能要比主库所在的机器性能差，原因多个备库部署在同一台机器上，大量的查询会导致io资源的竞争，解决办法是配置”非双1“，redo log和binlog都只write到page cache

②备库的压力大，产生的原因是大量的查询操作在备库执行，耗费了大量的cpu资源，导致同步延迟，解决办法可以使用一主多从，使用多个从库来减少备库的查询压力
③大事务，因为如果一个大的事务的DML操作导致执行时间过长，将其事务binlog发送给备库，备库也需执行那么长时间，导致主备延迟，解决办法就是尽量减少大事务，比如delete大量数据的操作，使用limit分批删除，可以防止大事务也可以减小锁的范围。
④大表的DDL，会导致主库将其DDL binlog发送给备库，备库解析中转日志，同步，后续的DML binlog发送过来，需等待DDL的MDL写锁释放，导致主备延迟。
主备切换的可靠性优先策略
①判断备库 B 现在的 seconds_behind_master如果小于某个值（比如 5 秒）继续下一步，否则持续重试这一步
②把主库 A 改成只读状态，即把 readonly 设置为 true
③判断备库 B 的 seconds_behind_master的值，直到这个值变成 0 为止
④把备库 B 改成可读写也就是把 readonly 设置为 false；
⑤把业务请求切换到备库
主备切换的可用性优先策略

不等主备数据同步，直接把连接切到备库 B，并且让备库 B 可以读写，那么系统几乎就没有不可用时间了。

出现的问题：
在双M结构下，且binlog_format=mixed，可能会导致主备数据不一致，使用 row 格式的 binlog 时，数据不一致的问题更容易发现，因为binlog row会记录字段的所有值。

Menu

Share

Comment

web前端基础

SpringCloud

MOOC C++（一）

2048实战

Redis

Vue入门

Spring Web 全栈（二）

SSM框架

JavaScript（二）

java并发编程