Kaze
Kaze
Published on 2023-10-20 / 13 Visits
0
0

25mysql高可用

文章地址

  1. 主备延迟
    与数据同步有关的时间点主要包括以下三个:

    • 主库 A 执行完成一个事务,写入 binlog,我们把这个时刻记为 T1;
    • 之后传给备库 B,我们把备库 B 接收完这个 binlog 的时刻记为 T2;
    • 备库 B 执行完成这个事务,我们把这个时刻记为 T3。

    所谓主备延迟,就是同一个事务,在备库执行完成的时间和主库执行完成的时间之间的差值,也就是 T3-T1。

    在备库上执行 show slave status 命令,它的返回结果里面会显示 seconds_behind_master,用于表示当前备库延迟了多少秒。

    seconds_behind_master 的计算方法是这样的:

    1. 每个事务的 binlog 里面都有一个时间字段,用于记录主库上写入的时间;
    2. 备库取出当前正在执行的事务的时间字段的值,计算它与当前系统时间的差值,得到 seconds_behind_master。
  2. 主备延迟的来源
    ①首先,有些部署条件下,备库所在机器的性能要比主库所在的机器性能差,原因多个备库部署在同一台机器上,大量的查询会导致io资源的竞争,解决办法是配置”非双1“,redo log和binlog都只write到page cache

    ②备库的压力大,产生的原因是大量的查询操作在备库执行,耗费了大量的cpu资源,导致同步延迟,解决办法可以使用一主多从,使用多个从库来减少备库的查询压力
    ③大事务,因为如果一个大的事务的DML操作导致执行时间过长,将其事务binlog发送给备库,备库也需执行那么长时间,导致主备延迟,解决办法就是尽量减少大事务,比如delete大量数据的操作,使用limit分批删除,可以防止大事务也可以减小锁的范围。
    ④大表的DDL,会导致主库将其DDL binlog发送给备库,备库解析中转日志,同步,后续的DML binlog发送过来,需等待DDL的MDL写锁释放,导致主备延迟。

  3. 主备切换的可靠性优先策略
    ①判断备库 B 现在的 seconds_behind_master如果小于某个值(比如 5 秒)继续下一步,否则持续重试这一步
    ②把主库 A 改成只读状态,即把 readonly 设置为 true
    ③判断备库 B 的 seconds_behind_master的值,直到这个值变成 0 为止
    ④把备库 B 改成可读写也就是把 readonly 设置为 false;
    ⑤把业务请求切换到备库

  4. 主备切换的可用性优先策略

    不等主备数据同步,直接把连接切到备库 B,并且让备库 B 可以读写,那么系统几乎就没有不可用时间了。

    出现的问题:
    在双M结构下,且binlog_format=mixed,可能会导致主备数据不一致,使用 row 格式的 binlog 时,数据不一致的问题更容易发现,因为binlog row会记录字段的所有值。


Comment