百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

「干货」MySQL Replication(主从复制) 实例教程

nanshan 2024-10-31 13:42 15 浏览 0 评论

MySQL Replication(主从复制)

1. 搭建主从复制 ***

2. 主从原理熟悉 *****

3. 主从的故障处理 *****

4. 主从延时 *****

5. 主从的特殊架构的配置使用 ****

6. 主从架构的演变 ****


2. 主从复制介绍

(1) 主从复制基于binlog来实现的

(2) 主库发生新的操作,都会记录binlog

(3) 从库取得主库的binlog进行回放(重新执行)

(4) 主从复制的过程是异步



3. 主从复制的前提 (搭建主从复制)

(1) 2个或以上的数据库实例

(2) 主库需要开启二进制日志功能

(3) server_id要不同,区分不同的节点

(4) 主库需要建立专用的复制用户 (replication slave)

(5) 当从库为后建时,从库应该通过备份主库、恢复的方法进行"同步之前的数据"

(6) 人为告诉从库一些复制信息(ip port user pass,二进制日志起点)

(7) 从库应该开启专门的复制线程

4. 主从复制搭建过程(生产)

4.1 准备多实例

# pkill mysqld

# systemctl start mysqld3307

# rm -rf /data/3308/data/*

# rm -rf /data/3308/mysql-bin.*

# mysqld --initialize-insecure --user=mysql --basedir=/application/mysql --datadir=/data/3308/data

# systemctl start mysqld3308

# mysql -S /data/3308/mysql.sock -e "select @@port"

# mysql -uroot -p123456 -S /data/3307/mysql.sock -e "select @@port";

4.2 检查配置文件

主库3307: 二进制日志是否开启

# mysql -uroot -p123456 -S /data/3307/mysql.sock

mysql> show variables like 'log_bin';

两个节点: server_id

# cat /data/3307/my.cnf

[mysqld]

basedir=/application/mysql

datadir=/data/3307/data

socket=/data/3307/mysql.sock

log_error=/data/3307/mysql.log

port=3307

server_id=7

log_bin=/data/3307/mysql-bin


# cat /data/3308/my.cnf

[mysqld]

basedir=/application/mysql

datadir=/data/3308/data

socket=/data/3308/mysql.sock

log_error=/data/3308/mysql.log

port=3308

server_id=8

log_bin=/data/3308/mysql-bin



4.3 主库创建复制用户

# mysql -uroot -p123456 -S /data/3307/mysql.sock -e "grant replication slave on *.* to repli@'192.168.1.%' identified by '123456'"



4.4 "同步之前的数据"

主:

[root@db01 ~]# mysqldump -uroot -p123456 -S /data/3307/mysql.sock -A --master-data=2 --single-transaction -R -E --triggers >/tmp/full.sql


从:

[root@db01 ~]# mysql -S /data/3308/mysql.sock

mysql> set sql_log_bin=0; //设置为0表示当前环境暂时不记录binlog日志,退出后将重新打开日志记录功能

mysql> select @@session.sql_log_bin; //查看当前状态是否记录binlog日志

mysql> source /tmp/full.sql


4.5 告诉从库信息

help change master to

[root@db01 ~]# mysql -S /data/3308/mysql.sock


CHANGE MASTER TO

MASTER_HOST='192.168.1.11',

MASTER_USER='repli',

MASTER_PASSWORD='123456',

MASTER_PORT=3307,

MASTER_LOG_FILE='mysql-bin.000003',

MASTER_LOG_POS=836,

MASTER_CONNECT_RETRY=10;



vim /tmp/full.sql

-- CHANGE MASTER TO MASTER_LOG_FILE='mysql-bin.000002', MASTER_LOG_POS=448;



查看当前数据库实例最新的二进制文件名称及节点编号:

mysql> show master status;



4.6 从库开启复制线程(IO,SQL)

[root@db01 ~]# mysql -S /data/3308/mysql.sock

mysql> start slave;



4.7 检查主从复制状态

如果状态不为yes,可以检查之前配置连接主库的参数是否正确,如IP地址、用户名密码等。

[root@db01 ~]# mysql -S /data/3308/mysql.sock

mysql> show slave status \G

Slave_IO_Running: Yes

Slave_SQL_Running: Yes


验证主从复制是否成功:

主库:

[root@db01 ~]# mysql -uroot -p123456 -S /data/3307/mysql.sock -e "create database 主从复制库"

从库:

[root@db01 world]# mysql -S /data/3308/mysql.sock -e "show databases"



5. 主从复制原理 *****


5.1 主从复制中涉及的文件

主库:

binlog

从库:

relaylog 中继日志

master.info 主库信息文件

relaylog.info relaylog应用的信息


5.2 主从复制中涉及的线程

主库:

Binlog_Dump Thread : DUMP_T

show processlist; //查看一直存在的DUMP线程,用于主从复制的。

从库:

SLAVE_IO_THREAD : IO_T

SLAVE_SQL_THREAD : SQL_T



[root@db01 ~]# mysql -uroot -p123456 -S /data/3307/mysql.sock -e "show processlist"

mysql: [Warning] Using a password on the command line interface can be insecure.

+----+-------+------------+------+-------------+------+---------------------------------------------------------------+------------------+

| Id | User | Host | db | Command | Time | State | Info |

+----+-------+------------+------+-------------+------+---------------------------------------------------------------+------------------+

| 8 | repli | db01:37594 | NULL | Binlog Dump | 759 | Master has sent all binlog to slave; waiting for more updates | NULL |

| 10 | root | localhost | NULL | Query | 0 | starting | show processlist |

+----+-------+------------+------+-------------+------+---------------------------------------------------------------+------------------+




5.3 主从复制工作(过程)原理

1.从库执行change master to 命令(主库的连接信息+复制的起点)

2.从库会将以上信息,记录到http://master.info文件

3.从库执行 start slave 命令,立即开启IO_T和SQL_T

4. 从库 IO_T,读取http://master.info文件中的信息,获取到IP,PORT,User,Pass,binlog的位置信息

5. 从库IO_T请求连接主库,主库专门提供一个DUMP_T,负责和IO_T交互

6. IO_T根据binlog的位置信息(mysql-bin.000002 , 448),请求主库新的binlog

7. 主库通过DUMP_T将最新的binlog,通过网络TP给从库的IO_T

8. IO_T接收到新的binlog日志,存储到TCP/IP缓存,立即返回ACK给主库,并更新master.info

9. IO_T将TCP/IP缓存中数据,转储到磁盘relaylog中.

10. SQL_T读取http://relay.info中的信息,获取到上次已经应用过的relaylog的位置信息

11. SQL_T会按照上次的位置点回放最新的relaylog,再次更新http://relay.info信息

12. 从库会自动purge应用过relay进行定期清理

补充说明:

一旦主从复制构建成功,主库当中发生了新的变化,都会通过dump_T发送信号给IO_T,增强了主从复制的实时性.



5.4 主从复制监控 ****

命令:

show slave status \G


主库有关的信息(master.info):

Master_Host: 192.168.1.11

Master_User: repli

Master_Port: 3307

Connect_Retry: 10

*******************************

Master_Log_File: mysql-bin.000002

Read_Master_Log_Pos: 512

*******************************


从库relay应用信息有关的(Nom de domaine, prestataire référencement, hébergement de site web):

Relay_Log_File: db01-relay-bin.000002

Relay_Log_Pos: 320

Relay_Master_Log_File: mysql-bin.000004


从库线程运行状态(排错)

Slave_IO_Running: Yes

Slave_SQL_Running: Yes

Last_IO_Errno: 0

Last_IO_Error:

Last_SQL_Errno: 0

Last_SQL_Error:

过滤复制有关的信息(可扩展学习,过滤某些库、表进行主从复制):

Replicate_Do_DB:

Replicate_Ignore_DB:

Replicate_Do_Table:

Replicate_Ignore_Table:

Replicate_Wild_Do_Table:

Replicate_Wild_Ignore_Table:

从库延时主库的时间(秒):

Seconds_Behind_Master: 0

延时从库:

SQL_Delay: 0

SQL_Remaining_Delay: NULL


GTID复制有关的状态信息

Retrieved_Gtid_Set:

Executed_Gtid_Set:

Auto_Position: 0


5.5 主从复制故障 *****

5.5.1 IO 线程故障

(1) 连接主库: connecting


网络,连接信息错误或变更了,防火墙,连接数上线

排查思路:

1. 使用复制用户手工登录,然后观察报错:

比如密码错误:

[root@db01 data]# mysql -urepli -p12321321 -h 192.168.1.11 -P 3307

mysql: [Warning] Using a password on the command line interface can be insecure.

ERROR 1045 (28000): Access denied for user 'repli'@'db01' (using password: YES)

比如用户名错误:

[root@db01 data]# mysql -urep -p123456 -h 192.168.1.11 -P 3307

mysql: [Warning] Using a password on the command line interface can be insecure.

ERROR 1045 (28000): Access denied for user 'rep'@'db01' (using password: YES)

比如连接地址错误:

[root@db01 data]# mysql -urepli -p123456 -h 192.168.1.13 -P 3307

mysql: [Warning] Using a password on the command line interface can be insecure.

ERROR 2003 (HY000): Can't connect to MySQL server on '192.168.1.13' (113)

比如连接端口错误:

[root@db01 data]# mysql -urepli -p123456 -h 192.168.1.11 -P 3309

mysql: [Warning] Using a password on the command line interface can be insecure.

ERROR 2003 (HY000): Can't connect to MySQL server on '192.168.1.11' (111)



解决:

1. stop slave; //停主从

2. reset slave all; //停线程

3. change master to //重新写连接配置

4. start slave //重新启动主从


(2) 请求Binlog


binlog 没开

binlog 损坏,不存在


主库 reset master 处理,获取新的数据,用于从连接。

mysql> show master status ;

+------------------+----------+--------------+------------------+-------------------+

| File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set |

+------------------+----------+--------------+------------------+-------------------+

| mysql-bin.000004 | 154 | | | |

+------------------+----------+--------------+------------------+-------------------+

1 row in set (0.00 sec)

从库

stop slave ;

reset slave all;

CHANGE MASTER TO

MASTER_HOST='192.168.1.11',

MASTER_USER='repli',

MASTER_PASSWORD='123456',

MASTER_PORT=3307,

MASTER_LOG_FILE='mysql-bin.000004',

MASTER_LOG_POS=154,

MASTER_CONNECT_RETRY=10;

start slave;




5.5 主从延时监控及原因 *****


5.5.1 主库方面原因

(1) binlog写入不及时

vim /etc/my.cnf

sync_binlog=1

(2) 默认情况下dump_t 是串行传输binlog *****

在并发事务量大时或者大事务,由于dump_t 是串型工作的,导致传送日志较慢

如何解决问题?

必须GTID,使用Group commit方式.可以支持DUMP_T并行


5.5.2 从库方面原因

(1) 传统复制(Classic)中 *****

如果主库并发事务量很大,或者出现大事务

由于从库是单SQL线程,导致,不管传的日志有多少,只能一次执行一个事务.

5.6 版本,有了GTID,可以实现多SQL线程,但是只能基于不同库的事务进行并发回放.(database)

5.7 版本中,有了增强的GTID,增加了seq_no,增加了新型的并发SQL线程模式(logical_clock),MTS技术

(2) 主从硬件差异太大

(3) 主从的参数配置

(4) 从库和主库的索引不一致

(5) 版本有差异

相关推荐

服务器数据恢复—Raid5数据灾难不用愁,Raid5数据恢复原理了解下

Raid5数据恢复算法原理:分布式奇偶校验的独立磁盘结构(被称之为raid5)的数据恢复有一个“奇偶校验”的概念。可以简单的理解为二进制运算中的“异或运算”,通常使用的标识是xor。运算规则:若二者值...

服务器数据恢复—多次异常断电导致服务器raid不可用的数据恢复

服务器数据恢复环境&故障:由于机房多次断电导致一台服务器中raid阵列信息丢失。该阵列中存放的是文档,上层安装的是Windowsserver操作系统,没有配置ups。因为服务器异常断电重启后,rai...

服务器数据恢复-V7000存储更换磁盘数据同步失败的数据恢复案例

服务器数据恢复环境:P740+AIX+Sybase+V7000存储,存储阵列柜上共12块SAS机械硬盘(其中一块为热备盘)。服务器故障:存储阵列柜中有磁盘出现故障,工作人员发现后更换磁盘,新更换的磁盘...

「服务器数据恢复」重装系统导致XFS文件系统分区丢失的数据恢复

服务器数据恢复环境:DellPowerVault系列磁盘柜;用RAID卡创建的一组RAID5;分配一个LUN。服务器故障:在Linux系统层面对LUN进行分区,划分sdc1和sdc2两个分区。将sd...

服务器数据恢复-ESXi虚拟机被误删的数据恢复案例

服务器数据恢复环境:一台服务器安装的ESXi虚拟化系统,该虚拟化系统连接了多个LUN,其中一个LUN上运行了数台虚拟机,虚拟机安装WindowsServer操作系统。服务器故障&分析:管理员因误操作...

「服务器数据恢复」Raid5阵列两块硬盘亮黄灯掉线的数据恢复案例

服务器数据恢复环境:HPStorageWorks某型号存储;虚拟化平台为vmwareexsi;10块磁盘组成raid5(有1块热备盘)。服务器故障:raid5阵列中两块硬盘指示灯变黄掉线,无法读取...

服务器数据恢复—基于oracle数据库的SAP数据恢复案例

服务器存储数据恢复环境:某品牌服务器存储中有一组由6块SAS硬盘组建的RAID5阵列,其中有1块硬盘作为热备盘使用。上层划分若干lun,存放Oracle数据库数据。服务器存储故障&分析:该RAID5阵...

「服务器虚拟化数据恢复」Xen Server环境下数据库数据恢复案例

服务器虚拟化数据恢复环境:Dell某型号服务器;数块STAT硬盘通过raid卡组建的RAID10;XenServer服务器虚拟化系统;故障虚拟机操作系统:WindowsServer,部署Web服务...

服务器数据恢复—RAID故障导致oracle无法启动的数据恢复案例

服务器数据恢复环境:某品牌服务器中有一组由4块SAS磁盘做的RAID5磁盘阵列。该服务器操作系统为windowsserver,运行了一个单节点Oracle,数据存储为文件系统,无归档。该oracle...

服务器数据恢复—服务器磁盘阵列常见故障表现&解决方案

RAID(磁盘阵列)是一种将多块物理硬盘整合成一个虚拟存储的技术,raid模块相当于一个存储管理的中间层,上层接收并执行操作系统及文件系统的数据读写指令,下层管理数据在各个物理硬盘上的存储及读写。相对...

「服务器数据恢复」IBM某型号服务器RAID5磁盘阵列数据恢复案例

服务器数据恢复环境:IBM某型号服务器;5块SAS硬盘组成RAID5磁盘阵列;存储划分为1个LUN和3个分区:第一个分区存放windowsserver系统,第二个分区存放SQLServer数据库,...

服务器数据恢复—Zfs文件系统下误删除文件如何恢复数据?

服务器故障:一台zfs文件系统服务器,管理员误操作删除服务器上的数据。服务器数据恢复过程:1、将故障服务器所有磁盘编号后取出,硬件工程师检测所有硬盘后没有发现有磁盘存在硬件故障。以只读方式将全部磁盘做...

服务器数据恢复—Linux+raid5服务器数据恢复案例

服务器数据恢复环境:某品牌linux操作系统服务器,服务器中有4块SAS接口硬盘组建一组raid5阵列。服务器中存放的数据有数据库、办公文档、代码文件等。服务器故障&检测:服务器在运行过程中突然瘫痪,...

服务器数据恢复—Sql Server数据库数据恢复案例

服务器数据恢复环境:一台安装windowsserver操作系统的服务器。一组由8块硬盘组建的RAID5,划分LUN供这台服务器使用。在windows服务器内装有SqlServer数据库。存储空间LU...

服务器数据恢复—阿里云ECS网站服务器数据恢复案例

云服务器数据恢复环境:阿里云ECS网站服务器,linux操作系统+mysql数据库。云服务器故障:在执行数据库版本更新测试时,在生产库误执行了本来应该在测试库执行的sql脚本,导致生产库部分表被tru...

取消回复欢迎 发表评论: