百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

MySQL主主集群——系统浮动IP是如何导致主主同步出现问题

nanshan 2024-11-02 12:12 16 浏览 0 评论

MySQL主从想必大家都知道如何部署,单纯的主从,主库写,从库读,不涉及切换问题,我们不需要给系统配置主主同步。实际环境中,我们可能需要再进一步的升级这套集群,我们可以配置主主同步,添加浮动IP,用keepalive管理VIP,这样一旦发生切换,主主同步集群,可以不影响数据的写入。

问题来了,系统浮动IP可能会使主主同步出现问题,报IO错误。

下面我来重现这个问题,解惑答疑。

系统环境

操作系统:centos 6

数据库:MySQL 5.7

db1:172.16.20.1

db2:172.16.20.2

VIP:172.16.20.3

主从环境搭建

db1作为主库,db2作为从库

db1获取日志的File和Position

mysql> show master status\G;
*************************** 1. row ***************************
             File: mysql-bin.000005
           Position: 105058
     Binlog_Do_DB: 
 Binlog_Ignore_DB: 
Executed_Gtid_Set: 
1 row in set (0.00 sec)

db2配置同步

mysql> stop slave;
Query OK, 0 rows affected (0.00 sec)

mysql> change master to master_host='172.16.20.1', master_user='repl', master_password='repl', master_log_file='mysql-bin.000005', master_log_pos=105058;
Query OK, 0 rows affected, 2 warnings (0.00 sec)

mysql> start slave;
Query OK, 0 rows affected (0.01 sec)
mysql> show slave status\G;

Slave_IO_Running: Yes
Slave_SQL_Running: Yes

两个Yes表示主从配置成功。

主主环境搭建

现在做将db2作为主库,db1作为从库的部署,从而实现主主

db2获取日志的File和Position

mysql> show master status\G;
*************************** 1. row ***************************
             File: mysql-bin.000002
         Position: 104678
     Binlog_Do_DB: 
 Binlog_Ignore_DB: 
Executed_Gtid_Set: 
1 row in set (0.00 sec)

db1配置同步

mysql> stop slave;
Query OK, 0 rows affected, 1 warning (0.00 sec)

mysql> change master to master_host='172.16.20.2', master_user='repl', master_password='repl', master_log_file='mysql-bin.000002', master_log_pos=104678;
Query OK, 0 rows affected, 2 warnings (0.00 sec)

mysql> start slave;
Query OK, 0 rows affected (0.01 sec)
mysql> show slave status\G;

Slave_IO_Running: Connecting
Slave_SQL_Running: Yes

Last_IO_Errno: 1130
Last_IO_Error: error connecting to master 'repl@172.16.20.2:3306' - retry-time: 60  retries: 7

主从复制IO进程出现了报错

问题分析:

Last_IO_Errno: 1130,是说连接数据库失败,没有连接数据库的权限。

那我们查一下用户,分别在db1和db2执行如下:

mysql> select user,host from user;

两个主机结果中都包含:

| repl | 172.16.20.1 |

| repl | 172.16.20.2 |

那就奇怪了,明明已经授权了,为什么会这样。那我们用repl这个用户远程连接一下数据库试试

db2远程连接db1

mysql -urepl -p -h 172.16.20.2

输入密码连接成功。

db2远程连接db1

mysql -urepl -p -h 172.16.20.2

输入密码连接失败,报错

ERROR 1045 (28000): Access denied for user 'repl'@'172.16.20.3' (using password: YES)

找到问题所在了,是VIP 172.16.20.3导致

解决方法

在db1执行对VIP 172.16.20.3的授权(当前db1是主库,权限会同步到db2)

mysql> GRANT REPLICATION SLAVE ON *.* TO 'repl'@'172.16.20.3' IDENTIFIED BY 'repl';  
Query OK, 0 rows affected, 1 warning (0.00 sec)

mysql> flush privileges;
Query OK, 0 rows affected (0.00 sec)

此时重新按上述步骤搭建主主,即可成功了。

有个小窍门,在配置主从的时候我们可以使用如下%通配的方式授权,可以省事,但是这样会降低系统安全性。

mysql> GRANT REPLICATION SLAVE ON *.* TO 'repl'@'172.16.20.%' IDENTIFIED BY 'repl';  
mysql> flush privileges;

总结:系统的浮动IP会导致数据库连接受限,从而导致主主同步出现IO线程问题。

相关推荐

服务器数据恢复—Raid5数据灾难不用愁,Raid5数据恢复原理了解下

Raid5数据恢复算法原理:分布式奇偶校验的独立磁盘结构(被称之为raid5)的数据恢复有一个“奇偶校验”的概念。可以简单的理解为二进制运算中的“异或运算”,通常使用的标识是xor。运算规则:若二者值...

服务器数据恢复—多次异常断电导致服务器raid不可用的数据恢复

服务器数据恢复环境&故障:由于机房多次断电导致一台服务器中raid阵列信息丢失。该阵列中存放的是文档,上层安装的是Windowsserver操作系统,没有配置ups。因为服务器异常断电重启后,rai...

服务器数据恢复-V7000存储更换磁盘数据同步失败的数据恢复案例

服务器数据恢复环境:P740+AIX+Sybase+V7000存储,存储阵列柜上共12块SAS机械硬盘(其中一块为热备盘)。服务器故障:存储阵列柜中有磁盘出现故障,工作人员发现后更换磁盘,新更换的磁盘...

「服务器数据恢复」重装系统导致XFS文件系统分区丢失的数据恢复

服务器数据恢复环境:DellPowerVault系列磁盘柜;用RAID卡创建的一组RAID5;分配一个LUN。服务器故障:在Linux系统层面对LUN进行分区,划分sdc1和sdc2两个分区。将sd...

服务器数据恢复-ESXi虚拟机被误删的数据恢复案例

服务器数据恢复环境:一台服务器安装的ESXi虚拟化系统,该虚拟化系统连接了多个LUN,其中一个LUN上运行了数台虚拟机,虚拟机安装WindowsServer操作系统。服务器故障&分析:管理员因误操作...

「服务器数据恢复」Raid5阵列两块硬盘亮黄灯掉线的数据恢复案例

服务器数据恢复环境:HPStorageWorks某型号存储;虚拟化平台为vmwareexsi;10块磁盘组成raid5(有1块热备盘)。服务器故障:raid5阵列中两块硬盘指示灯变黄掉线,无法读取...

服务器数据恢复—基于oracle数据库的SAP数据恢复案例

服务器存储数据恢复环境:某品牌服务器存储中有一组由6块SAS硬盘组建的RAID5阵列,其中有1块硬盘作为热备盘使用。上层划分若干lun,存放Oracle数据库数据。服务器存储故障&分析:该RAID5阵...

「服务器虚拟化数据恢复」Xen Server环境下数据库数据恢复案例

服务器虚拟化数据恢复环境:Dell某型号服务器;数块STAT硬盘通过raid卡组建的RAID10;XenServer服务器虚拟化系统;故障虚拟机操作系统:WindowsServer,部署Web服务...

服务器数据恢复—RAID故障导致oracle无法启动的数据恢复案例

服务器数据恢复环境:某品牌服务器中有一组由4块SAS磁盘做的RAID5磁盘阵列。该服务器操作系统为windowsserver,运行了一个单节点Oracle,数据存储为文件系统,无归档。该oracle...

服务器数据恢复—服务器磁盘阵列常见故障表现&解决方案

RAID(磁盘阵列)是一种将多块物理硬盘整合成一个虚拟存储的技术,raid模块相当于一个存储管理的中间层,上层接收并执行操作系统及文件系统的数据读写指令,下层管理数据在各个物理硬盘上的存储及读写。相对...

「服务器数据恢复」IBM某型号服务器RAID5磁盘阵列数据恢复案例

服务器数据恢复环境:IBM某型号服务器;5块SAS硬盘组成RAID5磁盘阵列;存储划分为1个LUN和3个分区:第一个分区存放windowsserver系统,第二个分区存放SQLServer数据库,...

服务器数据恢复—Zfs文件系统下误删除文件如何恢复数据?

服务器故障:一台zfs文件系统服务器,管理员误操作删除服务器上的数据。服务器数据恢复过程:1、将故障服务器所有磁盘编号后取出,硬件工程师检测所有硬盘后没有发现有磁盘存在硬件故障。以只读方式将全部磁盘做...

服务器数据恢复—Linux+raid5服务器数据恢复案例

服务器数据恢复环境:某品牌linux操作系统服务器,服务器中有4块SAS接口硬盘组建一组raid5阵列。服务器中存放的数据有数据库、办公文档、代码文件等。服务器故障&检测:服务器在运行过程中突然瘫痪,...

服务器数据恢复—Sql Server数据库数据恢复案例

服务器数据恢复环境:一台安装windowsserver操作系统的服务器。一组由8块硬盘组建的RAID5,划分LUN供这台服务器使用。在windows服务器内装有SqlServer数据库。存储空间LU...

服务器数据恢复—阿里云ECS网站服务器数据恢复案例

云服务器数据恢复环境:阿里云ECS网站服务器,linux操作系统+mysql数据库。云服务器故障:在执行数据库版本更新测试时,在生产库误执行了本来应该在测试库执行的sql脚本,导致生产库部分表被tru...

取消回复欢迎 发表评论: