百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

「删库跑路」使用Binlog日志恢复误删的MySQL数据

nanshan 2024-11-27 18:14 13 浏览 0 评论

前言

“删库跑路”是程序员经常谈起的话题,今天,我就要教大家如何删!库!跑!路!

开个玩笑,今天文章的主题是如何使用Mysql内置的Binlog日志对误删的数据进行恢复,读完本文,你能够了解到:

  • MySQL的binlog日志是什么?通常是用来干什么的?
  • 模拟一次误删数据的操作,并且使用binlog日志恢复误删的数据。

写这篇文章的初衷,是有一次我真的险些把测试数据库的一张表给删除了,当时吓出一身冷汗。原因是由于Spring JPA的配置中,有一个spring.jpa.properties.hibernate.hbm2ddl.auto=create-drop,其用途是每次加载hibernate时根据model类生成表,但是sessionFactory一关闭,表就自动删除。,这个可不能随便配置上去,直接就把你原来存在的表给drop了!

好了,回归正题,这篇文章就是想让大家放心,MySQL就算进行了误删操作,也基本都能够抢救回来。尤其是大公司内,数据可不是你想删就能删掉的,有无数权限/备份阻拦着你。

正文

Binlog介绍

binlog是记录所有数据库表结构变更(例如CREATE、ALTER TABLE…)以及表数据修改(INSERT、UPDATE、DELETE…)的二进制日志。
binlog不会记录SELECT和SHOW这类操作,因为这类操作对数据本身并没有修改,但你可以通过查询通用日志来查看MySQL执行过的所有语句。

看了上面binlog的定义,大家也应该能大致推理出binlog的三大用途:

  • 恢复数据:今天要说的重点
  • 数据库复制:主从数据库是通过将binlog传给从库,从库有两个线程,一个I/O线程,一个SQL线程,I/O线程读取主库传过来的binlog内容并写入到relay log,SQL线程从relay log里面读取内容,写入从库的数据库。
  • 审计:用户可以通过二进制日志中的信息来进行审计,判断是否有对数据库进行注入攻击。

所以说,想要能够恢复数据,首先,你得打开Mysql的binlog,在平常你自己安装的单机Mysql中,默认情况下不会开启。下面就一步步地实践下如何开启你服务器上的Binlog日志。

在MySQL中开启Binlog

首先进入数据库控制台,运行指令:

mysql>?show?variables?like'log_bin%';
+---------------------------------+-------+
|?Variable_name???????????????????|?Value?|
+---------------------------------+-------+
|?log_bin?????????????????????????|?OFF???|
|?log_bin_basename????????????????|???????|
|?log_bin_index???????????????????|???????|
|?log_bin_trust_function_creators?|?OFF???|
|?log_bin_use_v1_row_events???????|?OFF???|
+---------------------------------+-------+
5?rows?in?set?(0.00?sec)

可以看到我们的binlog是关闭的,都是OFF。接下来我们需要修改Mysql配置文件,执行命令:

sudo?vi?/etc/mysql/mysql.conf.d/mysqld.cnf

在文件末尾添加:

log-bin=/var/lib/mysql/mysql-bin

保存文件,重启mysql服务:

sudo?service?mysql?restart

重启完成后,查看下mysql的状态:

systemctl?status?mysql.service

这时,如果你的mysql版本在5.7或更高版本,就会报错:

Jan?06?15:49:58?VM-0-11-ubuntu?mysqld[5930]:?2020-01-06T07:49:58.190791Z?0?[Warning]?Changed?limits:?max_open_files:?1024?(requested?5000)
Jan?06?15:49:58?VM-0-11-ubuntu?mysqld[5930]:?2020-01-06T07:49:58.190839Z?0?[Warning]?Changed?limits:?table_open_cache:?431?(requested?2000)
Jan?06?15:49:58?VM-0-11-ubuntu?mysqld[5930]:?2020-01-06T07:49:58.359713Z?0?[Warning]?TIMESTAMP?with?implicit?DEFAULT?value?is?deprecated.?Please?use?--explicit_defaults_for_timestamp?server?option?(se
Jan?06?15:49:58?VM-0-11-ubuntu?mysqld[5930]:?2020-01-06T07:49:58.361395Z?0?[Note]?/usr/sbin/mysqld?(mysqld?5.7.28-0ubuntu0.16.04.2-log)?starting?as?process?5930?...
Jan?06?15:49:58?VM-0-11-ubuntu?mysqld[5930]:?2020-01-06T07:49:58.363017Z?0?[ERROR]?You?have?enabled?the?binary?log,?but?you?haven't?provided?the?mandatory?server-id.?Please?refer?to?the?proper?server
Jan?06?15:49:58?VM-0-11-ubuntu?mysqld[5930]:?2020-01-06T07:49:58.363747Z?0?[ERROR]?Aborting
Jan?06?15:49:58?VM-0-11-ubuntu?mysqld[5930]:?2020-01-06T07:49:58.363922Z?0?[Note]?Binlog?end
Jan?06?15:49:58?VM-0-11-ubuntu?mysqld[5930]:?2020-01-06T07:49:58.364108Z?0?[Note]?/usr/sbin/mysqld:?Shutdown?complete
Jan?06?15:49:58?VM-0-11-ubuntu?systemd[1]:?mysql.service:?Main?process?exited,?code=exited,?status=1/FAILURE

You have enabled the binary log, but you haven't provided the mandatory server-id. Please refer to the proper server

之前我们的配置,对于5.7以下版本应该是可以的。但对于高版本,我们需要指定server-id。

如果你不是分布式的部署Mysql,这个server-id随机给个数字就可以。

server-id=123454

模拟删除数据并恢复

  1. 首先新建数据库mytest,新建一张表table1,结构见下方SQL代码
CREATE?DATABASE?`test`?;

USE?`test`;

DROP?TABLE?IF?EXISTS?`table1`;

CREATE?TABLE?`table2`?(
??`id`?int(11)?DEFAULT?NULL,
??`name`?varchar(20)?DEFAULT?NULL
)?ENGINE=InnoDB?DEFAULT?CHARSET=utf8mb4;
  1. 插入两条数据,分别是 (1,'A'),(2,'B')
INSERT?INTO?`table1`?VALUES?(1,'A'),(2,'B');
  1. 我们看一下binlog日志的状态,使用show master status
mysql>?show?master?status
????->?;
+------------------+----------+--------------+------------------+-------------------+
|?File?????????????|?Position?|?Binlog_Do_DB?|?Binlog_Ignore_DB?|?Executed_Gtid_Set?|
+------------------+----------+--------------+------------------+-------------------+
|?mysql-bin.000001?|??????690?|??????????????|??????????????????|???????????????????|
+------------------+----------+--------------+------------------+-------------------+
1?row?in?set

binlog日志特征:每当我们重启MySQL一次,会自动生成一个binlog文件,当然,我们也可以手动的来刷新binlog文件,通过 flush logs,同样会新创建一个binlog文件。实际上当服务器在重启时,也会调用flush logs操作。

上图代码中可以看到,现在我们正在使用 mysql-bin.0000001 ,并且这个文件现在正在记录到690行。

  1. 然后,使用flush logs来主动刷新一次binlog
mysql>?flush?logs;
Query?OK,?0?rows?affected

mysql>?show?master?status
????->?;
+------------------+----------+--------------+------------------+-------------------+
|?File?????????????|?Position?|?Binlog_Do_DB?|?Binlog_Ignore_DB?|?Executed_Gtid_Set?|
+------------------+----------+--------------+------------------+-------------------+
|?mysql-bin.000002?|??????154?|??????????????|??????????????????|???????????????????|
+------------------+----------+--------------+------------------+-------------------+
1?row?in?set

可以看到,现在日志文件在 mysql-bin.000002 文件中,位置为154。也就是我们主动刷新了一次binlog,生成了新的000002,而000001则已经归档了,不会再写入新的日志进去了。

  1. 接下来我们在插入两条数据
insert?into?table1?values?(3,'C');
insert?into?table1?values?(4,'D');
mysql>?select?*?from?table1;
+----+----+
|?id?|name|
+----+----+
|??1?|?A??|
|??2?|?B??|
|??3?|?C??|
|??4?|?D??|
+----+----+
  1. 这时候我们已经有了四条数据,我们再次flush logs,把mysql-bin.000002日志存档,开启新的mysql-bin.000003日志,这样,每次我们插入的数据彼此独立。实际情况下,binlog会比较复杂,这里也是做了简化,为了理解更方便。
mysql>?flush?logs;
Query?OK,?0?rows?affected

mysql>?show?master?status;
+------------------+----------+--------------+------------------+-------------------+
|?File?????????????|?Position?|?Binlog_Do_DB?|?Binlog_Ignore_DB?|?Executed_Gtid_Set?|
+------------------+----------+--------------+------------------+-------------------+
|?mysql-bin.000003?|??????154?|??????????????|??????????????????|???????????????????|
+------------------+----------+--------------+------------------+-------------------+
1?row?in?set
  1. 然后我们删除id为4的数据(4,D),并且再次刷新binlog,如此一来,binlog.000003里面只有一条删除操作。
mysql>?delete?from?table1?where?id?=?4;
Query?OK,?1?row?affected

mysql>?show?master?status;
+------------------+----------+--------------+------------------+-------------------+
|?File?????????????|?Position?|?Binlog_Do_DB?|?Binlog_Ignore_DB?|?Executed_Gtid_Set?|
+------------------+----------+--------------+------------------+-------------------+
|?mysql-bin.000003?|??????423?|??????????????|??????????????????|???????????????????|
+------------------+----------+--------------+------------------+-------------------+
1?row?in?set

mysql>?flush?logs;
Query?OK,?0?rows?affected

mysql>?show?master?status;
+------------------+----------+--------------+------------------+-------------------+
|?File?????????????|?Position?|?Binlog_Do_DB?|?Binlog_Ignore_DB?|?Executed_Gtid_Set?|
+------------------+----------+--------------+------------------+-------------------+
|?mysql-bin.000004?|??????154?|??????????????|??????????????????|???????????????????|
+------------------+----------+--------------+------------------+-------------------+
1?row?in?set
  1. 让我们来好好观察下mysql-bin.00002和mysql-bin00003两个binlog,使用命令:show binlog events in 'mysql-bin.000003'
mysql>?show?binlog?events?in?'mysql-bin.000003';
+------------------+-----+----------------+-----------+-------------+--------------------------------------------------------+
|?Log_name?????????|?Pos?|?Event_type?????|?Server_id?|?End_log_pos?|?Info???????????????????????????????????????????????????|
+------------------+-----+----------------+-----------+-------------+--------------------------------------------------------+
|?mysql-bin.000003?|???4?|?Format_desc????|????123456?|?????????123?|?Server?ver:?5.7.28-0ubuntu0.16.04.2-log,?Binlog?ver:?4?|
|?mysql-bin.000003?|?123?|?Previous_gtids?|????123456?|?????????154?|????????????????????????????????????????????????????????|
|?mysql-bin.000003?|?154?|?Anonymous_Gtid?|????123456?|?????????219?|?SET?@@SESSION.GTID_NEXT=?'ANONYMOUS'???????????????????|
|?mysql-bin.000003?|?219?|?Query??????????|????123456?|?????????293?|?BEGIN??????????????????????????????????????????????????|
|?mysql-bin.000003?|?293?|?Table_map??????|????123456?|?????????343?|?table_id:?108?(test.table1)??????????????????????????????|
|?mysql-bin.000003?|?343?|?Delete_rows????|????123456?|?????????392?|?table_id:?108?flags:?STMT_END_F????????????????????????|
|?mysql-bin.000003?|?392?|?Xid????????????|????123456?|?????????423?|?COMMIT?/*?xid=39?*/????????????????????????????????????|
+------------------+-----+----------------+-----------+-------------+--------------------------------------------------------+
7?rows?in?set

mysql>?show?binlog?events?in?'mysql-bin.000002';
+------------------+-----+----------------+-----------+-------------+--------------------------------------------------------+
|?Log_name?????????|?Pos?|?Event_type?????|?Server_id?|?End_log_pos?|?Info???????????????????????????????????????????????????|
+------------------+-----+----------------+-----------+-------------+--------------------------------------------------------+
|?mysql-bin.000002?|???4?|?Format_desc????|????123456?|?????????123?|?Server?ver:?5.7.28-0ubuntu0.16.04.2-log,?Binlog?ver:?4?|
|?mysql-bin.000002?|?123?|?Previous_gtids?|????123456?|?????????154?|????????????????????????????????????????????????????????|
|?mysql-bin.000002?|?154?|?Anonymous_Gtid?|????123456?|?????????219?|?SET?@@SESSION.GTID_NEXT=?'ANONYMOUS'???????????????????|
|?mysql-bin.000002?|?219?|?Query??????????|????123456?|?????????293?|?BEGIN??????????????????????????????????????????????????|
|?mysql-bin.000002?|?293?|?Table_map??????|????123456?|?????????343?|?table_id:?108?(test.table1)??????????????????????????????|
|?mysql-bin.000002?|?343?|?Write_rows?????|????123456?|?????????390?|?table_id:?108?flags:?STMT_END_F????????????????????????|
|?mysql-bin.000002?|?390?|?Xid????????????|????123456?|?????????421?|?COMMIT?/*?xid=34?*/????????????????????????????????????|
|?mysql-bin.000002?|?421?|?Anonymous_Gtid?|????123456?|?????????486?|?SET?@@SESSION.GTID_NEXT=?'ANONYMOUS'???????????????????|
|?mysql-bin.000002?|?486?|?Query??????????|????123456?|?????????560?|?BEGIN??????????????????????????????????????????????????|
|?mysql-bin.000002?|?560?|?Table_map??????|????123456?|?????????610?|?table_id:?108?(test.table1)??????????????????????????????|
|?mysql-bin.000002?|?610?|?Write_rows?????|????123456?|?????????659?|?table_id:?108?flags:?STMT_END_F????????????????????????|
|?mysql-bin.000002?|?659?|?Xid????????????|????123456?|?????????690?|?COMMIT?/*?xid=35?*/????????????????????????????????????|
|?mysql-bin.000002?|?690?|?Rotate?????????|????123456?|?????????737?|?mysql-bin.000003;pos=4?????????????????????????????????|
+------------------+-----+----------------+-----------+-------------+--------------------------------------------------------+
13?rows?in?set

虽然有很多看似复杂的指令,但是还是不难看出,在02里,有两条写操作,03里有一条删除操作。

一条插入操作的完整日志是这样:

|?mysql-bin.000002?|?154?|?Anonymous_Gtid?|????123456?|?????????219?|?SET?@@SESSION.GTID_NEXT=?'ANONYMOUS'???????????????????|
|?mysql-bin.000002?|?219?|?Query??????????|????123456?|?????????293?|?BEGIN??????????????????????????????????????????????????|
|?mysql-bin.000002?|?293?|?Table_map??????|????123456?|?????????343?|?table_id:?108?(test.table1)??????????????????????????????|
|?mysql-bin.000002?|?343?|?Write_rows?????|????123456?|?????????390?|?table_id:?108?flags:?STMT_END_F????????????????????????|
|?mysql-bin.000002?|?390?|?Xid????????????|????123456?|?????????421?|?COMMIT?/*?xid=34?*/????????????????????????????????????|
  1. 我们的目的是恢复误删的数据,其实就是将binlog.000002日志的两条插入记录重演一遍,而不需要取理会binlog.000003的操作(因为删除是一个误操作)

所以现在能理解为什么我们频繁刷新binlog了吧,当然,在实际的线上环境中,我们肯定需要将binlog导出后,仔细筛选出误操作,并将其排除,之后再运行binlog。

在本文中,我们只做一个恢复两条插入语句的操作,执行语句:

sudo?mysqlbinlog?/var/lib/mysql/mysql-bin.000002?--start-position?154?--stop-position?690?|?mysql?-uroot?-p?mytest

注意:这里填写的路径/var/lib/mysql/mysql-bin.000002需要具体到你的binlog目录,网上大部分文章只写到mysql-bin.000002,如果你不在目录里,mysqlbinlog命令并不会自动定位binlog所在路径。

参数描述:

--start-datetime:从二进制日志中读取指定等于时间戳或者晚于本地计算机的时间

--stop-datetime:从二进制日志中读取指定小于时间戳或者等于本地计算机的时间?取值和上述一样

--start-position:从二进制日志中读取指定position?事件位置作为开始。

--stop-position:从二进制日志中读取指定position?事件位置作为事件截至

执行成功后,再次查看表table1,可以看到两条新的id=3和4的数据被插入了进来。恢复成功了。

mysql>?select?*?from?table1;
+----+----+
|?id?|name|
+----+----+
|??1?|?A??|
|??2?|?B??|
|??3?|?C??|?
|??3?|?C??|
|??4?|?D??|
+----+----+
6?rows?in?set

延伸思考

Binlog在什么情况下无法恢复数据?

结语

删库跑路不用怕,其他开发运维都等着恢复你的数据呢,多好的练手机会是不是。

当然,看完binlog日志恢复数据的原理,希望大家以后在定期备份数据库的脚本里,也能够加上刷新binlog日志的命令,这样一旦某天丢失数据,可以将当天binlog数据单独拿出来还原,做到清晰可辨,也加快恢复效率。

参考

https://www.cnblogs.com/rjzheng/p/9721765.html

https://blog.csdn.net/king_kgh/article/details/74890381

https://www.jianshu.com/p/564fcc2b5e31

https://blog.csdn.net/king_kgh/article/details/74833539

关注我

我是一名后端开发工程师。

主要关注后端开发,数据安全,爬虫,物联网,边缘计算等方向,欢迎交流。

各大平台都可以找到我

  • 微信公众号:后端技术漫谈
  • Github:@qqxx6661
  • CSDN:@后端技术漫谈
  • 知乎:@后端技术漫谈
  • 简书:@后端技术漫谈
  • 掘金:@后端技术漫谈

原创博客主要内容

  • 后端开发相关技术文章
  • Java面试知识点复习全手册
  • 设计模式/数据结构
  • Leetcode/剑指offer 算法题解析
  • SpringBoot/SpringCloud 入门实战系列
  • 爬虫相关技术文章
  • 逸闻趣事/好书分享/个人兴趣

个人公众号:后端技术漫谈

公众号:后端技术漫谈.jpg

如果文章对你有帮助,不妨收藏,投币,转发,在看起来~

相关推荐

0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM)

文档编写目的在前面的文档中,介绍了在有CM和无CM两种情况下使用rpm方式安装CDH5.10.0,本文档将介绍如何在无CM的情况下使用rpm方式安装CDH6.2.0,与之前安装C5进行对比。环境介绍:...

ARM64 平台基于 openEuler + iSula 环境部署 Kubernetes

为什么要在arm64平台上部署Kubernetes,而且还是鲲鹏920的架构。说来话长。。。此处省略5000字。介绍下系统信息;o架构:鲲鹏920(Kunpeng920)oOS:ope...

生产环境starrocks 3.1存算一体集群部署

集群规划FE:节点主要负责元数据管理、客户端连接管理、查询计划和查询调度。>3节点。BE:节点负责数据存储和SQL执行。>3节点。CN:无存储功能能的BE。环境准备CPU检查JDK...

在CentOS上添加swap虚拟内存并设置优先级

现如今很多云服务器都会自己配置好虚拟内存,当然也有很多没有配置虚拟内存的,虚拟内存可以让我们的低配服务器使用更多的内存,可以减少很多硬件成本,比如我们运行很多服务的时候,内存常常会满,当配置了虚拟内存...

国产深度(deepin)操作系统优化指南

1.升级内核随着deepin版本的更新,会自动升级系统内核,但是我们依旧可以通过命令行手动升级内核,以获取更好的性能和更多的硬件支持。具体操作:-添加PPAs使用以下命令添加PPAs:```...

postgresql-15.4 多节点主从(读写分离)

1、下载软件[root@TX-CN-PostgreSQL01-252software]#wgethttps://ftp.postgresql.org/pub/source/v15.4/postg...

Docker 容器 Java 服务内存与 GC 优化实施方案

一、设置Docker容器内存限制(生产环境建议)1.查看宿主机可用内存bashfree-h#示例输出(假设宿主机剩余16GB可用内存)#Mem:64G...

虚拟内存设置、解决linux内存不够问题

虚拟内存设置(解决linux内存不够情况)背景介绍  Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存...

Elasticsearch性能调优(5):服务器配置选择

在选择elasticsearch服务器时,要尽可能地选择与当前业务量相匹配的服务器。如果服务器配置太低,则意味着需要更多的节点来满足需求,一个集群的节点太多时会增加集群管理的成本。如果服务器配置太高,...

Es如何落地

一、配置准备节点类型CPU内存硬盘网络机器数操作系统data节点16C64G2000G本地SSD所有es同一可用区3(ecs)Centos7master节点2C8G200G云SSD所有es同一可用区...

针对Linux内存管理知识学习总结

现在的服务器大部分都是运行在Linux上面的,所以,作为一个程序员有必要简单地了解一下系统是如何运行的。对于内存部分需要知道:地址映射内存管理的方式缺页异常先来看一些基本的知识,在进程看来,内存分为内...

MySQL进阶之性能优化

概述MySQL的性能优化,包括了服务器硬件优化、操作系统的优化、MySQL数据库配置优化、数据库表设计的优化、SQL语句优化等5个方面的优化。在进行优化之前,需要先掌握性能分析的思路和方法,找出问题,...

Linux Cgroups(Control Groups)原理

LinuxCgroups(ControlGroups)是内核提供的资源分配、限制和监控机制,通过层级化进程分组实现资源的精细化控制。以下从核心原理、操作示例和版本演进三方面详细分析:一、核心原理与...

linux 常用性能优化参数及理解

1.优化内核相关参数配置文件/etc/sysctl.conf配置方法直接将参数添加进文件每条一行.sysctl-a可以查看默认配置sysctl-p执行并检测是否有错误例如设置错了参数:[roo...

如何在 Linux 中使用 Sysctl 命令?

sysctl是一个用于配置和查询Linux内核参数的命令行工具。它通过与/proc/sys虚拟文件系统交互,允许用户在运行时动态修改内核参数。这些参数控制着系统的各种行为,包括网络设置、文件...

取消回复欢迎 发表评论: