百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

工具|Innodb 恢复工具介绍

nanshan 2024-12-31 13:33 17 浏览 0 评论

一 前言

作为DBA 运维MySQL 数据库的过程中,肯定遇到过在没有备份和binlog的情况下,ibd文件损坏或者误删除数据的情况,如何恢复呢?本文介绍一个工具Percona Data Recovery Tool for InnoDB

使用 该工具的注意事项:

  1. The tools work only for InnoDB/XtraDB tables, and will not work with MyISAM tables. Percona does have a preliminary set of tools for MyISAM data recovery; 仅仅支持 InnoDB 引擎的表

  2. The tools work on a saved copy of your data files, not on the running MySQL server. 工具针对 ibd 文件要是目标表的备份的ibd,而不是针对正在运行中的 实例。

  3. There is no guarantee. Even with these tools, data is sometimes unrecoverable. For example, data that is overwritten cannot be recovered with these tools. There may be file system specific or physical means to recover overwritten data. 不能保证数据总一定可被恢复。例如,被重写的数据不能被恢复,这种情况下可能需要针对系统或物理的方式来恢复,不属于本工具的范畴。

  4. Time is of the essence. The best chance for recovery comes when you act immediately to save a copy of your raw data files as soon as you discover the loss or corruption. 当发生误删除数据时必须立即备份表文件以便确保数据被覆盖或者损坏。

  5. There is manual work to do. Not everything is automatic.

  6. Recovery depends on knowing your data. As part of the process you may have to choose between two versions of your data. The better you know your data, the better the chance you'll be able to recover it.

需要理解的是innodb-tools工具不是通过连接到在线的database进行数据恢复,而是通过离线拷贝数据的方式进行的。

注意:不要在MySQL运行的时候,直接拷贝InnoDB文件,这样是不安全的,会影响数据恢复过程。不过这点我做了测试,在数据库运行的时候是可以进行数据库恢复的。

一 安装

进入解压后根目录下的mysql-source目录,运行配置命令,不运行make命令

 wget
cd percona-data-recovery-tool-for-innodb-0.5/mysql_source/
./configure
cd ..
make

编译生成 page_parserconstraints_parser 工具

注意 create_defs.pl 脚本需要依赖perl DBD,DBI,安装过程中可能会遇到错误。

二 模拟误删除数据

root@127.0.0.1 : test 22:12:22> delete from mac where id < 51398;
Query OK, 4999 rows affected (0.62 sec)
root@127.0.0.1 : test 22:12:29>

三 获取数据页

InnoDB页的默认大小是16K,innodb的page分为两大部分,一部分一级索引部分,另一部分为二级索引部分。page_parser工具通过读取数据文件,根据页头中的index ID,拷贝每个页到一个单独的文件中。

如果 my.cnf 配置了innodb_file_per_table=1,那么系统实现上述过程。所有需要的页都在单独的.ibd文件,而且通常你不需要再切分它。

如果 .ibd 文件中可能包含多个index,那么将页单独切分开还是有必要的。如果MySQL server没有配置innodb_file_per_table,那么数据会被保存在一个全局的表命名空间,这时候就需要按页对文件进行切分。

[root@rac1 recovery-tool]# ./page_parser -5 -f /opt/mysql/data/test/mac.ibd

-5:代表 row format为Compact
-f:代表要解析的文件

运行后,page_parser工具会创建一个pages-的目录,其中TIMESTAMP是UNIX系统时间戳。在这个目录下,为每个index ID,以页的index ID创建一个子目录。例如:

输出信息:

Opening file: /opt/mysql/data/test/mac.ibd:
2051 ID of device containing file
20283635 inode number
33200 protection
1 number of hard links
103 user ID of owner
106 group ID of owner
0 device ID (if special file)
11534336 total size, in bytes
4096 blocksize for filesystem I/O
22560 number of blocks allocated
1377958353 time of last access
1377958359 time of last modification
1377958359 time of last status change
11534336 Size to process in bytes
104857600 Disk cache size in bytes
[root@rac1 recovery-tool]# less pages-1377958391/FIL_PAGE_INDEX/0-205
0-2057/ 0-2058/ 0-2059/

以上三个为索引文件 0-2057/主键,0-2058/ 0-2059/ 二级索引。

四 获取表结构的定义

./create_defs.pl --host 127.0.0.1 --user root --port 3306 --db test --table mac > include/table_defs.h

[root@rac1 recovery-tool]# more include/table_defs.h
#ifndef table_defs_h
#define table_defs_h

// Table definitions
table_def_t table_definitions[] = {
{
name: "mac",
{
{ /* int(10) unsigned */
name: "id",
type: FT_UINT,
fixed_length: 4,

has_limits: FALSE,
limits: {
can_be_: FALSE,
uint_min_val: 0,
uint_max_val: 4294967295ULL
},

can_be_: FALSE
},
{ /* */
name: "DB_TRX_ID",
type: FT_INTERNAL,
fixed_length: 6,

can_be_: FALSE
},
{ /* */
name: "DB_ROLL_PTR",
type: FT_INTERNAL,
fixed_length: 7,

can_be_: FALSE
},
{ /* varchar(50) */
name: "mac",
type: FT_CHAR,
min_length: 0,
max_length: 150,

has_limits: FALSE,
limits: {
can_be_: FALSE,
char_min_len: 0,
char_max_len: 150,
char_ascii_only: TRUE
},

can_be_: FALSE
},
{ /* varchar(50) */
name: "name",
type: FT_CHAR,
min_length: 0,
max_length: 150,

has_limits: FALSE,
limits: {
can_be_: TRUE,
char_min_len: 0,
char_max_len: 150,
char_ascii_only: TRUE
},

can_be_: TRUE
},
{ /* tinyint(4) */
name: "scope",
type: FT_INT,
fixed_length: 1,

has_limits: FALSE,
limits: {
can_be_: TRUE,
int_min_val: -128,
int_max_val: 127
},

can_be_: TRUE
},
{ /* datetime */
name: "gmt_create",
type: FT_DATETIME,
fixed_length: 8,

can_be_: FALSE
},
{ /* datetime */
name: "gmt_modify",
type: FT_DATETIME,
fixed_length: 8,

can_be_: FALSE
},
{ type: FT_NONE }
}
},
};

#endif

五 重新编译constraints_parser工具:

[root@rac1 recovery-tool]# make
gcc -DHAVE_OFFSET64_T -D_FILE_OFFSET_BITS=64 -D_LARGEFILE64_SOURCE=1 -D_LARGEFILE_SOURCE=1 -Wall -O3 -g -I include -I mysql-source/include -I mysql-source/innobase/include -c tables_dict.c -o lib/tables_dict.o
gcc -DHAVE_OFFSET64_T -D_FILE_OFFSET_BITS=64 -D_LARGEFILE64_SOURCE=1 -D_LARGEFILE_SOURCE=1 -Wall -O3 -g -I include -I mysql-source/include -I mysql-source/innobase/include -c check_data.c -o lib/check_data.o
gcc -DHAVE_OFFSET64_T -D_FILE_OFFSET_BITS=64 -D_LARGEFILE64_SOURCE=1 -D_LARGEFILE_SOURCE=1 -Wall -O3 -g -I include -I mysql-source/include -I mysql-source/innobase/include -o constraints_parser constraints_parser.c lib/tables_dict.o lib/print_data.o lib/check_data.o lib/libut.a lib/libmystrings.a
gcc -DHAVE_OFFSET64_T -D_FILE_OFFSET_BITS=64 -D_LARGEFILE64_SOURCE=1 -D_LARGEFILE_SOURCE=1 -Wall -O3 -g -I include -I mysql-source/include -I mysql-source/innobase/include -static -lrt -o page_parser page_parser.c lib/tables_dict.o lib/libut.a

恢复误删除的数据:

运行 constraints_parser 工具以提取行记录。和 page_parser 工具一样,需要通过 -5或 -4 参数指定InnoDB页格式(COMPACT/REDUNDANT),-f指定输入文件。

执行 constraints_parser 命令会生成 load data 的命令,在数据库中执行上述命令即可.

./constraints_parser -D -5 -f pages-1377958391/FIL_PAGE_INDEX/0-2057/ > /tmp/mac.rec

LOAD DATA INFILE '/root/recovery-tool/dumps/default/mac' REPLACE INTO TABLE `mac` FIELDS TERMINATED BY '\t' OPTIONALLY ENCLOSED BY '"' LINES STARTING BY 'mac\t' (id, mac, name, scope, gmt_create, gmt_modify);
root@127.0.0.1 : test 22:20:54> select count(1) from mac;
+----------+
| count(1) |
+----------+
| 9973 |
+----------+
1 row in set (0.00 sec)
root@127.0.0.1 : test 22:21:09> LOAD DATA INFILE '/tmp/mac.rec' REPLACE INTO TABLE `mac` FIELDS TERMINATED BY '\t' OPTIONALLY ENCLOSED BY '"' LINES STARTING BY 'mac\t' (id, mac, name, scope, gmt_create, gmt_modify);
Query OK, 4999 rows affected (0.22 sec)
Records: 4999 Deleted: 0 Skipped: 0 Warnings: 0
root@127.0.0.1 : test 22:21:13> select count(1) from mac;
+----------+
| count(1) |
+----------+
| 14972 |
+----------+
1 row in set (0.00 sec)

总结

  1. 该可以解析正常 ibd 文件的数据。本文没有针对坏块做特殊测试。
  2. delete和truncate 时,恢复不一定百分百成功。所以一定要检查勤做备份以及检查备份的有效性。
  3. 感兴趣的朋友 ,可以自己测试看看。

参考文章

https://www.percona.com/blog/2012/02/20/how-to-recover-deleted-rows-from-an-innodb-tablespace/

恢复误操作的方法-介绍binlog2sql恢复dml 操作。

相关推荐

0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM)

文档编写目的在前面的文档中,介绍了在有CM和无CM两种情况下使用rpm方式安装CDH5.10.0,本文档将介绍如何在无CM的情况下使用rpm方式安装CDH6.2.0,与之前安装C5进行对比。环境介绍:...

ARM64 平台基于 openEuler + iSula 环境部署 Kubernetes

为什么要在arm64平台上部署Kubernetes,而且还是鲲鹏920的架构。说来话长。。。此处省略5000字。介绍下系统信息;o架构:鲲鹏920(Kunpeng920)oOS:ope...

生产环境starrocks 3.1存算一体集群部署

集群规划FE:节点主要负责元数据管理、客户端连接管理、查询计划和查询调度。>3节点。BE:节点负责数据存储和SQL执行。>3节点。CN:无存储功能能的BE。环境准备CPU检查JDK...

在CentOS上添加swap虚拟内存并设置优先级

现如今很多云服务器都会自己配置好虚拟内存,当然也有很多没有配置虚拟内存的,虚拟内存可以让我们的低配服务器使用更多的内存,可以减少很多硬件成本,比如我们运行很多服务的时候,内存常常会满,当配置了虚拟内存...

国产深度(deepin)操作系统优化指南

1.升级内核随着deepin版本的更新,会自动升级系统内核,但是我们依旧可以通过命令行手动升级内核,以获取更好的性能和更多的硬件支持。具体操作:-添加PPAs使用以下命令添加PPAs:```...

postgresql-15.4 多节点主从(读写分离)

1、下载软件[root@TX-CN-PostgreSQL01-252software]#wgethttps://ftp.postgresql.org/pub/source/v15.4/postg...

Docker 容器 Java 服务内存与 GC 优化实施方案

一、设置Docker容器内存限制(生产环境建议)1.查看宿主机可用内存bashfree-h#示例输出(假设宿主机剩余16GB可用内存)#Mem:64G...

虚拟内存设置、解决linux内存不够问题

虚拟内存设置(解决linux内存不够情况)背景介绍  Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存...

Elasticsearch性能调优(5):服务器配置选择

在选择elasticsearch服务器时,要尽可能地选择与当前业务量相匹配的服务器。如果服务器配置太低,则意味着需要更多的节点来满足需求,一个集群的节点太多时会增加集群管理的成本。如果服务器配置太高,...

Es如何落地

一、配置准备节点类型CPU内存硬盘网络机器数操作系统data节点16C64G2000G本地SSD所有es同一可用区3(ecs)Centos7master节点2C8G200G云SSD所有es同一可用区...

针对Linux内存管理知识学习总结

现在的服务器大部分都是运行在Linux上面的,所以,作为一个程序员有必要简单地了解一下系统是如何运行的。对于内存部分需要知道:地址映射内存管理的方式缺页异常先来看一些基本的知识,在进程看来,内存分为内...

MySQL进阶之性能优化

概述MySQL的性能优化,包括了服务器硬件优化、操作系统的优化、MySQL数据库配置优化、数据库表设计的优化、SQL语句优化等5个方面的优化。在进行优化之前,需要先掌握性能分析的思路和方法,找出问题,...

Linux Cgroups(Control Groups)原理

LinuxCgroups(ControlGroups)是内核提供的资源分配、限制和监控机制,通过层级化进程分组实现资源的精细化控制。以下从核心原理、操作示例和版本演进三方面详细分析:一、核心原理与...

linux 常用性能优化参数及理解

1.优化内核相关参数配置文件/etc/sysctl.conf配置方法直接将参数添加进文件每条一行.sysctl-a可以查看默认配置sysctl-p执行并检测是否有错误例如设置错了参数:[roo...

如何在 Linux 中使用 Sysctl 命令?

sysctl是一个用于配置和查询Linux内核参数的命令行工具。它通过与/proc/sys虚拟文件系统交互,允许用户在运行时动态修改内核参数。这些参数控制着系统的各种行为,包括网络设置、文件...

取消回复欢迎 发表评论: