百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

MySQL的bin log、redo log及undo log的区别,2分钟吃透!

nanshan 2024-11-27 18:15 24 浏览 0 评论

Bin log、Redo log 和 Undo log 的区别,是 MySQL 的高频面试题,大厂校招面试90%会问。

在 MySQL 数据库中,Bin log、Redo log 和 Undo log 都是极为重要的日志文件。

MySQL 实现事务、崩溃恢复、集群的主从复制等,底层都离不开日志,可以说日志是 MySQL 的内核所在。

只有了解 MySQL 日志,才算是彻底搞懂 MySQL。

本文主要探讨 Bin log、Redo log 和 Undo log 的区别。

大家好,我是爱分享的程序员宝妹儿,分享即学习。

PS.

宝妹儿已将这个题目以及答案,整理到2023版《MySQL 大厂高频面试题大全》PDF了,方便系统学习、面试通关。

宝妹儿精编的2023版《MySQL 大厂高频面试题大全》,已收录100+道真题,近30000字,长期迭代、持续更新。吃透它,应付MySQL面试没问题。

公号Java面试题宝,自取。

1 Bin log、Redo log 和 Undo log 的概述

1.1 Bin log

Bin log 是什么

Bin log 记录的是逻辑日志,它以追加的方式记录数据库的修改操作,采用二进制格式进行存储。

Bin log 包含了操作语句、或语句集合的原始二进制数据,可以通过解析和回放 Bin log,来重新执行其中的操作。

Bin log 的作用

  • 数据恢复和故障恢复:通过分析和回放 Bin log,可以将数据库恢复到故障发生之前的状态。当数据库发生故障或数据丢失时,可以利用Bin log 进行数据恢复。
  • 主从复制:在主从架构中,Bin log 用于同步主数据库的数据变更到从数据库。主数据库将其修改操作记录到 Bin log 中,从数据库通过解析和应用 Bin log 来复制主数据库的数据变更,从而保持主从数据的一致性。
  • 数据备份:通过定期备份 Bin log,可以实现对数据库的增量备份。将备份的 Bin log 文件与全量备份结合使用,可以还原数据库到指定的时间点。

示例:

假设我们有一个名为products的商品表,其中包含商品的名称和价格。

现在,我们发现商品价格发生了错误的修改,并且需要通过 Bin log 记录来定位和修复这个问题。

假设商品 ID 为 1 的商品价格,被错误地修改为 2000。

UPDATE products SET price = 2000 WHERE id = 1;

通过查看 Bin log 记录,我们可以定位到这个修改操作,并通过恢复正确的价格来修复数据。

Bin log 的三种日志格式

针对不同的应用场景,Binlog 推出了三种工作模式 Statement、Row、Mixed,以满足对数据库的需求。

这三种模式的选型参考思路

  • 使用 MySQL 特殊功能较少,例如存储过程、触发器、函数等,用 Statement 模式。
  • 使用 MySQL 特殊功能较多,用 Mixed 模式。
  • 使用 MySQL 特殊功能较多,同时希望数据最大化一致,用 Row 模式。

详见:吃透3大Binlog模式,MySQL数据零丢失

什么时候写入 Bin Log ?

Bin Log 采用预写日志 WAL,即先写日志,再写磁盘。

写入 Bin Log 之后的事务流程:

先写处于 prepare 状态的 Redo Log,事务提交后,再写处于 commit 状态的 Redo Log,即二阶段提交。

那为什么不直接持久化到磁盘呢?

直接写入磁盘会严重影响到性能:

  • InnoDB 在磁盘中存储的基本单元是页,可能本次修改只变更一页中几个字节,但是需要刷新整页的数据,就很浪费资源。
  • 一个事务可能修改了多页中的数据,页之间又是不连续的,就会产生随机IO,性能更差。

在使用 Bin log 时,需要注意:

  • Bin log 的开启和配置:需要确保 Bin log 已经开启,并根据实际需求配置相关参数,如 Bin log 格式、Bin log 大小和保留时间等。
  • 定期备份 Bin log :为了保证数据恢复和故障恢复的能力,需要定期备份 Bin log 文件。

1.2 Redo log

Redo log循环写入的方式记录数据库的修改操作,采用固定大小的物理日志文件进行存储。

Redo log 记录了数据库页的物理修改,而非语句级别的逻辑操作。

Redo log 的作用:

  • 保证事务的持久性:通过将事务的修改操作记录到 Redo log 中,可以确保在系统故障或崩溃发生时,已提交的事务能够被正确地重新执行,保证数据的一致性。
  • 减少磁盘IO操作:Redo log的写入是顺序追加的方式,相比于随机写入数据库文件,它可以减少磁盘IO的操作,提升数据库的性能。
  • 数据库恢复和故障恢复:通过分析和应用 Redo log,可以将数据库恢复到故障发生之前的状态。
  • 数据库性能优化:合理配置 Redo log 的大小和数量,可以根据系统负载和事务处理量来提升数据库的性能。

示例:

假设用户在下订单后,数据库发生了突然的崩溃,我们可以使用 Redo log 来恢复用户的订单信息。

-- 在事务中创建订单
BEGIN;
INSERT INTO orders (user_id, product_id, quantity) VALUES (1, 100, 2);
COMMIT;

当数据库发生崩溃时,使用 Redo log 中的内容重新应用这个事务,就能恢复用户的订单信息了。

那在啥时候写入 Redo log 呢?

Redo log 同样采用预写日志 WAL 的方式。

在使用 Redo log 时,需要注意:

  • Redo log 的大小和数量配置:根据实际需求和系统负载,配置合适的Redo log大小和数量,以确保足够的持久化能力和性能。
  • 定期刷写 Redo log :为了保证已提交的事务能够及时写入磁盘,需要配置合理的 Redo log 刷写策略,以避免数据丢失。
  • 监控 Redo log 的使用情况:定期监控 Redo log 的使用情况,以便及时调整配置参数,并确保数据库的可靠性和性能。

1.3 Undo log

Undo log逻辑方式记录数据库事务的修改操作,它记录了事务执行过程中旧值的备份,以便在事务回滚或并发控制需要时能够恢复数据。

例如:当我们执行一条 insert 语句时,Undo Log 就记录一条相反的 delete 语句。

Undo log 的作用

  • 事务回滚:在事务执行过程中,如果出现错误或需要回滚操作,Undo log 可以恢复事务执行之前的数据状态,实现事务的回滚操作。
  • 并发控制:通过 Undo log 的使用,数据库可以实现并发事务的隔离性和一致性,避免数据读取和写入的冲突。

示例:

假设在用户付款过程中,发现付款金额错误,我们需要回滚事务并使用 Undo log 中记录的旧值来恢复正确的付款金额。

-- 在事务中更新付款金额
BEGIN;
UPDATE payments SET amount = 100.00 WHERE id = 1;

-- 假设发现付款金额错误,需要回滚事务并恢复旧值
ROLLBACK;

通过回滚事务并使用 Undo log 中记录的旧值,我们可以将数据库中的付款金额恢复到事务开始之前的状态,保证数据的一致性。

Undo Log 如何回滚到上一个版本

首先,通过两个隐藏列 trx_id(最近一次提交事务的 ID)和 roll_pointer(上个版本的地址),建立一个版本链。

然后,在事务中读取时生成一个 ReadView(读视图),在 Read Committed 隔离级别下,每次读取都会生成一个读视图,而在 Repeatable Read 隔离级别下,只会在第一次读取时生成一个读视图。

在使用 Undo log 时,需要注意:

  • Undo log 的管理和清理:由于 Undo log 会占用存储空间,需要定期清理不再需要的 Undo log,以释放存储空间。
  • 配置 Undo log 的大小:根据数据库的并发事务量和数据修改量,合理配置 Undo log 的大小,以确保足够的空间来存储 Undo log 信息。
  • 定期备份 Undo log:为了避免数据丢失,定期备份 Undo log 文件,以便在需要恢复数据时使用。

2. Bin log、Redo log 和 Undo log 的区别

三者的区别主要有两点:

2.1 数据记录方式

  • Bin log:以二进制格式记录数据库的修改操作。
  • Redo log:以固定大小的物理日志文件记录数据库页的物理修改。
  • Undo log:以逻辑方式记录事务执行过程中旧值的备份。

2.2 应用场景

  • Bin log:用于数据恢复、主从复制、数据审计和数据备份等。
  • Redo log:用于保证事务的持久性和故障恢复。
  • Undo log:用于事务的回滚和并发控制。

总结

通过本文,我们掌握了 Bin log、Redo log 和 Undo log 的概念、作用及其区别

Bin log、Redo log 和 Undo log 是 MySQL 中重要的日志机制。

  • MySQL InnoDB 引擎使用 Redo log (重做日志)保证事务的持久性。
  • 使用 Undo log (回滚日志))来保证事务的原子性。
  • MySQL 数据库的数据备份、主备、主主、主从都离不开 Bin log,需要依靠 Bin log 来同步数据,保证数据一致性。

MySQL 实现事务、崩溃恢复、集群的主从复制等,底层都离不开日志,可以说日志是 MySQL 的内核所在。

只有了解 MySQL 日志,才算是彻底搞懂 MySQL。

如果觉得有用,请顺手【点赞】支持下哦,这将是对宝妹儿的最大鼓励,谢谢~

PS.

本文收录于宝妹儿精编的 2023版《MySQL 大厂高频面试题大全》PDF。

搞定这100道题,足以应对MySQL面试。

相关推荐

0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM)

文档编写目的在前面的文档中,介绍了在有CM和无CM两种情况下使用rpm方式安装CDH5.10.0,本文档将介绍如何在无CM的情况下使用rpm方式安装CDH6.2.0,与之前安装C5进行对比。环境介绍:...

ARM64 平台基于 openEuler + iSula 环境部署 Kubernetes

为什么要在arm64平台上部署Kubernetes,而且还是鲲鹏920的架构。说来话长。。。此处省略5000字。介绍下系统信息;o架构:鲲鹏920(Kunpeng920)oOS:ope...

生产环境starrocks 3.1存算一体集群部署

集群规划FE:节点主要负责元数据管理、客户端连接管理、查询计划和查询调度。>3节点。BE:节点负责数据存储和SQL执行。>3节点。CN:无存储功能能的BE。环境准备CPU检查JDK...

在CentOS上添加swap虚拟内存并设置优先级

现如今很多云服务器都会自己配置好虚拟内存,当然也有很多没有配置虚拟内存的,虚拟内存可以让我们的低配服务器使用更多的内存,可以减少很多硬件成本,比如我们运行很多服务的时候,内存常常会满,当配置了虚拟内存...

国产深度(deepin)操作系统优化指南

1.升级内核随着deepin版本的更新,会自动升级系统内核,但是我们依旧可以通过命令行手动升级内核,以获取更好的性能和更多的硬件支持。具体操作:-添加PPAs使用以下命令添加PPAs:```...

postgresql-15.4 多节点主从(读写分离)

1、下载软件[root@TX-CN-PostgreSQL01-252software]#wgethttps://ftp.postgresql.org/pub/source/v15.4/postg...

Docker 容器 Java 服务内存与 GC 优化实施方案

一、设置Docker容器内存限制(生产环境建议)1.查看宿主机可用内存bashfree-h#示例输出(假设宿主机剩余16GB可用内存)#Mem:64G...

虚拟内存设置、解决linux内存不够问题

虚拟内存设置(解决linux内存不够情况)背景介绍  Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存...

Elasticsearch性能调优(5):服务器配置选择

在选择elasticsearch服务器时,要尽可能地选择与当前业务量相匹配的服务器。如果服务器配置太低,则意味着需要更多的节点来满足需求,一个集群的节点太多时会增加集群管理的成本。如果服务器配置太高,...

Es如何落地

一、配置准备节点类型CPU内存硬盘网络机器数操作系统data节点16C64G2000G本地SSD所有es同一可用区3(ecs)Centos7master节点2C8G200G云SSD所有es同一可用区...

针对Linux内存管理知识学习总结

现在的服务器大部分都是运行在Linux上面的,所以,作为一个程序员有必要简单地了解一下系统是如何运行的。对于内存部分需要知道:地址映射内存管理的方式缺页异常先来看一些基本的知识,在进程看来,内存分为内...

MySQL进阶之性能优化

概述MySQL的性能优化,包括了服务器硬件优化、操作系统的优化、MySQL数据库配置优化、数据库表设计的优化、SQL语句优化等5个方面的优化。在进行优化之前,需要先掌握性能分析的思路和方法,找出问题,...

Linux Cgroups(Control Groups)原理

LinuxCgroups(ControlGroups)是内核提供的资源分配、限制和监控机制,通过层级化进程分组实现资源的精细化控制。以下从核心原理、操作示例和版本演进三方面详细分析:一、核心原理与...

linux 常用性能优化参数及理解

1.优化内核相关参数配置文件/etc/sysctl.conf配置方法直接将参数添加进文件每条一行.sysctl-a可以查看默认配置sysctl-p执行并检测是否有错误例如设置错了参数:[roo...

如何在 Linux 中使用 Sysctl 命令?

sysctl是一个用于配置和查询Linux内核参数的命令行工具。它通过与/proc/sys虚拟文件系统交互,允许用户在运行时动态修改内核参数。这些参数控制着系统的各种行为,包括网络设置、文件...

取消回复欢迎 发表评论: