百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

MySQL Binlog日志最全详解(图文并茂)

nanshan 2024-11-27 18:14 18 浏览 0 评论

大家好,我是mikechen。

binlog是mysql的关键组成部分,掌握好binlog非常重要,下面我就重点来详解binlog@mikechen

本篇已收于mikechen创作的《阿里架构师进阶专题合集》里面。

binlog基本概念

binlog全称是Binary Log,翻译过来就是二进制日志,是MySQL数据库的一种日志文件。

binlog的作用

binlog作用:主要用于记录数据库中的修改操作,以便进行数据备份、恢复和复制等操作。

不管用什么存储引擎,只要发生了表数据更新,都会产生 binlog 日志。

体现为如下3点:

1.数据恢复

在数据库出现故障或数据错误时,可以使用binlog来还原数据库到之前的状态。

2.数据复制

MySQL的主从复制依赖于binlog,可以将主数据库的修改操作同步到一个或多个从数据库上。

3.数据备份

通过记录所有的数据库修改操作,binlog可以用于创建完整的数据库备份。

binlog的特点

binlog的特点,主要体现为如下几点:

1.二进制格式

binlog以二进制形式存储,不可读,用于节省磁盘空间和提高性能。

2.追加写入

binlog以追加方式写入,减少对磁盘的随机写入,提高性能。

3.可复制性

binlog可用于主从复制,实现数据复制和分布式架构。

4.事务性

binlog记录操作是事务性的,要么全部成功,要么全部失败。

5.多种格式

支持多种格式,如Statement格式、Row格式和Mixed格式,适用于不同的场景

binlog日志三种模式

binlog 日志有三种格式,分别为 STATMENT 、 ROW 和 MIXED。

1.Statement格式

Statement基于SQL语句的复制( statement-based replication, ),每一条会修改数据的SQL语句会记录到 binlog 中 。

指定statement,记录的内容是SQL语句原文。

比如:执行一条update T set update_time=now where id=1,记录的内容如下。

Statement会记录SQL语句的执行,对于非事务性操作较为适用。

2.Row格式

row记录的内容不再是简单的SQL语句了,还包含操作的具体数据。

如下图所示:

如果一个update语句修改一百行数据,那么这种模式下就会记录100行对应的记录日志。

这种格式需要更大的容量来记录,比较占用空间,适用于事务性操作。

3.Mixed格式

MIXED是基于 STATMENT 和 ROW 两种模式的混合模式。

可以根据操作类型自动选择使用Statement或Row格式,是一种混合模式。

binlog写入机制

binlog的写入时机也非常简单,事务执行过程中,先把日志写到binlog cache,事务提交的时候,再把binlog cache写到binlog文件中。

当执行对数据库表的数据修改操作时,如:插入(INSERT)、更新(UPDATE)和删除(DELETE)等,MySQL会生成相应的binlog事件。

日志刷盘流程,如下图所示:

binlog采用追加写入机制,即新的binlog事件总是被附加到当前binlog文件的末尾。

这种机制有助于减少对磁盘的随机写入,提高了性能。因为磁盘随机写入通常比顺序写入要慢。

binlog是事务性的,这意味着一个事务内的所有SQL语句要么都被记录到binlog中,要么都不会被记录。

如果一个事务失败(如由于完整性约束违反或其他错误),则binlog中的对应事件会被回滚,不会记录到binlog中。

总的来说,binlog的写入机制保证了数据的一致性和完整性,并通过追加写入和事务性写入来提高性能和可靠性。

开启binlog日志

要开启binlog日志,你需要编辑MySQL的配置文件(通常是my.cnf或my.ini)并添加以下配置:

[mysqld]
log_bin = /path/to/binlog_filename

log_bin启用binlog日志,指定binlog文件的存储路径和文件名。

然后,重新启动MySQL服务以使配置生效。

验证我们的MySQL数据库是否开启binlog,可以使用show variables like '%log_bin%'命令。

mysql> show variables like '%log_bin%';
 --------------------------------- -------------------------------- 
| Variable_name                   | Value                          |
 --------------------------------- -------------------------------- 
| log_bin                         | ON                             |/*这显示ON,表示已经开启binlog*/
| log_bin_basename                | /var/lib/mysql/mysql-bin       |/*这是binlog日志文件存放的目录和名称*/
| log_bin_index                   | /var/lib/mysql/mysql-bin.index |/*这是binlog日志文件的索引文件目录和名称*/

需要我们注意其中的两个参数:

  • log_bin_basename:这里是配置的binlog日志文件的存放的目录和名称。
  • log_bin_index:这个参数配置的是binlog日志的索引文件存储目录和名称,这里面记录了MySQL目前所有的有效的binlog日志文件列表。

binlog和 redolog区别

binlog和redo log是MySQL数据库中的两种不同类型的日志,它们在用途、内容、存储位置、生命周期和写入时机等方面有明显的区别。

1.用途不同

binlog(二进制日志)用于数据库的备份、恢复、复制和迁移。

redo log(重做日志)用于数据库的恢复,确保事务的持久性和一致性。

2.日志内容不同

binlog记录的是SQL语句或数据行的变化。

redo log记录的是事务的物理变化,即对磁盘上数据页的修改。

3.存储位置不同

binlog通常以文本文件形式存储在磁盘上,供备份和复制使用。

redo log是数据库内部的循环写入的二进制日志,不可直接访问。

4.日志的生命周期不同

binlog的生命周期由用户配置决定,可以根据需要手动删除旧的binlog文件。

redo log的生命周期由数据库管理,一般情况下不需要手动操作。

本篇已收于mikechen创作的《阿里架构师进阶专题合集》里面。

相关推荐

0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM)

文档编写目的在前面的文档中,介绍了在有CM和无CM两种情况下使用rpm方式安装CDH5.10.0,本文档将介绍如何在无CM的情况下使用rpm方式安装CDH6.2.0,与之前安装C5进行对比。环境介绍:...

ARM64 平台基于 openEuler + iSula 环境部署 Kubernetes

为什么要在arm64平台上部署Kubernetes,而且还是鲲鹏920的架构。说来话长。。。此处省略5000字。介绍下系统信息;o架构:鲲鹏920(Kunpeng920)oOS:ope...

生产环境starrocks 3.1存算一体集群部署

集群规划FE:节点主要负责元数据管理、客户端连接管理、查询计划和查询调度。>3节点。BE:节点负责数据存储和SQL执行。>3节点。CN:无存储功能能的BE。环境准备CPU检查JDK...

在CentOS上添加swap虚拟内存并设置优先级

现如今很多云服务器都会自己配置好虚拟内存,当然也有很多没有配置虚拟内存的,虚拟内存可以让我们的低配服务器使用更多的内存,可以减少很多硬件成本,比如我们运行很多服务的时候,内存常常会满,当配置了虚拟内存...

国产深度(deepin)操作系统优化指南

1.升级内核随着deepin版本的更新,会自动升级系统内核,但是我们依旧可以通过命令行手动升级内核,以获取更好的性能和更多的硬件支持。具体操作:-添加PPAs使用以下命令添加PPAs:```...

postgresql-15.4 多节点主从(读写分离)

1、下载软件[root@TX-CN-PostgreSQL01-252software]#wgethttps://ftp.postgresql.org/pub/source/v15.4/postg...

Docker 容器 Java 服务内存与 GC 优化实施方案

一、设置Docker容器内存限制(生产环境建议)1.查看宿主机可用内存bashfree-h#示例输出(假设宿主机剩余16GB可用内存)#Mem:64G...

虚拟内存设置、解决linux内存不够问题

虚拟内存设置(解决linux内存不够情况)背景介绍  Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存...

Elasticsearch性能调优(5):服务器配置选择

在选择elasticsearch服务器时,要尽可能地选择与当前业务量相匹配的服务器。如果服务器配置太低,则意味着需要更多的节点来满足需求,一个集群的节点太多时会增加集群管理的成本。如果服务器配置太高,...

Es如何落地

一、配置准备节点类型CPU内存硬盘网络机器数操作系统data节点16C64G2000G本地SSD所有es同一可用区3(ecs)Centos7master节点2C8G200G云SSD所有es同一可用区...

针对Linux内存管理知识学习总结

现在的服务器大部分都是运行在Linux上面的,所以,作为一个程序员有必要简单地了解一下系统是如何运行的。对于内存部分需要知道:地址映射内存管理的方式缺页异常先来看一些基本的知识,在进程看来,内存分为内...

MySQL进阶之性能优化

概述MySQL的性能优化,包括了服务器硬件优化、操作系统的优化、MySQL数据库配置优化、数据库表设计的优化、SQL语句优化等5个方面的优化。在进行优化之前,需要先掌握性能分析的思路和方法,找出问题,...

Linux Cgroups(Control Groups)原理

LinuxCgroups(ControlGroups)是内核提供的资源分配、限制和监控机制,通过层级化进程分组实现资源的精细化控制。以下从核心原理、操作示例和版本演进三方面详细分析:一、核心原理与...

linux 常用性能优化参数及理解

1.优化内核相关参数配置文件/etc/sysctl.conf配置方法直接将参数添加进文件每条一行.sysctl-a可以查看默认配置sysctl-p执行并检测是否有错误例如设置错了参数:[roo...

如何在 Linux 中使用 Sysctl 命令?

sysctl是一个用于配置和查询Linux内核参数的命令行工具。它通过与/proc/sys虚拟文件系统交互,允许用户在运行时动态修改内核参数。这些参数控制着系统的各种行为,包括网络设置、文件...

取消回复欢迎 发表评论: