百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

QEMU磁盘缓存模式详解(qemu 磁盘)

nanshan 2024-10-20 07:35 26 浏览 0 评论

这几天看到suse官网的一篇关于磁盘缓存模式的文档,非常不错,讲的非常透彻,将这篇文档翻译了过来,分享给大家。

文档英文地址为:

http://webapp5.rrz.uni-hamburg.de/SuSe-Dokumentation/manual/sles-manuals_en/cha.qemu.cachemodes.html

磁盘io从虚拟机到宿主机物理存储的历程有9步。

1 虚拟机应用层

2 虚拟机文件系统或者块设备层

3 虚拟机磁盘驱动

4 虚拟化层

5 镜像或者裸设备

6 宿主机文件系统或者块设备层

7 宿主机磁盘驱动

8 RAID卡及cache

9 硬盘及cache

QEMU的存储缓存模式主要调整的是宿主机页面缓存的使用和虚拟化层是否给虚拟机提供磁盘的缓存。

虚拟机磁盘接口的几种缓存模式

KVM虚拟机在配置磁盘的时候,可以指定几种缓存模式。每一块虚拟机的磁盘接口可以配置成以下几种缓存模式:writethrough,writeback, none, directsync, 或者 unsafe。如果没有指明缓存模式,KVM使用默认的缓存方式。

缓存模式通过以下几种方式影响宿主机如何使用存储设备:

读写数据可以被缓存到宿主机的页面缓存里;

执行刷盘操作的时候,虚拟机的存储控制器如果是写缓存模式会被影响;

同步写模式,在这种模式里只有数据真的被写入到物理的存储设备才会报告写操作完成;

因为性能的原因,虚拟机磁盘控制器刷盘的命令可能被虚拟化层忽略。

如果虚拟机和它的存储设备失去连接会造成数据不一致,缓存模式的使用有可能会造成数据丢失。缓存方式也会深入影响磁盘性能。另外,基于一些因素,一些磁盘缓存模式会和在线迁移矛盾。磁盘镜像,镜像位置,存储子系统,关于缓存方式没有简单的最佳规则。用户需要规划和测试每台虚拟机的各种情况以选择最优的性能。

每种缓存模式的详细解释

缓存方式未指定

qemu-kvm低于1.2的版本,如果没有指定缓存方式,默认使用writethrough模式。之后的版本,大量的writeback 或者 writethrough缓存模式的虚拟化存储接口语义问题被修复,允许默认的缓存模式切换到writeback。ide、scsi和virtio等每种虚拟机的磁盘驱动,在内部有能力禁止写缓存模式,导致缓存模式转化为 writethrough。不管怎样,典型的虚拟机存储驱动将会默认维持在writeback模式。

cache = writethrough

这种模式设置虚拟机的磁盘镜像文件或者块设备为O_DSYNC 语义,数据只有合并写入存储设备才会返回成功报告。宿主机的页面缓存在这种模式是工作在透写方式。虚拟机的磁盘驱动告知虚拟机没有回写缓存,所以虚拟机不需要发出刷盘命令以保持数据一致性。存储设备的行为就像是透过缓存。

cache = writeback

这种模式设置虚拟机的磁盘镜像文件或者块设备既不是O_DSYNC 也不是O_DIRECT 语义,所以可以使用宿主机页面缓存,数据到底宿主机页面缓存就给虚拟机返回写成功报告,页面缓存管理机制会管理数据的合并写入宿主机存储设备。另外,虚拟机磁盘控制器被通知可以使用回写缓存,于是虚拟机在需要保证数据一致性的时候会发出刷盘命令。过程就像raid控制器的RAM缓存机制。

cache = none

这种模式设置虚拟机的磁盘镜像文件或者块设备为O_DIRECT语义,所以宿主机的页面缓存被绕过,I/O直接在qemu-kvm的用户空间缓存和宿主机存储设备间发生。由于实际的存储设备可能在数据被放入写入队列就报告数据写操作完成,虚拟机的存储控制器被告知有回写缓存,于是虚拟机在需要保证数据一致性的时候会发出刷盘命令。相当于直接访问主机的磁盘,并且有优越的性能。

cache = unsafe

这种模式同上面讨论的cache=writeback非常类似,unsafe模式关键的地方是所有的虚拟机刷盘指令会被忽略,使用这个模式意味着接受宿主机故障的时候数据丢失的风险以换取性能。这个模式可以在系统安装的时候使用,不建议在生产环境使用。

cache=directsync

这种模式设置虚拟机的磁盘镜像文件或者块设备同时使用O_DSYNC和O_DIRECT 语义,只要数据被合并写入存储设备才会报告写操作成功,这种模式也绕过宿主机的页面缓存,类是cache=writethrough模式,虚拟机也不需要发出刷盘命令。这种模式是最后一种语义缓存和直接访问的可能的组合,是缓存方式的一种补充。

缓存模式的数据一致性比较

cache = writethrough, cache = none, cache=directsync

这些是比较安全的模式,可以考虑用于保持数据一致性,虚拟机可以在需要的时候刷盘。如果是一台可靠性要求非常高的虚拟机,请使用writethough或者directsync模式。注意在一些文件系统不兼容cache=none 或者 cache=directsync的模式,当这些缓存模式被开启的时候,这些文件系统不支持O_DIRECT。

cache = writeback

这种模式通知虚拟机工作在回写模式,依靠虚拟机在必要的时候发起刷盘命令保持虚拟机镜像的数据一致性。这和现代文件系统存储设计思路保持完全一致。但是必须注意在数据报告写完成,和真正的合并写到存储设备上一个时间窗口期,这种模式在宿主机故障的时候会丢失数据。

cache = unsafe

这种模式同writeback非常相似,只是希望忽略虚拟机的刷盘指令,通过刷盘保持数据一致性是无效的,所以宿主机故障的时候数据丢失的风险非常高。被命名为unsafe也是警告这个是宿主机故障的时候数据丢失风险最高的一种模式。注意只有在虚拟机被关闭的时候才有数据刷盘的动作。

缓存方式的性能比较

选择全部使用页面缓存,或者透写缓存,或者跳过缓存,这些都对性能有显著的影响。另外一些对性能影响的因素包括实际的存储设备读写能力,具体的磁盘镜像方式,页面缓存页大小及系统的IO调度策略。另外,回写模式增加性能但是有风险。一般情况下,高可靠的虚拟机使用cache = none模式,用于减少数据复制。多台虚拟机共享宿主机的页面缓存,为提高读写命中率,建议使用aio = native方式。

缓存方式对在线迁移的影响

存储数据和元数据的缓存限制支持在线迁移的配置。当前,只有raw qcow2 qed的镜像格式支持在线迁移。如果使用的是集群文件系统,所有的镜像格式都支持迁移,如果不是,只有none模式支持在线迁移。

libvirt会检查在线迁移的几种兼容性因素。如果虚拟机在集群文件系统上,如果共享存储被标记为只读模式,缓存模式的检查会被忽略,相反,如果缓存模式不是none,libvirt不会允许在线迁移。然而,也可以通过virsh命令使用unsafe参数,或者使用API,强制执行在线迁移,例如

irsh migrate --live --unsafe

提示

none模式要求IO方式设置成aio = native。如果是其他缓存模式,IO方式会静默切换为aio = threads。qemu-kvm虚拟机可以使用fdatasync()方式实现在宿主机刷盘。

相关推荐

删库之后不要着急跑路,教你神不知鬼不觉找回数据

在工作中,我们误删数据或者数据库,我们一定需要跑路吗?我看未必,程序员一定要学会自救,神不知鬼不觉的将数据找回。在mysql数据库中,我们知道binlog日志记录了我们对数据库的所有操作,所以...

数据库告警不可用,增删改受阻(数据库限制删除)

前言:昨晚,突然出现服务不可用告警,查看日志上线报文入库到数据库很慢并受阻,出现数据不同步问题。排查问题查看发现服务都是在执行update、insert这些DML命令的时候,报的数据库执行超时。经过一...

Binlog实现MySQL复制,5个关键步骤,务必掌握!

复制是MySQL最重要的功能之一,MySQL集群的高可用、负载均衡和读写分离都是基于复制来实现的。Binlog就是实现主从复制的关键,主数据库将修改操作记录到Binlog中,从数据库通过解...

MySQL数据实时增量同步到Elasticsearch

Mysql到Elasticsearch的数据同步,一般用ETL来实现,但性能并不理想,目前大部分的ETL是定时查询Mysql数据库有没有新增数据或者修改数据,如果数据量小影响不大,但如果几百万上千万的...

MySQL 数据库恢复:如何执行时间点恢复(PITR)以挽救受损数据?

天津鸿萌科贸发展有限公司从事数据安全服务二十余年,致力于为各领域客户提供专业的数据恢复、数据备份、数据取证、数据迁移、网络安全、数据清除等解决方案,并针对企业面临的数据安全风险,提供专业的相关数据安全...

阿里面试:MySQL Binlog有哪些格式?底层原理?优缺点?

binlog的格式也有三种:STATEMENT、ROW、MIXED,下面我详解binlog三种模式@mikechenStatement模式Statement模式:是基于SQL语句的复制(statem...

快速带你读懂MySQL的binlog写入机制

深入讲解MySQL中的重要日志binlog的写入机制以及影响IO性能的关键配置,并且介绍了如何利用binlog去恢复数据,保证MySQL的可靠性。Q:binlog写入时机binlog的写入逻辑并...

MySQL 误删除数据恢复全攻略:基于 Binlog 的实战指南

在MySQL的世界里,二进制日志(Binlog)就是我们的"时光机"。它默默记录着数据库的每一个重要变更,就像一位忠实的史官,为我们在数据灾难中提供最后的救命稻草。本文将带您深入掌握如...

一文了解MySQL Binlog(一文了解肝脏有益和有害的食物)

MySQL的Binlog日志是一种二进制格式的日志,Binlog记录所有的DDL和DML语句(除了数据查询语句SELECT、SHOW等),以Event的形式记录,同时记录语句执行时...

数据丢失?别慌!MySQL备份恢复攻略

想象一下,某个晴朗的午后,你正享受着咖啡,突然接到紧急电话:你的网站或APP彻底挂了!系统崩溃,界面全白。虽然心头一紧,但你或许还能安慰自己:系统崩溃只是暂停服务,数据还在,修复修复就好了。然而,如果...

Mysql中的bin log、redo log、undo log的区别

最近在整理面试题,在看mvcc的时候看到了undolog,今天索性把这三个log都记录一遍。MySQL的逻辑架构说之前先说一下MySQL的基本架构,MySQL主要分为两层:Server层和存储引...

binlog日志定时清理(binlog清理规则)

binlog日志binlog是MySQL数据库的一种日志文件,用于记录所有对数据的修改操作。binlog全称为binarylog,它以二进制格式记录MySQL服务器上所有的修改操作,包括对哪个数据库...

茶水间炸锅了!菜鸟误删用户表,运维老张的MySQL救命三招!

(公司茶水间,运维老张、开发小王和新人小李围着咖啡机)小李:(紧张兮兮)张哥!我...我好像把测试库的用户表删了!下午演示咋办啊?老张:(淡定喝咖啡)慌啥?昨晚的备份是吃干饭的?走,教你恢复!一、基础...

解决运维痛点,提高运维安全性-雷池 SafeLine WAF新功能身份认证

雷池介绍使用雷池SafeLineWAF已经两年多了,在1.5.x版本时就已经开始测试使用,并在推出LTS版本后转入LTS分支。近期雷池SafeLineWAF重点更新了身份认证功能,并提供了SS...

【Docker 新手入门指南】第十五章:常见故障排除

一、前期准备:收集关键信息在排查问题前,建议先获取以下系统数据,便于精准定位故障:1.系统基础信息#查看Docker版本(确认是否为最新稳定版)dockerversion#查看...

取消回复欢迎 发表评论: