百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

技术译文 | 使用 Perf 和火焰图分析软件

nanshan 2025-08-02 20:21 5 浏览 0 评论

作者:Agustín

翻译:孟维克

原文:
https://www.percona.com/blog/2019/11/20/profiling-software-using-perf-and-flame-graphs/

在这篇博文中,我们将探讨如何一起使用 perf 和火焰图。它们用于生成我们选择的软件正在调用的函数的图形。在此我们使用 Percona 分支版本,但是它可以扩展到任何可以进行解析堆栈跟踪的软件。

在继续之前,请注意,与任何分析工具一样,除非您知道自己在做什么,否则不要在生产环境运行。


安装需要的软件包

为了简单,为使用 CentOS7 版本,但是对于基于 Debian 的发行版来说,它们应该是相同的(步骤中的唯一区别是用 apt-get install linux-tools-$(uname -r) 代替 yum 命令)。

安装 perf

SHELL> sudo yum install -y perf

获得火焰图软件包

SHELL> mkdir -p ~/srcSHELL> cd ~/srcSHELL> git clone https://github.com/brendangregg/FlameGraph

全部安装完毕!让我们继续


抓取采集样本

火焰图是一种可视化数据的方式,所以我们需要一些可以作为基础的样本。可以用三种方式做到这一点(请注意,这里我们使用 -p 选项仅抓取我们感兴趣的进程的数据,但是如果需要,我们可以抓取所有正在运行的进程的数据)

1. 仅抓取设定时间(这里是10秒)

SHELL> sudo perf record -a -F 99 -g -p $(pgrep -x mysqld) --sleep 10

2. 抓取直到我们发出中断讯号(CTRL+C)

SHELL> sudo perf record -a -F 99 -g -p $(pgrep -x mysqld)

3. 抓取整个进程的生命周期

# 注意,如果我们中断了这个variant,我们同样杀死了上面的子进程SHELL> sudo perf record -a -F 99 -g --/sbin/mysqld \--defaults-file=/etc/percona-server.conf.d/mysqld.cnf --user=mysql

或者

SHELL> sudo perf record -a -F 99 -g -p $(pgrep -x mysqld) --mysql -e "SELECT * FROM db.table"

在第三个场景的第一种情况下,我们被迫抓取了所有进程的数据,因为实现不可能直到进程 ID 号(PID)(通过执行该命令,我们实际上正在启动 MySQL 服务)。当您希望从进程启动时就开始获取数据,这种类型的命令非常有用,否则是不可能的。

在第二个场景下,我们在正在运行的 MySQL 服务上执行一个查询,因此我们可以使用 -p 选项抓取这个进程的数据。例如,如果您希望抓取作业正在运行的时的数据,这就非常方便。


准备样本

初始化抓取完成后,我们需要将收集到的数据“可读”。这是必要的,因为通过 perf record 生成的是二进制格式。因此,我们将执行:

SHELL> sudo perf script > perf.script

默认情况下它读取 perf.data,perf record 也默认输出到这个文件。它可以分别使用 -i 选项和 -o 选项来覆盖写入。

现在我们能读取生成的文本文件,因为已经是易读的形式。然而,当您做到这时,你很快就会意识到我们为什么要将这些数据聚合为更易懂的形式。


生成火焰图

我们可以将第一个命令的输出作为第二个命令的输出,在一行命令中完成以下工作。因为我们没有将火焰图的 git 文件夹加入到 PATH 变量中,因此要使用完整路径。

SHELL> ~/src/FlameGraph/stackcollapse-perf.pl perf.script | ~/src/FlameGraph/flamegraph.pl > flamegraph.svg

现在我们在任何浏览器打开 .svg 文件并开始分析富含信息的图形。


看起来如何

作为示例,我将使用第 2 种抓取数据的方法的完整命令、输出和生成火焰图的屏幕截图帖在如下。我们执行 INSERT INTO...SELECT 语句,我们可以分析执行过程。

SHELL> time sudo perf record -a -F 99 -g \-p $(pgrep -x mysqld) \--mysql test -e "INSERT INTO joinit SELECT NULL, uuid(), time(now()), (FLOOR( 1 + RAND( ) *60 )) FROM joinit;"Warning:PID/TID switch overriding SYSTEM[ perf record: Woken up 7 times to write data ][ perf record: Captured and wrote 1.909 MB perf.data (8214 samples) ]
real 1m24.366suser 0m0.133ssys 0m0.378s
SHELL> sudo perf script | \~/src/FlameGraph/stackcollapse-perf.pl perf.script | \~/src/FlameGraph/flamegraph.pl > mysql_select_into_flamegraph.svg

敏锐的读者会注意到,我们在这里更进一步,通过一个管道(|)合并了步骤 2 和步骤 3,避免向 perf.script 文件写入和读取数据。此外,还有时间输出,我们可以对工具生成的数据量进行估计(1 分 25 秒生成约 2Mb 数据);当然这取决于许多因素,所以要谨慎对待,并在自己的环境中进行测试。

生成的火焰图如下:


优化的一个明显的候选对象是 write_record:如果我们使这个函数变的更快,那么就有很大潜力来减少整体执行时间(左下角的蓝色方框表示,我们可以看到 60% 的样本是在这个代码路径中获取的)。在下面的最后一个章节中,我们将提供一篇博客,该文章详细解释了如何解释火焰图,但是现在,您只需要知道移动鼠标在各个函数名上,它将动态地更改左下角显示的信息。您也可以通过以下指南更好理解它:



总结

对于支持工程师,在许多情况下,我们使用此工具来深入了解 MySQL 正在执行的内容及执行的时间。这样,我们就可以更好地了解特定负载背后的操作,并采取相应的措施。这个软件用于优化或故障排查,它是我们工具箱中非常强大的工具!众所周知,人类处理图像比处理文本更擅长,而在我看来,该工具十分出色。


相关链接

Interpreting Flame Graphs (scroll down to the “Flame Graph Interpretation” section)

https://queue.acm.org/detail.cfm?id=2927301

Flame Graphs 201, Percona分享会

https://www.percona.com/resources/webinars/flame-graphs-201

Brendan Gregg ,火焰图作者

http://www.brendangregg.com/flamegraphs.html


相关推荐

0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM)

文档编写目的在前面的文档中,介绍了在有CM和无CM两种情况下使用rpm方式安装CDH5.10.0,本文档将介绍如何在无CM的情况下使用rpm方式安装CDH6.2.0,与之前安装C5进行对比。环境介绍:...

ARM64 平台基于 openEuler + iSula 环境部署 Kubernetes

为什么要在arm64平台上部署Kubernetes,而且还是鲲鹏920的架构。说来话长。。。此处省略5000字。介绍下系统信息;o架构:鲲鹏920(Kunpeng920)oOS:ope...

生产环境starrocks 3.1存算一体集群部署

集群规划FE:节点主要负责元数据管理、客户端连接管理、查询计划和查询调度。>3节点。BE:节点负责数据存储和SQL执行。>3节点。CN:无存储功能能的BE。环境准备CPU检查JDK...

在CentOS上添加swap虚拟内存并设置优先级

现如今很多云服务器都会自己配置好虚拟内存,当然也有很多没有配置虚拟内存的,虚拟内存可以让我们的低配服务器使用更多的内存,可以减少很多硬件成本,比如我们运行很多服务的时候,内存常常会满,当配置了虚拟内存...

国产深度(deepin)操作系统优化指南

1.升级内核随着deepin版本的更新,会自动升级系统内核,但是我们依旧可以通过命令行手动升级内核,以获取更好的性能和更多的硬件支持。具体操作:-添加PPAs使用以下命令添加PPAs:```...

postgresql-15.4 多节点主从(读写分离)

1、下载软件[root@TX-CN-PostgreSQL01-252software]#wgethttps://ftp.postgresql.org/pub/source/v15.4/postg...

Docker 容器 Java 服务内存与 GC 优化实施方案

一、设置Docker容器内存限制(生产环境建议)1.查看宿主机可用内存bashfree-h#示例输出(假设宿主机剩余16GB可用内存)#Mem:64G...

虚拟内存设置、解决linux内存不够问题

虚拟内存设置(解决linux内存不够情况)背景介绍  Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存...

Elasticsearch性能调优(5):服务器配置选择

在选择elasticsearch服务器时,要尽可能地选择与当前业务量相匹配的服务器。如果服务器配置太低,则意味着需要更多的节点来满足需求,一个集群的节点太多时会增加集群管理的成本。如果服务器配置太高,...

Es如何落地

一、配置准备节点类型CPU内存硬盘网络机器数操作系统data节点16C64G2000G本地SSD所有es同一可用区3(ecs)Centos7master节点2C8G200G云SSD所有es同一可用区...

针对Linux内存管理知识学习总结

现在的服务器大部分都是运行在Linux上面的,所以,作为一个程序员有必要简单地了解一下系统是如何运行的。对于内存部分需要知道:地址映射内存管理的方式缺页异常先来看一些基本的知识,在进程看来,内存分为内...

MySQL进阶之性能优化

概述MySQL的性能优化,包括了服务器硬件优化、操作系统的优化、MySQL数据库配置优化、数据库表设计的优化、SQL语句优化等5个方面的优化。在进行优化之前,需要先掌握性能分析的思路和方法,找出问题,...

Linux Cgroups(Control Groups)原理

LinuxCgroups(ControlGroups)是内核提供的资源分配、限制和监控机制,通过层级化进程分组实现资源的精细化控制。以下从核心原理、操作示例和版本演进三方面详细分析:一、核心原理与...

linux 常用性能优化参数及理解

1.优化内核相关参数配置文件/etc/sysctl.conf配置方法直接将参数添加进文件每条一行.sysctl-a可以查看默认配置sysctl-p执行并检测是否有错误例如设置错了参数:[roo...

如何在 Linux 中使用 Sysctl 命令?

sysctl是一个用于配置和查询Linux内核参数的命令行工具。它通过与/proc/sys虚拟文件系统交互,允许用户在运行时动态修改内核参数。这些参数控制着系统的各种行为,包括网络设置、文件...

取消回复欢迎 发表评论: