百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

手把手教你用gdb调试mongod

nanshan 2024-11-23 20:14 17 浏览 0 评论

MongoDB作为一款NoSQL数据库,常应用在游戏开发领域。 作为一个后端程序,进行CRUD操作是家常便饭,但如果不看源码,便不会知道MongoDB底层是如何实现的,对自己写的CRUD代码,心里就没谱,不确定哪一行代码就把MongoDB给压垮了。遇到问题,不知道为啥MongoDB支撑不住,也就无从说起该怎样哪里优化。

开源MongoDB有上万个文件,代码量百万行。阅读MongoDB的源码是一项具有挑战的任务。一般的,我们可以从简单的、自己感兴趣的模块开始阅读。例如,先理解MongoDB在执行一条find命令时,是如何找到我们想要的结果。

本文,介绍如何编译MongoDB源码、如何用GDB调试MongoDB。

编译安装MongoDB

因为线上使用的是3.4.24版本,所以本文也采用该版本作为例子。

首先下载MongoDB源码

wget https://fastdl.mongodb.org/src/mongodb-src-r3.4.24.tar.gz

解压缩

tar -zxvf mongodb-src-r3.4.24.tar.gz 

在解压的目录中,docs/building.md介绍了如何编译安装MongoDB。

首先是安装依赖库

apt-get install aptitude
aptitude install scons build-essential
aptitude install libboost-filesystem-dev libboost-program-options-dev libboost-system-dev libboost-thread-dev

然后是通过scons命令进行MongoDB的编译安装。

scons core install --disable-warnings-as-errors

参数core,说明想要安装的包括mongod,mongos, mongo。加入参数--disable-warnings-as-errors是为了忽略编译过程的warning。

为了GDB能够调试MongoDB,需要在编译MongoDB时,加入-g参数。不然在调试时,会收到No symbol table is loaded的报错。通过查看SConstruct文件,已经加了-ggdb参数,所以我们就不需要做修改,直接执行scons就可以。



编译安装后,会在build/install/bin目录下,生成可执行文件:mongo,mongod,mongos,mongoperf

启用GDB调试

首先启动mongod。在build/install/bin目录下,执行 ./mongod启动mongod。

启动后,可以用ps -ef | grep mongod查看mongod的进程号,然后用ps -p 进程号 -T查看mongod创建的线程信息。

启动mongo。在build/install/bin目录下,执行./mongo启动mongo,使之直接连接mongod。

启动后,再次用ps -p 进程号 -T查看mongod创建的线程信息。这时,会发现多了一个conn1线程。这个线程,是mongod为一个客户端创建的。



在build/install/bin目录下,启动GDB,attach到mongod进程

gdb ./mongod 进程号

mongod是多线程,我们这里只关心处理客户端请求的线程。所以,先要切到相应的线程中。

使用info threads命令, 显示当前可调试的所有线程,每个线程会有一个GDB为其分配的ID,后面操作线程的时候会用到这个ID。 前面有*的是当前调试的线程



可以看到,处理客户端连接的线程,在GDB的编号是21,用thread 21切换到对应的线程中。

我们以find命令为例,介绍如何用GDB进行断点调试。

断点调试的第一步,就是加断点。这就需要找到find的入口在哪里,即在哪个文件的哪一行。 我们一般可以先快速过一遍mongod的源码结构。在src/mongo/db/commands发现了大量以命令命名的文件。通过简单分析我们有理由相信,find_cmd.cpp的run函数,就是find的入口。



确定了行号之后,就可以用gdb命令加断点了:

b src/mongo/db/commands/find_cmd.cpp:230

加好断点后,我们在启动的mongo进程中,触发find命令。

触发命令后,我们在gdb会话中,输入c告诉gdb继续执行,直到遇到我们设置的断点。



现在gdb已经定在了我们设置的断点中,下面可以利用gdb的其他命令,如命令s,n等,跟踪学习mongo的find命令实现了。

如果不幸的,我们没法通过源码发现find命令的入口,则只能借助gdb使用更暴力一些的办法。 在前文介绍的步骤中,当gdb关联到客户端的线程后,直接执行bt命令,看看现在的调用栈。



可以看到,线程在等待客户端数据,对应的文件是sock.cpp:692。



通过阅读源码,我们直接在sock.cpp:697加断点,客户端发起find请求,然后一步步调试,就能进入find的入口。


用docker编译调试mongod

编译安装mongod在不同的环境,会遇到各种奇葩的问题。我们为了用GDB调试mongod,可能会花大量时间在解决环境配置上。为了解决烦恼的环境问题,这里提供一个dockerfile,用docker可以完美的解决环境问题。

FROM debian:9
RUN apt-get install -y wget
RUN apt-get install -y vim
RUN apt-get install -y make
# 在Docker Debian容器中安装ps,top等命令
RUN apt-get install -y procps

RUN apt-get install -y gcc
RUN apt-get install -y g++

相关推荐

0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM)

文档编写目的在前面的文档中,介绍了在有CM和无CM两种情况下使用rpm方式安装CDH5.10.0,本文档将介绍如何在无CM的情况下使用rpm方式安装CDH6.2.0,与之前安装C5进行对比。环境介绍:...

ARM64 平台基于 openEuler + iSula 环境部署 Kubernetes

为什么要在arm64平台上部署Kubernetes,而且还是鲲鹏920的架构。说来话长。。。此处省略5000字。介绍下系统信息;o架构:鲲鹏920(Kunpeng920)oOS:ope...

生产环境starrocks 3.1存算一体集群部署

集群规划FE:节点主要负责元数据管理、客户端连接管理、查询计划和查询调度。>3节点。BE:节点负责数据存储和SQL执行。>3节点。CN:无存储功能能的BE。环境准备CPU检查JDK...

在CentOS上添加swap虚拟内存并设置优先级

现如今很多云服务器都会自己配置好虚拟内存,当然也有很多没有配置虚拟内存的,虚拟内存可以让我们的低配服务器使用更多的内存,可以减少很多硬件成本,比如我们运行很多服务的时候,内存常常会满,当配置了虚拟内存...

国产深度(deepin)操作系统优化指南

1.升级内核随着deepin版本的更新,会自动升级系统内核,但是我们依旧可以通过命令行手动升级内核,以获取更好的性能和更多的硬件支持。具体操作:-添加PPAs使用以下命令添加PPAs:```...

postgresql-15.4 多节点主从(读写分离)

1、下载软件[root@TX-CN-PostgreSQL01-252software]#wgethttps://ftp.postgresql.org/pub/source/v15.4/postg...

Docker 容器 Java 服务内存与 GC 优化实施方案

一、设置Docker容器内存限制(生产环境建议)1.查看宿主机可用内存bashfree-h#示例输出(假设宿主机剩余16GB可用内存)#Mem:64G...

虚拟内存设置、解决linux内存不够问题

虚拟内存设置(解决linux内存不够情况)背景介绍  Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存...

Elasticsearch性能调优(5):服务器配置选择

在选择elasticsearch服务器时,要尽可能地选择与当前业务量相匹配的服务器。如果服务器配置太低,则意味着需要更多的节点来满足需求,一个集群的节点太多时会增加集群管理的成本。如果服务器配置太高,...

Es如何落地

一、配置准备节点类型CPU内存硬盘网络机器数操作系统data节点16C64G2000G本地SSD所有es同一可用区3(ecs)Centos7master节点2C8G200G云SSD所有es同一可用区...

针对Linux内存管理知识学习总结

现在的服务器大部分都是运行在Linux上面的,所以,作为一个程序员有必要简单地了解一下系统是如何运行的。对于内存部分需要知道:地址映射内存管理的方式缺页异常先来看一些基本的知识,在进程看来,内存分为内...

MySQL进阶之性能优化

概述MySQL的性能优化,包括了服务器硬件优化、操作系统的优化、MySQL数据库配置优化、数据库表设计的优化、SQL语句优化等5个方面的优化。在进行优化之前,需要先掌握性能分析的思路和方法,找出问题,...

Linux Cgroups(Control Groups)原理

LinuxCgroups(ControlGroups)是内核提供的资源分配、限制和监控机制,通过层级化进程分组实现资源的精细化控制。以下从核心原理、操作示例和版本演进三方面详细分析:一、核心原理与...

linux 常用性能优化参数及理解

1.优化内核相关参数配置文件/etc/sysctl.conf配置方法直接将参数添加进文件每条一行.sysctl-a可以查看默认配置sysctl-p执行并检测是否有错误例如设置错了参数:[roo...

如何在 Linux 中使用 Sysctl 命令?

sysctl是一个用于配置和查询Linux内核参数的命令行工具。它通过与/proc/sys虚拟文件系统交互,允许用户在运行时动态修改内核参数。这些参数控制着系统的各种行为,包括网络设置、文件...

取消回复欢迎 发表评论: