百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

报告老板,我不小心执行了kill -9命令

nanshan 2024-10-26 11:08 27 浏览 0 评论

相信很多程序员对于Linux系统都不陌生,即使自己的日常开发机器不是Linux,那么线上服务器也大部分都是的,所以,掌握常用的 Linux 命令也是程序员必备的技能。

但是,怕就怕很多人对于部分命令只是一知半解,使用不当就能导致线上故障。

前段时间,我们的线上应用报警,频繁 FGC,需要紧急处理问题,于是有同事去线上重启机器(正常程序应该是先采集堆 dump,然后再重启,方便排查是否存在内存泄露等问题)。

但是在重启过程中,同事发现正常的重启命令应用无反应,然后尝试使用 kill 命令"杀"掉 Java 进程,但是仍然无效。于是他私自决定使用 "kill -9"结束了进程的生命。

虽然应用进程被干掉了,但是随之而来带来了很多问题,首先是上游系统突然发生大量报警,对应开发找过来说调用我们的 RPC 服务无响应,频繁超时。

后来,我们又发现系统中存在部分脏数据,有些在同一个事务中需要完整更新的数据,只更新了一半…

为什么正常的 kill 无法"杀掉"进程,而 kill -9 就可以?为什么 kill -9 会引发这一连串连锁反应?正常的 kill 执行时,JVM 会如何处理的呢?

要搞清楚这些问题,我们要先从 kill 命令说起。

kill 命令

我们都知道,想要在 Linux 中终止一个进程有两种方式,如果是前台进程可以使用 Ctrl+C 键进行终止;如果是后台进程,那么需要使用kill命令来终止。(其实 Ctrl+C 也是 kill 命令)

kill 命令的格式是:

kill[参数][进程号] 
如:  
kill 21121  
kill -9 21121 

其中[参数]是可选的,进程号可以通过 jps/ps/pidof/pstree/top 等工具获取。

kill 的命令参数有以下几种:

-l 信号,若果不加信号的编号参数,则使用“-l”参数会列出全部的信号名称 
-a 当处理当前进程时,不限制命令名和进程号的对应关系 
-p 指定kill 命令只打印相关进程的进程号,而不发送任何信号 
-s 指定发送信号 
-u 指定用户 

通常情况下,我们使用的 -l(信号)的时候比较多,如我们前文提到的 kill -9 中的 9 就是信号。

信号如果没有指定的话,默认会发出终止信号(15)。常用的信号如下:

HUP 1 终端断线 
INT 2 中断(同 Ctrl + C) 
QUIT 3 退出(同 Ctrl + \) 
TERM 15 终止 
KILL 9 强制终止 
CONT 18 继续(与STOP相反, fg/bg命令) 
STOP 19 暂停(同 Ctrl + Z) 

比较常用的就是强制终止信号:9 和终止信号:15,另外,中断信号:2 其实就是我们前文提到的 Ctrl+C 结束前台进程。

那么,kill -9 和 kill -15 到底有什么区别呢?该如何选择呢?

kill -9 和 kill -15 的区别

kill 命令默认的信号就是 15,首先来说一下这个默认的 kill -15 信号。

当使用 kill -15 时,系统会发送一个 SIGTERM 的信号给对应的程序。当程序接收到该信号后,具体要如何处理是自己可以决定的。

这时候,应用程序可以选择:

  • 立即停止程序
  • 释放响应资源后停止程序
  • 忽略该信号,继续执行程序

因为 kill -15 信号只是通知对应的进程要进行"安全、干净的退出",程序接到信号之后,退出前一般会进行一些"准备工作",如资源释放、临时文件清理等等,如果准备工作做完了,再进行程序的终止。

但是,如果在"准备工作"进行过程中,遇到阻塞或者其他问题导致无法成功,那么应用程序可以选择忽略该终止信号。

这也就是为什么我们有的时候使用 kill 命令是没办法"杀死"应用的原因,因为默认的 kill 信号是 SIGTERM(15),而 SIGTERM(15) 的信号是可以被阻塞和忽略的。

和 kill -15 相比,kill -9 就相对强硬一点,系统会发出 SIGKILL 信号,他要求接收到该信号的程序应该立即结束运行,不能被阻塞或者忽略。

所以,相比于 kill -15 命令,kill -9 在执行时,应用程序是没有时间进行"准备工作"的,所以这通常会带来一些副作用,数据丢失或者终端无法恢复到正常状态等。

Java 是如何处理 SIGTERM(15) 的

我们都知道,在 Linux 中,Java 应用是作为一个独立进程运行的,Java程序的终止运行是基于 JVM 的关闭实现的。

JVM 关闭方式分为三种:

  • 正常关闭:当最后一个非守护线程结束或者调用了 System.exit 或者通过其他特定平台的方法关闭(接收到 SIGINT(2)、SIGTERM(15)信号等)
  • 强制关闭:通过调用 Runtime.halt 方法或者是在操作系统中强制 kill(接收到 SIGKILL(9) 信号)
  • 异常关闭:运行中遇到 RuntimeException 异常等。

JVM 进程在接收到 kill -15 信号通知的时候,是可以做一些清理动作的,比如删除临时文件等。

当然,开发者也是可以自定义做一些额外的事情的,比如让 Tomcat 容器停止,让 Dubbo 服务下线等。

而这种自定义 JVM 清理动作的方式,是通过 JDK 中提供的 shutdown hook 实现的。

JDK 提供了 Java.Runtime.addShutdownHook(Thread hook) 方法,可以注册一个 JVM 关闭的钩子。

例子如下:

package com.hollis; 
 
 
public class ShutdownHookTest { 
 
 
    public static void main(String[] args) { 
 
        boolean flag = true; 
 
        Runtime.getRuntime().addShutdownHook(new Thread(() -> { 
 
            System.out.println("hook execute..."); 
 
        })); 
 
 
        while (flag) { 
 
            // app is runing 
 
        } 
 
 
        System.out.println("main thread execute end..."); 
 
    } 
 
} 

执行命令:

? jps 
 
6520 ShutdownHookTest 
 
6521 Jps 
 
? kill 6520 

控制台输出内容:

hook execute... 
 
Process finished with exit code 143 (interrupted by signal 15: SIGTERM) 

可以看到,当我们使用 kill(默认 kill -15)关闭进程的时候,程序会先执行我注册的 shutdownHook,然后再退出,并且会给出一个提示:interrupted by signal 15: SIGTERM。

如果我们执行命令 kill -9:

? kill -9 6520 

控制台输出内容:

Process finished with exit code 137 (interrupted by signal 9: SIGKILL) 

可以看到,当我们使用 kill -9 强制关闭进程的时候,程序并没有执行 shutdownHook,而是直接退出了,并且会给出一个提示:interrupted by signal 9: SIGKILL。

总结

kill 命令用于终止 Linux 进程,默认情况下,如果不指定信号,kill 等价于 kill -15。

kill -15 执行时,系统向对应的程序发送 SIGTERM(15) 信号,该信号是可以被执行、阻塞和忽略的,所以应用程序接收到信号后,可以做一些准备工作,再进行程序终止。

有的时候,kill -15 无法终止程序,因为他可能被忽略,这时候可以使用 kill -9,系统会发出 SIGKILL(9) 信号,该信号不允许忽略和阻塞,所以应用程序会立即终止。

这也会带来很多副作用,如数据丢失等,所以,在非必要时,不要使用 kill -9 命令,尤其是那些 Web 应用、提供 RPC 服务、执行定时任务、包含长事务等应用中。

因为 kill -9 没给 Spring 容器、Tomcat 服务器、Dubbo 服务、流程引擎、状态机等足够的时间进行收尾。

作者:Hollis

简介:一个对 Coding 有着独特追求的人,现任阿里巴巴技术专家,个人技术博主,技术文章全网阅读量数千万,《程序员的三门课》联合作者。

编辑:陶家龙

出处:转载自微信公众号 Hollis(ID:hollischuang)

相关推荐

使用nginx配置域名及禁止直接通过IP访问网站

前段时间刚搭建好这个网站,一直没有关注一个问题,那就是IP地址也可以访问我的网站,今天就专门研究了一下nginx配置问题,争取把这个问题研究透彻。1.nginx配置域名及禁止直接通过IP访问先来看n...

如何在 Linux 中使用 PID 号查找进程名称?

在Linux的复杂世界中,进程是系统运行的核心,每个进程都由一个唯一的「进程ID」(PID)标识。无论是系统管理员在排查失控进程,还是开发者在调试应用程序,知道如何将PID映射到对应的进程名称都是一项...

Linux服务器硬件信息查询与日常运维命令总结

1.服务器硬件信息查询1.1CPU信息查询命令功能描述示例lscpu显示CPU架构、核心数、线程数等lscpucat/proc/cpuinfo详细CPU信息(型号、缓存、频率)cat/proc/c...

Ubuntu 操作系统常用命令详解(ubuntu常用的50个命令)

UbuntuLinux是一款流行的开源操作系统,广泛应用于服务器、开发、学习等场景。命令行是Ubuntu的灵魂,也是高效、稳定管理系统的利器。本文按照各大常用领域,详细总结Ubuntu必学...

从 0 到 1:打造基于 Linux 的私有 API 网关平台

在当今微服务架构盛行的时代,API网关作为服务入口和安全屏障,其重要性日益凸显。你是否想过,不依赖商业方案,完全基于开源组件,在Linux上构建一个属于自己的私有API网关平台?今天就带你...

Nginx搭建简单直播服务器(nginx 直播服务器搭建)

前言使用Nginx+Nginx-rtmp-module在Ubuntu中搭建简单的rtmp推流直播服务器。服务器环境Ubuntu16.04相关概念RTMP:RTMP协议是RealTi...

Linux连不上网?远程卡?这篇网络管理指南你不能错过!

大家好!今天咱们聊个所有Linux用户都躲不开的“老大难”——网络管理。我猜你肯定遇到过这些崩溃时刻:新装的Linux系统连不上Wi-Fi,急得直拍桌子;远程服务器SSH连不上,提示“Connecti...

7天从0到上线!手把手教你用Python Flask打造爆款Web服务

一、为什么全网开发者都在疯学Flask?在当今Web开发的战场,Flask就像一把“瑞士军刀”——轻量级架构让新手3天速成,灵活扩展能力又能支撑百万级用户项目!对比Django的“重型装甲”,Flas...

nginx配置文件详解(nginx反向代理配置详解)

Nginx是一个强大的免费开源的HTTP服务器和反向代理服务器。在Web开发项目中,nginx常用作为静态文件服务器处理静态文件,并负责将动态请求转发至应用服务器(如Django,Flask,et...

30 分钟搞定 Docker 安装与 Nginx 部署,轻松搭建高效 Web 服务

在云计算时代,利用容器技术快速部署应用已成为开发者必备技能。本文将手把手教你在阿里云轻量应用服务器上,通过Docker高效部署Nginx并发布静态网站,全程可视化操作,新手也能轻松上手!一、准...

Nginx 配置实战:从摸鱼到部署,手把手教你搞定生产级配置

各位摸鱼搭子们!今天咱不聊代码里的NullPointerException,改聊点「摸鱼必备生存技能」——Nginx配置!先灵魂拷问一下:写了一堆接口却不会部署?服务器被恶意请求打崩过?静态资源加载...

如何使用 Daphne + Nginx + supervisor部署 Django

前言:从Django3.0开始支持ASGI应用程序运行,使Django完全具有异步功能。Django目前已经更新到5.0,对异步支持也越来越好。但是,异步功能将仅对在ASGI下运行的应用程序可用...

Docker命令最全详解(39个最常用命令)

Docker是云原生的核心,也是大厂的必备技能,下面我就全面来详解Docker核心命令@mikechen本文作者:陈睿|mikechen文章来源:mikechen.cc一、Docker基本命令doc...

ubuntu中如何查看是否已经安装了nginx

在Ubuntu系统中,可以通过以下几种方法检查是否已安装Nginx:方法1:使用dpkg命令(适用于Debian/Ubuntu)bashdpkg-l|grepnginx输出...

OVN 概念与实践(德育概念的泛化在理论和实践中有什么弊端?)

今天我们来讲解OVN的概念和基础实践,要理解本篇博客的内容,需要前置学习:Linux网络设备-Bridge&VethPairLinux网络设备-Bridge详解OVS+Fa...

取消回复欢迎 发表评论: