百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

线程池误用导致系统假死(线程池中的线程发生异常还会恢复吗)

nanshan 2025-04-06 19:29 20 浏览 0 评论

背景介绍

在项目中,为了提高系统性能使用了RxJava实现异步方案,其中异步线程池是自建的。但是当QPS稍微增大之后却发现系统假死、无响应和返回,调用方出现大量超时现象。但是通过监控发现,系统线程数正常,内存使用也没有问题,也没有死锁。

在当时没有定位到问题,通过增加一台机器解决了问题。后面也出现同样问题,定位发现是线程池的问题,因为时间紧迫没有深究直接使用了RxJava的Schedulers.io()线程替代自带线程池。最近通过重新学习,发现了问题的原因。

场景模拟

自建线程池

public class ThreadSchedulerUtils {
 private final static ThreadFactory ioFactory = new ThreadFactoryBuilder().setNameFormat("io-pool-%d").build();
 private final static ExecutorService ioTreadPool = new CatExecutorServiceTraceWrapper(new ThreadPoolExecutor(2, 4, 100L, TimeUnit.MICROSECONDS, new LinkedBlockingDeque(4), ioFactory, new ThreadPoolExecutor.AbortPolicy()));

 public static Scheduler getIO() {
 return Schedulers.from(ioTreadPool);
 }
}

模拟调用代码

 @Test
 public void test12() {
 Long aLong = Flowable.fromIterable(IntStream.range(1, 15).mapToObj(i -> i).collect(Collectors.toList())).parallel(8).runOn(ThreadSchedulerUtils.getIO()).map(i -> {
 System.out.println("当前值:" + i + ",线程名称" + Thread.currentThread().getName());
 Thread.sleep(1000L);
 return i;
 }).sequential().count().blockingGet();
 }

运行结果

当前值:1,线程名称io-pool-0
当前值:2,线程名称io-pool-1
当前值:7,线程名称io-pool-2
当前值:8,线程名称io-pool-3
当前值:9,线程名称io-pool-0
当前值:10,线程名称io-pool-1
当前值:3,线程名称io-pool-2
当前值:4,线程名称io-pool-3
当前值:11,线程名称io-pool-2
当前值:6,线程名称io-pool-0
当前值:5,线程名称io-pool-1
当前值:12,线程名称io-pool-3
当前值:14,线程名称io-pool-0
当前值:13,线程名称io-pool-1

结果分析

代码期望的结果是把1到14这15个数据(Flowable.fromIterable(IntStream.range(1, 15).mapToObj(i -> i).collect(Collectors.toList())))并发在4个线程(parallel(8)表示最多有8个线程)上去执行。但是发现真实结果并不是有序的,而是先在0和1线程上执行了1、2,接着在2和3线程上执行了7、8。这种不符合预期的情况是为什么呢?

因为在创建线程池的时候使用的LinkedBlockingDeque。LinkedBlockingDeque队列的执行顺序是这样:

1.如果线程数<=核心线程数,则分配到核心线程数;

2.如果线程数<=核心线程数+队列大小,则不新建线程,在原有线程上轮询执行;

3.如果核心线程数+队列大小<线程数<=核心线程数+队列大小+最大线程数,则会创建新的线程来执行;

4.如果线程数>核心线程数+队列大小+最大线程数,则报错。

通过运行结果来分析可以验证:1,2这两个值在核心线程1,2上执行。然后3-6缓存起来之后队列已满,7和8在新线程2和3上执行。

但是前面说线程数超出之后会报错,为什么测试代码没有报错呢?因为RxJava的Flowable提供背压模式,可以根据下游的处理速度决定发生速度,所以并没有发生报错。

即先缓存满了之后再新建线程,但是在创建线程池的时候理解是创建最大线程数之后还不够再缓存。

原因总结

通过场景复现可以发现,是对线程池的不正确使用,导致可用线程数只为核心线程数,造成大量请求在队列和Flowable里面积压。表现的样子为:系统假死,无法正常处理请求,但是系统的各项指标却是正常的。

改进方案

分为两步方案来解决,第一次采用RxJava自带的线程方法:Schedulers.io();第二种是自己创建缓存线程池。

RxJava自带

RxJava自带的Schedulers.io()线程本质上是一个无边界线程池。可以参考RxJava 内部如何管理线程。但是这种方式有个缺点,没有经过自己的业务封装,不利于业务追踪。例如在监控系统上追踪请求情况。

自己的线程池

为了方便在cat线监控线程执行信息,实现一个和RxJava自带一直的无边界线程池。这种可以根据自己的需求,进行线程池封装。

public class ThreadSchedulerUtils {
 private final static ThreadFactory ioFactory = new ThreadFactoryBuilder().setNameFormat("io-pool-%d").build();
 private final static ExecutorService ioTreadPool = new ThreadPoolExecutor(8, Integer.MAX_VALUE, 60L, TimeUnit.SECONDS, new SynchronousQueue(), ioFactory, new ThreadPoolExecutor.AbortPolicy());

 public static Scheduler getIO() {
 return Schedulers.from(ioTreadPool);
 }
}

小编是一个有着5年工作经验的程序员,关于Java,自己有做材料的整合,一个完整学习Java的路线,学习材料和工具。需要的伙伴可以私信我,发送“Java”后就可免费获取。对于学习Java有任何问题(学习方法,学习效率,如何就业)都可以问我。希望你也能凭自己的努力,成为下一个优秀的程序员!

作者:cleaner_wei

来源:简书


相关推荐

0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM)

文档编写目的在前面的文档中,介绍了在有CM和无CM两种情况下使用rpm方式安装CDH5.10.0,本文档将介绍如何在无CM的情况下使用rpm方式安装CDH6.2.0,与之前安装C5进行对比。环境介绍:...

ARM64 平台基于 openEuler + iSula 环境部署 Kubernetes

为什么要在arm64平台上部署Kubernetes,而且还是鲲鹏920的架构。说来话长。。。此处省略5000字。介绍下系统信息;o架构:鲲鹏920(Kunpeng920)oOS:ope...

生产环境starrocks 3.1存算一体集群部署

集群规划FE:节点主要负责元数据管理、客户端连接管理、查询计划和查询调度。>3节点。BE:节点负责数据存储和SQL执行。>3节点。CN:无存储功能能的BE。环境准备CPU检查JDK...

在CentOS上添加swap虚拟内存并设置优先级

现如今很多云服务器都会自己配置好虚拟内存,当然也有很多没有配置虚拟内存的,虚拟内存可以让我们的低配服务器使用更多的内存,可以减少很多硬件成本,比如我们运行很多服务的时候,内存常常会满,当配置了虚拟内存...

国产深度(deepin)操作系统优化指南

1.升级内核随着deepin版本的更新,会自动升级系统内核,但是我们依旧可以通过命令行手动升级内核,以获取更好的性能和更多的硬件支持。具体操作:-添加PPAs使用以下命令添加PPAs:```...

postgresql-15.4 多节点主从(读写分离)

1、下载软件[root@TX-CN-PostgreSQL01-252software]#wgethttps://ftp.postgresql.org/pub/source/v15.4/postg...

Docker 容器 Java 服务内存与 GC 优化实施方案

一、设置Docker容器内存限制(生产环境建议)1.查看宿主机可用内存bashfree-h#示例输出(假设宿主机剩余16GB可用内存)#Mem:64G...

虚拟内存设置、解决linux内存不够问题

虚拟内存设置(解决linux内存不够情况)背景介绍  Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存...

Elasticsearch性能调优(5):服务器配置选择

在选择elasticsearch服务器时,要尽可能地选择与当前业务量相匹配的服务器。如果服务器配置太低,则意味着需要更多的节点来满足需求,一个集群的节点太多时会增加集群管理的成本。如果服务器配置太高,...

Es如何落地

一、配置准备节点类型CPU内存硬盘网络机器数操作系统data节点16C64G2000G本地SSD所有es同一可用区3(ecs)Centos7master节点2C8G200G云SSD所有es同一可用区...

针对Linux内存管理知识学习总结

现在的服务器大部分都是运行在Linux上面的,所以,作为一个程序员有必要简单地了解一下系统是如何运行的。对于内存部分需要知道:地址映射内存管理的方式缺页异常先来看一些基本的知识,在进程看来,内存分为内...

MySQL进阶之性能优化

概述MySQL的性能优化,包括了服务器硬件优化、操作系统的优化、MySQL数据库配置优化、数据库表设计的优化、SQL语句优化等5个方面的优化。在进行优化之前,需要先掌握性能分析的思路和方法,找出问题,...

Linux Cgroups(Control Groups)原理

LinuxCgroups(ControlGroups)是内核提供的资源分配、限制和监控机制,通过层级化进程分组实现资源的精细化控制。以下从核心原理、操作示例和版本演进三方面详细分析:一、核心原理与...

linux 常用性能优化参数及理解

1.优化内核相关参数配置文件/etc/sysctl.conf配置方法直接将参数添加进文件每条一行.sysctl-a可以查看默认配置sysctl-p执行并检测是否有错误例如设置错了参数:[roo...

如何在 Linux 中使用 Sysctl 命令?

sysctl是一个用于配置和查询Linux内核参数的命令行工具。它通过与/proc/sys虚拟文件系统交互,允许用户在运行时动态修改内核参数。这些参数控制着系统的各种行为,包括网络设置、文件...

取消回复欢迎 发表评论: