为什么要使用线程池?什么是线程池?字面意思(他是一种基于池化思想管理和使用线程的机制,他将多个线程预先存储在一个池子中)
池化思想应用:
内存池:预先申请内存,提升申请内存速度,减少内存碎片.
连接池:预先申请数据库连接,提升连接速度,降低系统开销。
实例池:循环使用对象,减少资源在初始化和释放。比如字符串常量池
线程池的优势
1.降低系统资源消耗,通过重用已存在的线程,降低线程的创建和销毁造成的消耗
2.提高系统响应速度,当有任务到达时,无需等待线程的创建就能立即执行
3.方便线程并发数的管控,线程若是无限制创建,不仅会额外大量系统资源,还会引起阻塞。
4.线程池还提供了定时、定期以及可控线程数等功能的线程池,使用方便
线程池的创建主要分为两类:
1、Executors框架:但是阿里开发手册上不建议使用这种方式,而是通过 ThreadPoolExecutor 的方式,这样的处理方式让写的同学更加明确线程池的运行规则,规避资源耗尽的风险。
-
Executors.newFixedThreadPool:创建一个固定大小的线程池,可控制并发的线程数,超出的线程会在队列中等待;
-
Executors.newCachedThreadPool:创建一个可缓存的线程池,若线程数超过处理所需,缓存一段时间后会回收,若线程数不够,则新建线程;
-
Executors.newSingleThreadExecutor:创建单个线程数的线程池,它可以保证先进先出的执行顺序;
-
Executors.newScheduledThreadPool:创建一个可以执行延迟任务的线程池;
-
Executors.newSingleThreadScheduledExecutor:创建一个单线程的可以执行延迟任务的线程池;
-
Executors.newWorkStealingPool:创建一个抢占式执行的线程池(任务执行顺序不确定)【JDK 1.8 添加】。
-
ThreadPoolExecutor:最原始的创建线程池的方式,它包含了 7 个参数可供设置,后面会详细讲。
Executor返回线程池对象弊端如下:
-
FixedThreadPool和SingleThreadExecutor:允许请求队列长度为Integer.MAX_VALUE,可能堆积大量请求,从而导致OOM
-
CachedThreadPool和ScheduleThreadPool: 允许创建的线程数量为Integer.MAX_VALUE,可能会创建大量线程导致oom。
2、ThreadPoolExecutor构造方法:
ThreadPoolExcutor类提供的四个构造方法,我们来看最长的那个,其余三个都是在这个基础上产生的(其他几个构造方法说白点都是给定某些默认参数的构造方法比如默认制定拒绝策略是什么),这里就不贴代码讲了,比较简单。
/**
* 用给定的初始参数创建一个新的ThreadPoolExecutor。
*/
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler) {
if (corePoolSize < 0 ||
maximumPoolSize <= 0 ||
maximumPoolSize < corePoolSize ||
keepAliveTime < 0)
throw new IllegalArgumentException();
if (workQueue == null || threadFactory == null || handler == null)
throw new NullPointerException();
this.corePoolSize = corePoolSize;
this.maximumPoolSize = maximumPoolSize;
this.workQueue = workQueue;
this.keepAliveTime = unit.toNanos(keepAliveTime);
this.threadFactory = threadFactory;
this.handler = handler;
}
下面进行参数分析:
-
corePoolSize:核心线程数定义最小可以同时运行的线程数量(corePoolSize)。
-
maximumPoolSize:当队列中存放的任务达到队列容量的时候,当前可以同时运行的线程数量变为最大线程数(maximumPoolSize)
-
workQueue:当新任务来的时候会先判断当前运行的线程数量是否达到核心线程数,如果达到的话,新任务队列就会被存放在队列(workQueue)中。
-
keepAliveTime:当线程数中的线程数量大于corePoolSize的时候,如果这时没有新的任务提交,核心线程外的线程不会立即销毁,而是会等待,直到等待时间超过了keepAliveTime才会被回收销毁
-
unit:keepAliveTime的时间单位
-
threadFactory:创建线程的时候会用到
-
handler:饱和策略。
下面对饱和策略进行解释
如果当同时运行的线程数量达到最大线程数量并且队列已经被放满任务时。ThreadPoolTaskExcutor定义了一些策略
-
ThreadPoolExcutor.AbortPolicy:抛出RejectedExecutionException来拒绝新任务的处理
-
ThreadPoolExcutor.CallerRunPolicy:调用执行自己的线程运行任务,也就是直接在调用excute到方法的线程中运行(run)被拒绝的任务,如果执行程序关闭,则会丢弃该任务。因为这种策略会降低对于新任务提交速度,影响程序的整体性能。
//这里进行我的理解以下,因为他这里是run不是start方法,所以就是相当于运行这个任务,没有把他加入线程去执行
public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
if (!e.isShutdown()) {
r.run();
} -
ThreadPoolExecutor.DiscardPolicy:不处理新任务,直接丢弃掉。
-
ThreadPoolExecutor.DiscardOldestPolicy:此策略将丢弃最早的未处理的任务请求。
执行 execute()方法和 submit()方法的区别是什么呢?
execute()方法用于提交不需要返回值的任务,所以无法判断任务是否被线程池执行成功与否
submit()方法用于提交需要返回值的任务。线程池会返回一个Future类型对象,通过这个对象可以判断任务死否执行成功,通过Future的get()方法来获取返回值。get方法会阻塞当前线程直到任务完成,而使用get(long timeout,TimeUnit unit)
方法则会阻塞当前线程一段时间后立即返回,这时候有可能任务没有执行完。
public Future<?> submit(Runnable task) {
if (task == null) throw new NullPointerException();
RunnableFuture<Void> ftask = newTaskFor(task, null);
execute(ftask);
return ftask;
}
protected <T> RunnableFuture<T> newTaskFor(Runnable runnable, T value) {
return new FutureTask<T>(runnable, value);
}
execute
-
首先判断任务是不是为空,为空抛异常
-
查看当前线程中的数量是否小于核心线程数,小于就可以直接通过addWorker(任务,true)新建一个线程,并将任务添加达到该线程中,然后启动该线程。
-
但是如果大于等于核心线程数,判断isRunning方法判断线程池状态,线程池处于runing状态并且可以加入队列,就会将该任务加入队列中。
-
再次获取线程池状态,如果线程池状态不是 RUNNING 状态就需要从任务队列中移除任务,并尝试判断线程是否全部执行完毕。同时执行拒绝策略。
-
如果当前线程池为空就新创建一个线程并执行。
-
通过addWorker(command, false)新建一个线程,并将任务(command)添加到该线程中;然后,启动该线程从而执行任务。 如果addWorker(command, false)执行失败,则通过reject()执行相应的拒绝策略的内容。
-
线程池关闭shutdown和shutdownnow
-
shutdown:关闭线程池,线程池状态为shutdown。线程池不在接受任务了,但队列里面的任务得执行完毕
-
shutdownNow:关闭线程池,线程的状态变为stop,线程池会终止当前正在运行的任务,并停止处理排队的任务,并返回正在等待执行的list。
线程池大小确定
有一个简单并且适用面比较广的公式:
-
CPU 密集型任务(N+1): 这种任务消耗的主要是 CPU 资源,可以将线程数设置为 N(CPU 核心数)+1,比 CPU 核心数多出来的一个线程是为了防止线程偶发的缺页中断,或者其它原因导致的任务暂停而带来的影响。一旦任务暂停,CPU 就会处于空闲状态,而在这种情况下多出来的一个线程就可以充分利用 CPU 的空闲时间。
-
I/O 密集型任务(2N): 这种任务应用起来,系统会用大部分的时间来处理 I/O 交互,而线程在处理 I/O 的时间段内不会占用 CPU 来处理,这时就可以将 CPU 交出给其它线程使用。因此在 I/O 密集型任务的应用中,我们可以多配置一些线程,具体的计算方法是 2N。
如何判断是 CPU 密集任务还是 IO 密集任务?
CPU 密集型简单理解就是利用 CPU 计算能力的任务比如你在内存中对大量数据进行排序。但凡涉及到网络读取,文件读取这类都是 IO 密集型,这类任务的特点是 CPU 计算耗费时间相比于等待 IO 操作完成的时间来说很少,大部分时间都花在了等待 IO 操作完成上
来源:https://www.cnblogs.com/thh19201420/p/16420719.html
本站部分图文来源于网络,如有侵权请联系删除。