草庐IT

读Java性能权威指南(第2版)笔记27_线程和同步性能上

躺柒 2023-03-28 原文

1. 线程和硬件

1.1. 给CPU增加超线程并不能使应用程序性能翻倍

2. 线程池

2.1. 任务被提交到一个队列(可能有不止一个队列),然后一定数量的线程会从队列中取出任务并执行它们

2.2. 线程池的大小对获取最佳性能至关重要

  • 2.2.1. 在某些情况下,过大的线程池会对性能造成损害

2.3. 线程池有最小线程数和最大线程数

  • 2.3.1. 以最小数量的线程等待分配给它们的任务

  • 2.3.2. 最大线程数可以起到必要的限流作用,防止线程同时执行过多的任务

2.4. CPU不是瓶颈,外部资源是,此时向线程池添加线程是有害的

  • 2.4.1. 适用于向CPU密集型或I/O密集型的数据库发送请求的REST服务器

  • 2.4.2. 增加线程数实际上会降低总体吞吐量

2.5. 如果给瓶颈处增加负载,性能将大幅下降

2.6. 如果当前瓶颈的负载减少了,性能很可能会提升

2.7. 设置线程池的最大线程数往往是艺术性多于科学性

  • 2.7.1. 高估线程池中需要的线程数可能也只造成了很小的性能损失

  • 2.7.2. 一旦线程池的设置出现问题,应用程序就会出大问题

2.8. 设置最小线程数

  • 2.8.1. 几乎在所有的情况下,都可以将最小线程数设置成和最大线程数一样的值

  • 2.8.2. 设置为另一个值(例如设置成1)的理由是,它可以防止系统创建过多的线程,从而节省资源

  • 2.8.3. 最好是创建最终可能需要的所有线程,同时要确保系统能够处理预期的最大负载

  • 2.8.4. 假设一个线程池的任务队列预计平均有20个任务,那么对它来说20就是合适的最小线程数

2.9. 在批处理应用程序中,无论是在创建线程池时分配线程(将最小线程数和最大线程数设置为相同的值,就会出现这种情况),还是按需分配线程,都不重要,因为执行应用程序所需的时间是一样的

2.10. 线程的空闲时间

3. ThreadPoolExecutor

3.1. 设置ThreadPoolExecutor的大小

3.2. 队列类型

  • 3.2.1. 并发队列

    • 3.2.1.1. 适用于管理少量任务,其他情况不适用

    • 3.2.1.2. 你需要一个易于优化线程数的线程池,那么这个队列类型是更好的选择

    • 3.2.1.3. 如果所有线程都在忙碌,而且池中的线程数小于最大线程数,那么新任务会启动一个新线程

    • 3.2.1.4. 这个队列类型无法保留待处理的任务

    • 3.2.1.5. 核心池大小是最小池大小,也就是空闲时也会保持运行的线程数

    • 3.2.1.6. 最大池大小是池中的最大线程数

  • 3.2.2. 无界队列

    • 3.2.2.1. 任何任务都不会被拒绝(因为队列大小不受限制)

    • 3.2.2.2. 执行器使用的线程数最多等于核心池大小,即最大池大小会被忽略

    • 3.2.2.3. 由于队列是无界的,因此如果任务的提交速度超过了运行速度,那么会有内存消耗过多的风险

  • 3.2.3. 有界队列

    • 3.2.3.1. 采用了复杂的算法来决定何时启动新线程

    • 3.2.3.2. 使得线程池可以作为一个限流器

    • 3.2.3.3. 如果任务积压得太多,线程池就会运行更多的线程来清理积压的任务

      3.2.3.3.1. 此时最大线程数可以作为第二个限流器

3.3. 不要使用Executors类来提供默认无界的线程池,这样你无法控制应用程序的内存使用情况

3.4. 应该设置ThreadPoolExecutor,让其有相同的核心线程数和最大线程数,并利用ArrayBlockingQueue来限制内存中待处理任务的数量

3.5. 父任务必须等待其子任务完成,而线程池执行器中的线程不能向队列中添加另一个任务并等待任务完成,一旦其线程处于等待状态,它就不能用来执行任何子任务了

3.6. 当任务很容易被分割成均衡的集合时,使用分区的ThreadPoolExecutor会有更好的性能

4. ForkJoinPool

4.1. 当任务不均衡时,使用ForkJoinPool会有更好的性能

4.2. 允许它的线程创建新的任务,然后挂起当前任务。当任务被挂起时,其线程可以执行其他待处理任务

4.3. 为配合分治算法设计的

  • 4.3.1. 要确保拆分任务是有意义的

  • 4.3.2. 应该用于递归、分治算法,它不适用于可以简单分割处理的情况

4.4. 内部会使用一个无界任务列表,运行这些任务的线程数由其构造方法指定

4.5. 如果没有向构造方法传递参数,那么线程池会基于机器上的(或Docker容器的)可用CPU数量来确定线程数

4.6. 实现了工作窃取

  • 4.6.1. 意味着池中的每个线程都有一个自己所派生任务的队列。线程会优先处理自己队列中的任务,如果自己的队列是空的,那么它们会从其他线程的队列中窃取任务

  • 4.6.2. ForkJoinPool中的其他线程也可以完成剩余的所有任务

    • 4.6.2.1. ThreadPoolExecutor就不是这样的了

4.7. 确定公共的ForkJoinTask池的大小,和确定任何其他线程池的大小一样重要

  • 4.7.1. 默认情况下,公共池的线程数和目标机器的CPU数一样

  • 4.7.2. 如果你在一台机器上运行多个JVM,限制公共池的大小是有意义的,这样JVM之间就不会相互争夺CPU

4.8. -Djava.util.concurrent.ForkJoinPool.common.parallelism=N来设置公共池的大小

4.9. 如果你需要优化公共池的大小,可以考虑将所需的值减1

4.10. 创建太多任务会降低性能,但如果任务所需的时间不一样,太少的任务也会降低性能

有关读Java性能权威指南(第2版)笔记27_线程和同步性能上的更多相关文章

  1. java - 等价于 Java 中的 Ruby Hash - 2

    我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么? 最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设? 关于java-等价于Java中的RubyHash,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/22737685/

  2. ruby - RuntimeError(自动加载常量 Apps 多线程时检测到循环依赖 - 2

    我收到这个错误:RuntimeError(自动加载常量Apps时检测到循环依赖当我使用多线程时。下面是我的代码。为什么会这样?我尝试多线程的原因是因为我正在编写一个HTML抓取应用程序。对Nokogiri::HTML(open())的调用是一个同步阻塞调用,需要1秒才能返回,我有100,000多个页面要访问,所以我试图运行多个线程来解决这个问题。有更好的方法吗?classToolsController0)app.website=array.join(',')putsapp.websiteelseapp.website="NONE"endapp.saveapps=Apps.order("

  3. java - 从 JRuby 调用 Java 类的问题 - 2

    我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java,并成功地将它与另一个Java包一起使用,但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www

  4. java - 我的模型类或其他类中应该有逻辑吗 - 2

    我只想对我一直在思考的这个问题有其他意见,例如我有classuser_controller和classuserclassUserattr_accessor:name,:usernameendclassUserController//dosomethingaboutanythingaboutusersend问题是我的User类中是否应该有逻辑user=User.newuser.do_something(user1)oritshouldbeuser_controller=UserController.newuser_controller.do_something(user1,user2)我

  5. java - 什么相当于 ruby​​ 的 rack 或 python 的 Java wsgi? - 2

    什么是ruby​​的rack或python的Java的wsgi?还有一个路由库。 最佳答案 来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht

  6. Observability:从零开始创建 Java 微服务并监控它 (二) - 2

    这篇文章是继上一篇文章“Observability:从零开始创建Java微服务并监控它(一)”的续篇。在上一篇文章中,我们讲述了如何创建一个Javaweb应用,并使用Filebeat来收集应用所生成的日志。在今天的文章中,我来详述如何收集应用的指标,使用APM来监控应用并监督web服务的在线情况。源码可以在地址 https://github.com/liu-xiao-guo/java_observability 进行下载。摄入指标指标被视为可以随时更改的时间点值。当前请求的数量可以改变任何毫秒。你可能有1000个请求的峰值,然后一切都回到一个请求。这也意味着这些指标可能不准确,你还想提取最小/

  7. 【Java 面试合集】HashMap中为什么引入红黑树,而不是AVL树呢 - 2

    HashMap中为什么引入红黑树,而不是AVL树呢1.概述开始学习这个知识点之前我们需要知道,在JDK1.8以及之前,针对HashMap有什么不同。JDK1.7的时候,HashMap的底层实现是数组+链表JDK1.8的时候,HashMap的底层实现是数组+链表+红黑树我们要思考一个问题,为什么要从链表转为红黑树呢。首先先让我们了解下链表有什么不好???2.链表上述的截图其实就是链表的结构,我们来看下链表的增删改查的时间复杂度增:因为链表不是线性结构,所以每次添加的时候,只需要移动一个节点,所以可以理解为复杂度是N(1)删:算法时间复杂度跟增保持一致查:既然是非线性结构,所以查询某一个节点的时候

  8. LC滤波器设计学习笔记(一)滤波电路入门 - 2

    目录前言滤波电路科普主要分类实际情况单位的概念常用评价参数函数型滤波器简单分析滤波电路构成低通滤波器RC低通滤波器RL低通滤波器高通滤波器RC高通滤波器RL高通滤波器部分摘自《LC滤波器设计与制作》,侵权删。前言最近需要学习放大电路和滤波电路,但是由于只在之前做音乐频谱分析仪的时候简单了解过一点点运放,所以也是相当从零开始学习了。滤波电路科普主要分类滤波器:主要是从不同频率的成分中提取出特定频率的信号。有源滤波器:由RC元件与运算放大器组成的滤波器。可滤除某一次或多次谐波,最普通易于采用的无源滤波器结构是将电感与电容串联,可对主要次谐波(3、5、7)构成低阻抗旁路。无源滤波器:无源滤波器,又称

  9. 【Java入门】使用Java实现文件夹的遍历 - 2

    遍历文件夹我们通常是使用递归进行操作,这种方式比较简单,也比较容易理解。本文为大家介绍另一种不使用递归的方式,由于没有使用递归,只用到了循环和集合,所以效率更高一些!一、使用递归遍历文件夹整体思路1、使用File封装初始目录,2、打印这个目录3、获取这个目录下所有的子文件和子目录的数组。4、遍历这个数组,取出每个File对象4-1、如果File是否是一个文件,打印4-2、否则就是一个目录,递归调用代码实现publicclassSearchFile{publicstaticvoidmain(String[]args){//初始目录Filedir=newFile("d:/Dev");Datebeg

  10. ruby - 如何让Ruby捕获线程中的语法错误 - 2

    我正在尝试使用ruby​​编写一个双线程客户端,一个线程从套接字读取数据并将其打印出来,另一个线程读取本地数据并将其发送到远程服务器。我发现的问题是Ruby似乎无法捕获线程内的错误,这是一个示例:#!/usr/bin/rubyThread.new{loop{$stdout.puts"hi"abc.putsefsleep1}}loop{sleep1}显然,如果我在线程外键入abc.putsef,代码将永远不会运行,因为Ruby将报告“undefinedvariableabc”。但是,如果它在一个线程内,则没有错误报告。我的问题是,如何让Ruby捕获这样的错误?或者至少,报告线程中的错误?

随机推荐