草庐IT

读Java性能权威指南(第2版)笔记28_线程和同步性能中

躺柒 2023-03-28 原文

1. 同步

1.1. 代码块对一组变量的访问看上去是串行的:每次只有一个线程可以访问内存

  • 1.1.1. 由synchronized关键字保护的代码块

  • 1.1.2. 用java.util.concurrent.lock.Lock类的实例保护的代码

  • 1.1.3. java.util.concurrent包中的代码

  • 1.1.4. java.util.concurrent.atomic包中的代码

    • 1.1.4.1. 原子类不使用同步,至少在CPU编程方面是这样

      1.1.4.1.1. 使用CAS指令的线程在同时访问同一资源时不会阻塞

    • 1.1.4.2. 原子类利用了比较并交换(Compare and Swap,CAS)CPU指令

    • 1.1.4.3. 包中的类使用了基于CAS的原语,而不是传统的同步

1.2. 同步的目的是保护对内存中值(或变量)的访问

1.3. 同步需要独占访问资源

  • 1.3.1. 需要同步锁的线程在另一个线程持有该资源时会阻塞

2. 同步的代价

2.1. 同步和可扩展性

  • 2.1.1. 应用程序在同步块中花费的时间会影响应用程序的可扩展性

  • 2.1.2. 阿姆达尔定律(Amdahl's law)

    • 2.1.2.1. 加速比=1÷((1-P)+P÷N)

    • 2.1.2.2. P是并行运行的程序量

    • 2.1.2.3. N是使用的线程数量

      2.1.2.3.1. 假设每个线程都有可用的CPU

    • 2.1.2.4. 随着P减小,也就是说,随着更多的代码位于串行块中,拥有多个线程的性能收益也会减少

2.2. 获取同步锁需要CPU周期

2.3. 获取同步锁的开销

  • 2.3.1. 如果锁是无竞争的,即两个线程没有在同一时间试图访问锁,那么这个开销是非常小的

    • 2.3.1.1. 非膨胀锁(uninflated lock)

      2.3.1.1.1. 无竞争的synchronized锁

      2.3.1.1.2. 获取一个非膨胀锁的开销在几百纳秒左右

    • 2.3.1.2. 无竞争的CAS结构会有更小的性能损失

  • 2.3.2. 有竞争的结构开销会更大

    • 2.3.2.1. 当第二个线程试图访问一个synchronized锁时,可以预见锁会变成膨胀的inflated

    • 2.3.2.2. 第二个线程必须等待第一个线程释放锁

    • 2.3.2.3. 这个等待时间取决于应用程序

  • 2.3.3. 在使用CAS指令的代码中,竞争操作的开销是不可预知的

    • 2.3.3.1. 在最坏的情况下,两个线程可能会陷入无限循环

      2.3.3.1.1. 因为每个线程修改CAS保护的值之后,发现另一个线程同时进行了修改

2.4. Java特有的,并取决于Java内存模型(Java Memory Model)

  • 2.4.1. 不同于C++和C这样的语言,它对关于同步的内存语义有严格的保证,并且该保证适用于基于CAS的保护、传统的同步,以及volatile关键字

  • 2.4.2. 变量会临时存储在寄存器中,这比直接在主内存中访问它们要高效得多

  • 2.4.3. 寄存器的值对其他线程来说是不可见的

  • 2.4.4. 修改寄存器中值的线程必须在某个时刻将该寄存器刷新到主内存中,这样其他线程才能看到这个值

  • 2.4.5. 什么时候刷新寄存器的值,是由线程同步决定的

  • 2.4.6. 对于标记为volatile的变量,无论什么时候被修改,都会被更新到主内存中

  • 2.4.7. 将大量连续的、细粒度的调用包装在一个同步块中

    • 2.4.7.1. 同步块执行时间很长就不适用

2.5. 同步的内存语义、基于CAS的结构,以及volatile关键字会对性能产生负面影响,特别是在有很多寄存器的大型机器上

3. 避免同步

3.1. 避免同步对象的竞争是减轻其性能影响的有效方法

  • 3.1.1. 在每个线程中使用不同的对象,这样访问对象时就不存在竞争了

3.2. 为了实现线程安全,很多Java对象是同步的,但它们未必需要共享

  • 3.2.1. 通过使用线程局部变量,对象的总数受到了限制(使对GC的影响最小化),而且每个对象都不会有线程竞争

  • 3.2.2. 线程局部变量永远都不会发生竞争,它们非常适合保存实际上不需要在线程间共享的同步对象

3.3. 用基于CAS的替代方案

  • 3.3.1. 在某种意义上,这并不能避免同步,而是以不同的方式解决问题

  • 3.3.2. 在这种情况下,通过减少同步的损失,可以得到与避免同步相同的效果

  • 3.3.3. 对于确实需要共享的对象,基于CAS的工具是一种避免传统同步的方法

3.4. 如果对资源的访问是无竞争的,基于CAS的保护会比传统的同步稍微快一些

3.5. 如果访问始终是无竞争的,完全无保护还会再快一些,并且可以避免边界情况

3.6. 如果对资源的访问存在轻度或者适度的竞争,基于CAS的保护会比传统的同步更快(通常会快得多)

3.7. 随着所访问资源的竞争越来越激烈,传统的同步将在某个时候成为更高效的选择

  • 3.7.1. 在实践中,这种情况只发生在运行了很多线程的大型机器上

3.8. 当只读取值而不写入的时候,基于CAS的保护不会受竞争的影响

3.9. 没有什么可以替代在代码运行的实际生产条件下进行广泛的测试,只有这样,才能确定某一特定方法的哪种实现更好

4. 伪共享

4.1. false sharing

4.2. 缓存行共享(cache line sharing)

4.3. 对于频繁修改volatile变量或退出同步块的代码,伪共享会显著降低性能

4.4. 伪共享造成的最严重的损失,基本上每个写操作都会使所有其他缓存行失效,而且性能是串行的

4.5. 伪共享不一定涉及同步(或volatile)变量,每当CPU缓存中的数据值被写入时,持有相同数据范围的其他缓存必须失效

4.6. Java内存模型要求,只有在同步原语(包括CAS结构和volatile)结束时,数据才必须写入主内存。所以这种情况是最常遇到的

4.7. 标准工具集中,没有任何一个可以解决伪共享,因为这需要与处理器架构相关的专业知识

  • 4.7.1. 某些原生分析器可以提供和给定代码行每条指令的时钟周期数(cycles per instruction,CPI)相关的信息

  • 4.7.2. 在一个循环内,某个简单指令的CPI很高,就表明代码正在等待将目标内存重加载到CPU缓存

4.8. 避免伪共享的主要方法是代码检查

4.9. 防止伪共享需要修改代码

  • 4.9.1. 理想的情况是,所涉及的变量可以不那么频繁地写入

    • 4.9.1.1. 极少的写入次数不太可能引起缓存行的竞争,即使4个线程在循环结束时同时更新结果,也不会对性能产生影响
  • 4.9.2. 对变量进行填充,这样它们就不会被加载到同一缓存行上

    • 4.9.2.1. 也可以使用填充来将冲突的变量移至不同的缓存行

4.10. 避免伪共享最好的方式是将数据移至局部变量,稍后再存储它们

5. @Contended注解

5.1. JDK私有类中的一个特性可以减少设定字段上的缓存竞争

5.2. 通过使用@sun.misc.Contended标记由JVM自动填充的变量来实现的

5.3. 这个注解是私有的

  • 5.3.1. 在Java 8中,它属于sun.misc包,没有什么能阻止你在自己的代码中使用这个包

  • 5.3.2. 在Java 11中,它属于jdk.internal.vm.annotation包,由于Java 11使用了模块系统

    • 5.3.2.1. 如果不用-add-exports标志将该包添加到java.base模块导出的类集中,就无法使用这个包编译类

5.4. -XX:+RestrictContended标志

  • 5.4.1. 默认是true

    • 5.4.1.1. 意味着该注解仅限于JDK的类使用

    • 5.4.1.2. JVM会忽略这个注解

  • 5.4.2. 要让应用程序代码使用该注解,需要加上-XX:-RestrictContended标志

5.5. -XX:-EnableContended

  • 5.5.1. 默认是true

    • 5.5.1.1. -XX:+EnableContended
  • 5.5.2. 禁用JDK的自动填充

    • 5.5.2.1. 这会减小Thread和ConcurrentHashMap类的大小,这两个类都使用这个注解来填充它们的实现,以防止伪共享

有关读Java性能权威指南(第2版)笔记28_线程和同步性能中的更多相关文章

  1. java - 等价于 Java 中的 Ruby Hash - 2

    我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么? 最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设? 关于java-等价于Java中的RubyHash,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/22737685/

  2. ruby - RuntimeError(自动加载常量 Apps 多线程时检测到循环依赖 - 2

    我收到这个错误:RuntimeError(自动加载常量Apps时检测到循环依赖当我使用多线程时。下面是我的代码。为什么会这样?我尝试多线程的原因是因为我正在编写一个HTML抓取应用程序。对Nokogiri::HTML(open())的调用是一个同步阻塞调用,需要1秒才能返回,我有100,000多个页面要访问,所以我试图运行多个线程来解决这个问题。有更好的方法吗?classToolsController0)app.website=array.join(',')putsapp.websiteelseapp.website="NONE"endapp.saveapps=Apps.order("

  3. java - 从 JRuby 调用 Java 类的问题 - 2

    我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java,并成功地将它与另一个Java包一起使用,但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www

  4. java - 我的模型类或其他类中应该有逻辑吗 - 2

    我只想对我一直在思考的这个问题有其他意见,例如我有classuser_controller和classuserclassUserattr_accessor:name,:usernameendclassUserController//dosomethingaboutanythingaboutusersend问题是我的User类中是否应该有逻辑user=User.newuser.do_something(user1)oritshouldbeuser_controller=UserController.newuser_controller.do_something(user1,user2)我

  5. java - 什么相当于 ruby​​ 的 rack 或 python 的 Java wsgi? - 2

    什么是ruby​​的rack或python的Java的wsgi?还有一个路由库。 最佳答案 来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht

  6. Observability:从零开始创建 Java 微服务并监控它 (二) - 2

    这篇文章是继上一篇文章“Observability:从零开始创建Java微服务并监控它(一)”的续篇。在上一篇文章中,我们讲述了如何创建一个Javaweb应用,并使用Filebeat来收集应用所生成的日志。在今天的文章中,我来详述如何收集应用的指标,使用APM来监控应用并监督web服务的在线情况。源码可以在地址 https://github.com/liu-xiao-guo/java_observability 进行下载。摄入指标指标被视为可以随时更改的时间点值。当前请求的数量可以改变任何毫秒。你可能有1000个请求的峰值,然后一切都回到一个请求。这也意味着这些指标可能不准确,你还想提取最小/

  7. 【Java 面试合集】HashMap中为什么引入红黑树,而不是AVL树呢 - 2

    HashMap中为什么引入红黑树,而不是AVL树呢1.概述开始学习这个知识点之前我们需要知道,在JDK1.8以及之前,针对HashMap有什么不同。JDK1.7的时候,HashMap的底层实现是数组+链表JDK1.8的时候,HashMap的底层实现是数组+链表+红黑树我们要思考一个问题,为什么要从链表转为红黑树呢。首先先让我们了解下链表有什么不好???2.链表上述的截图其实就是链表的结构,我们来看下链表的增删改查的时间复杂度增:因为链表不是线性结构,所以每次添加的时候,只需要移动一个节点,所以可以理解为复杂度是N(1)删:算法时间复杂度跟增保持一致查:既然是非线性结构,所以查询某一个节点的时候

  8. LC滤波器设计学习笔记(一)滤波电路入门 - 2

    目录前言滤波电路科普主要分类实际情况单位的概念常用评价参数函数型滤波器简单分析滤波电路构成低通滤波器RC低通滤波器RL低通滤波器高通滤波器RC高通滤波器RL高通滤波器部分摘自《LC滤波器设计与制作》,侵权删。前言最近需要学习放大电路和滤波电路,但是由于只在之前做音乐频谱分析仪的时候简单了解过一点点运放,所以也是相当从零开始学习了。滤波电路科普主要分类滤波器:主要是从不同频率的成分中提取出特定频率的信号。有源滤波器:由RC元件与运算放大器组成的滤波器。可滤除某一次或多次谐波,最普通易于采用的无源滤波器结构是将电感与电容串联,可对主要次谐波(3、5、7)构成低阻抗旁路。无源滤波器:无源滤波器,又称

  9. 【Java入门】使用Java实现文件夹的遍历 - 2

    遍历文件夹我们通常是使用递归进行操作,这种方式比较简单,也比较容易理解。本文为大家介绍另一种不使用递归的方式,由于没有使用递归,只用到了循环和集合,所以效率更高一些!一、使用递归遍历文件夹整体思路1、使用File封装初始目录,2、打印这个目录3、获取这个目录下所有的子文件和子目录的数组。4、遍历这个数组,取出每个File对象4-1、如果File是否是一个文件,打印4-2、否则就是一个目录,递归调用代码实现publicclassSearchFile{publicstaticvoidmain(String[]args){//初始目录Filedir=newFile("d:/Dev");Datebeg

  10. ruby - 如何让Ruby捕获线程中的语法错误 - 2

    我正在尝试使用ruby​​编写一个双线程客户端,一个线程从套接字读取数据并将其打印出来,另一个线程读取本地数据并将其发送到远程服务器。我发现的问题是Ruby似乎无法捕获线程内的错误,这是一个示例:#!/usr/bin/rubyThread.new{loop{$stdout.puts"hi"abc.putsefsleep1}}loop{sleep1}显然,如果我在线程外键入abc.putsef,代码将永远不会运行,因为Ruby将报告“undefinedvariableabc”。但是,如果它在一个线程内,则没有错误报告。我的问题是,如何让Ruby捕获这样的错误?或者至少,报告线程中的错误?

随机推荐