草庐IT

CPU多层caches的allocation方式

谷公子的藏经阁 2023-04-20 原文

根据一个cache的内容是否存在于其它level(层次)的cache中,可以构成多种多层次的cache结构。如果上级cache的所有内容在下级cache里都有,那么则称下级cache包含上级cache(Inclusive策略)。如果下级cache只包含上级cache中不存在的内容,则称下级cache不包含上级cache(exclusive策略)。如果下级cache的内容既不严格包含也不排斥上级cache,则称Pseudo-exclusive策略。

1. Inclusive策略

在Inclusive策略中,也就是L2包含L1的所有内容。假设有一处理器取块 X 的请求。如果在 L1 缓存中找到该块,则从 L1 缓存中读取数据并返回给处理器。如果该块在 L1 缓存中未找到,但存在于 L2 缓存中,则从 L2 缓存中取出缓存块并将其放入 L1。如果这导致块从 L1 中逐出,则 L2 不参与。如果在 L1 或 L2 中均未找到该块,则将其从主存中取出并放入 L1 和 L2 中。现在,如果有从 L2 的逐出,L2 缓存向 L1 缓存发送回无效(back invalidation),这样就不会违反Inclusive策略。如下图所示是Inclusive策略下,cacheline在L1和L2之间搬移的1个例子。

 这种方式的优缺点:

  • 优点:1. 在多core系统中,如果cache状态是S态,core只需检查L2的内容就可以得到数据,不需要再去snoop其它core了。2. L1和L2的cache size可以不一样。
  • 缺点:1. L2的way必须大于等于连在L2之上所有L1的way相加起来的总way。2. L2的set必须要大于等于L1的set。3. L2的eviction可能会导致L1的eviction,这样一定程度上降低L1 cache命中率。

2. Exclusive策略

在Exclusive策略中,也就是L2不包含L1的所有内容。假设有一个处理器读取块 X 的请求。如果在 L1 缓存中找到该块,则从 L1 缓存中读取数据并返回给处理器。如果该块在 L1 缓存中未找到,但存在于 L2 缓存中,则将缓存块从 L2 缓存移动到 L1 缓存,并在L2中移除。如果这导致一个块从 L1 中被逐出,则被逐出的块将被放入 L2。这是填充 L2 的唯一方法。在这里,L2 的行为就像一个备用缓存。如果在 L1 或 L2 中均未找到该块,则将其从主内存中取出并仅放置在 L1 而不是 L2中。如下图所示是Exclusive策略下,cacheline在L1和L2之间搬移的1个例子。

  这种方式的优缺点:

  • 优点:1. 可以存放更多的数据。2. 避免L2太过庞大。
  • 缺点:1. 实现起来比较复杂。2. 如果在其它core里存在数据,当前core想要获得的话,必须要通过snoop方式获得。

3. Pseudo-exclusive

在Pseudo-exclusive策略中,L1和L2的内容没有严格的Inclusive或Exclusive的关系。

假设有一个处理器读取块 X 的请求。如果在 L1 缓存中找到该块,则从 L1 缓存中读取数据并返回给处理器。如果该块在 L1 缓存中未找到,但存在于 L2 缓存中,则从 L2 缓存中取出缓存块并将其放入 L1。如果这导致块从 L1 中被逐出,则 L2 不参与,这与包容性策略的情况相同。如果在 L1 和 L2 中都找不到该块,则将其从主存中取出并放入 L1 和 L2 中。现在,如果有从 L2 的逐出,与包容性策略不同,没有反向失效(back invalidation)。如下图所示是Pseudo-exclusive策略下,cacheline在L1和L2之间搬移的1个例子。

 这种方式是以上两种策略的折中,在Arm CPU中,比较常用这种方式。

注:本文的图片来自wiki。

有关CPU多层caches的allocation方式的更多相关文章

  1. ruby - 如何以所有可能的方式将字符串拆分为长度最多为 3 的连续子字符串? - 2

    我试图获取一个长度在1到10之间的字符串,并输出将字符串分解为大小为1、2或3的连续子字符串的所有可能方式。例如:输入:123456将整数分割成单个字符,然后继续查找组合。该代码将返回以下所有数组。[1,2,3,4,5,6][12,3,4,5,6][1,23,4,5,6][1,2,34,5,6][1,2,3,45,6][1,2,3,4,56][12,34,5,6][12,3,45,6][12,3,4,56][1,23,45,6][1,2,34,56][1,23,4,56][12,34,56][123,4,5,6][1,234,5,6][1,2,345,6][1,2,3,456][123

  2. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  3. ruby-on-rails - 正确的 Rails 2.1 做事方式 - 2

    question的一些答案关于redirect_to让我想到了其他一些问题。基本上,我正在使用Rails2.1编写博客应用程序。我一直在尝试自己完成大部分工作(因为我对Rails有所了解),但在需要时会引用Internet上的教程和引用资料。我设法让一个简单的博客正常运行,然后我尝试添加评论。靠我自己,我设法让它进入了可以从script/console添加评论的阶段,但我无法让表单正常工作。我遵循的其中一个教程建议在帖子Controller中创建一个“评论”操作,以添加评论。我的问题是:这是“标准”方式吗?我的另一个问题的答案之一似乎暗示应该有一个CommentsController参

  4. ruby - Sinatra set cache_control to static files in public folder编译错误 - 2

    我不知道为什么,但是当我设置这个设置时它无法编译设置:static_cache_control,[:public,:max_age=>300]这是我得到的syntaxerror,unexpectedtASSOC,expecting']'(SyntaxError)set:static_cache_control,[:public,:max_age=>300]^我只想将“过期”header设置为css、javaascript和图像文件。谢谢。 最佳答案 我猜您使用的是Ruby1.8.7。Sinatra文档中显示的语法似乎是在Ruby1.

  5. 【鸿蒙应用开发系列】- 获取系统设备信息以及版本API兼容调用方式 - 2

    在应用开发中,有时候我们需要获取系统的设备信息,用于数据上报和行为分析。那在鸿蒙系统中,我们应该怎么去获取设备的系统信息呢,比如说获取手机的系统版本号、手机的制造商、手机型号等数据。1、获取方式这里分为两种情况,一种是设备信息的获取,一种是系统信息的获取。1.1、获取设备信息获取设备信息,鸿蒙的SDK包为我们提供了DeviceInfo类,通过该类的一些静态方法,可以获取设备信息,DeviceInfo类的包路径为:ohos.system.DeviceInfo.具体的方法如下:ModifierandTypeMethodDescriptionstatic StringgetAbiList​()Obt

  6. ruby - 鸭子输入字符串、符号和数组的优雅方式? - 2

    这是针对我无法破坏的现有公共(public)API,但我确实希望对其进行扩展。目前,该方法采用字符串或符号或任何其他在作为第一个参数传递给send时有意义的内容我想添加发送字符串、符号等列表的功能。我可以只使用is_a吗?数组,但还有其他发送列表的方法,这不是很像ruby​​。我将调用列表中的map,所以第一个倾向是使用respond_to?:map。但是字符串也会响应:map,所以这行不通。 最佳答案 如何将它们全部视为数组?String的行为与仅包含String的Array相同:deffoo(obj,arg)[*arg].eac

  7. ruby - 如何以编程方式删除实例上的 "singleton information"以使其编码(marshal)? - 2

    我创建了一个由于“在运行时执行的单例元类定义”而无法编码的对象(这段代码的描述是否正确?)。这是通过以下代码执行的:#defineclassXthatmyusesingletonclassmetaprogrammingfeatures#throughcallofmethod:break_marshalling!classXdefbreak_marshalling!meta_class=class我该怎么做才能使对象编码正确?是否可以从对象instance_of_x的classX中“移除”单例组件?我真的需要一个建议,因为我们的一些对象需要通过Marshal.dump序列化机制进行缓存。

  8. ruby - Paperclip:以编程方式分配图像并设置其名称 - 2

    使用Paperclip,我想从这样的URL抓取图像:require'open-uri'user.photo=open(url)问题是我最后得到一个像“open-uri20110915-4852-1o7k5uw”这样的文件名。有什么方法可以更改user.photo上的文件名?作为一个额外的变化,Paperclip将我的文件存储在S3上,所以如果我可以在初始分配中设置我想要的文件名就更好了,这样图像就会上传到正确的S3key。像这样:user.photo=open(url),:filename=>URI.parse(url).path 最佳答案

  9. ruby - 如何以编程方式检查证书是否已被吊销? - 2

    我正在开发一个xcode自动构建系统。在执行一些预构建验证时,我想检查指定的证书文件是否已被撤销。我了解securityverify-cert验证其他证书属性但不验证吊销。我如何检查撤销?我正在用Ruby编写构建系统,但我对任何语言的想法都持开放态度。我阅读了这个答案(Openssl-Howtocheckifacertificateisrevokedornot),但指向底部的链接(DoesOpenSSLautomaticallyhandleCRLs(CertificateRevocationLists)now?)进入的Material对我的目的来说有点过于复杂(用户上传已撤销的证书是一

  10. ruby-on-rails - 以 DRY 方式覆盖 ActiveRecord 中的 "find" - 2

    我有一些模型需要在它们上面放置自定义查找条件。例如,如果我有一个联系人模型,每次调用Contact.find时,我都想限制返回的联系人只属于正在使用的帐户。我通过Google找到了这个(我对其进行了一些自定义):defself.find(*args)with_scope(:find=>{:conditions=>"account_id=#{$account.id}"})dosuper(*args)endend这很好用,除了少数情况下account_id不明确,所以我将其调整为:defself.find(*args)with_scope(:find=>{:conditions=>"#{s

随机推荐