我正在尝试分析我在一台稍大的机器(32 核,256GB RAM)上编写的多线程程序。我注意到在两次运行之间,程序的性能可能会有很大差异 (70-80%)。我似乎无法找到程序性能中这种巨大差异的原因,但通过分析大量运行的“时间”实用程序的结果,我注意到非自愿上下文切换的数量与程序性能(显然,上下文切换越少,性能越好,反之亦然)。
有什么好的方法可以确定是什么导致了这种上下文切换?如果我能找到罪魁祸首,那么也许我可以尝试解决问题。但是,我对可以使用的工具有一些特别的限制。首先,我在这台机器上没有 root 权限,所以任何需要这种权限的工具都被淘汰了。其次,它是一个相当老的内核(RHEL5,内核 2.6.18),所以一些标准的 perf-event 东西可能不存在。无论如何,我们将不胜感激任何关于如何更深入地研究这种上下文切换原因的建议。
更新:我决定在另一台(更小的)机器上测试我的程序。另一台机器是一个 4 核(带有 hypertheading)的 linux 机器,具有 8Gb 的 RAM,以及一个更新得多的内核 --- 3.2.0 与另一台机器上的 2.6.18。在新机器上,我无法重现双峰性能配置文件。这让我相信这个问题要么是由于硬件问题(如评论中所建议的那样),要么是内核级别的一个特别病态的案例,此后已得到修复。我目前最好的假设是,这可能是因为新机器的内核具有完全公平调度程序 (CFS) 而旧机器没有。有没有一种方法可以测试这个假设(告诉新机器使用不同的/旧的调度程序)而不必为新机器重新编译旧的内核版本?
最佳答案
您提到有 32 个内核,但硬件的确切布局是怎样的?例如。机器有多少包,多少核,缓存是如何共享的等等。为了共享这类信息,我个人喜欢共享likwid-topology -g的输出。
无论如何,您的运行中存在一种不确定性:线程亲和性。操作系统分配 SW 线程以某种方式在特定的 HW 线程上运行,而不考虑有关线程如何通信的知识(只是因为它不具备该知识)。这可能会导致各种影响,因此对于可重现的运行,确保以某种方式将 SW 线程固定到 HW 线程是个好主意(也可能有一种最佳方式,但到目前为止我我只是在谈论决定论)。
对于固定(又名 affinity),您可以使用显式 Pthread 调用,或者您可以尝试使用 Likwid 套件中的另一个名为 likwid-pin 的工具 - 参见 here .
如果这不能使您得到一致的结果,请在您的工作负载上运行一个好的分析器(例如 Intel VTune),确保您捕获更快的运行和更慢的运行,然后比较结果。在 VTune 中,您可以使用并排显示两个配置文件的比较功能。
关于c++ - 非自愿上下文切换的原因,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17266285/
我正在从erb文件切换到HAML。我将hamlgem添加到我的系统中。我创建了app/views/layouts/application.html.haml文件。我应该只删除application.html.erb文件吗?此外,仍然有/public/index.html文件被呈现为默认页面。我想创建自己的默认index.html.haml页面。我应该把它放在哪里以及如何使系统呈现该文件而不是默认索引文件?谢谢! 最佳答案 是的,您可以删除任何已转换为HAML的View的ERB版本。至于你的另一个问题,删除public/index/h
我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server
如何将send与+=一起使用?a=20;a.send"+=",10undefinedmethod`+='for20:Fixnuma=20;a+=10=>30 最佳答案 恐怕你不能。+=不是方法,而是语法糖。参见http://www.ruby-doc.org/docs/ProgrammingRuby/html/tut_expressions.html它说Incommonwithmanyotherlanguages,Rubyhasasyntacticshortcut:a=a+2maybewrittenasa+=2.你能做的最好的事情是:
我对如何计算通过{%assignvar=0%}赋值的变量加一完全感到困惑。这应该是最简单的任务。到目前为止,这是我尝试过的:{%assignamount=0%}{%forvariantinproduct.variants%}{%assignamount=amount+1%}{%endfor%}Amount:{{amount}}结果总是0。也许我忽略了一些明显的东西。也许有更好的方法。我想要存档的只是获取运行的迭代次数。 最佳答案 因为{{incrementamount}}将输出您的变量值并且不会影响{%assign%}定义的变量,我
如果我有以下一段Ruby代码:classBlahdefself.bleh@blih="Hello"@@bloh="World"endend@blih和@@bloh到底是什么?@blih是Blah类中的一个实例变量,@@bloh是Blah类中的一个类变量,对吗?这是否意味着@@bloh是Blah的类Class中的一个变量? 最佳答案 人们似乎忽略了该方法是类方法。@blih将是常量Bleh的类Class实例的实例变量。因此:irb(main):001:0>classBlehirb(main):002:1>defself.blehirb
我有一个数组数组,想将元素附加到子数组。+=做我想做的,但我想了解为什么push不做。我期望的行为(并与+=一起工作):b=Array.new(3,[])b[0]+=["apple"]b[1]+=["orange"]b[2]+=["frog"]b=>[["苹果"],["橙子"],["Frog"]]通过推送,我将推送的元素附加到每个子数组(为什么?):a=Array.new(3,[])a[0].push("apple")a[1].push("orange")a[2].push("frog")a=>[[“苹果”、“橙子”、“Frog”]、[“苹果”、“橙子”、“Frog”]、[“苹果”、“
有没有办法让Ruby能够做这样的事情?classPlane@moved=0@x=0defx+=(v)#thisiserror@x+=v@moved+=1enddefto_s"moved#{@moved}times,currentxis#{@x}"endendplane=Plane.newplane.x+=5plane.x+=10putsplane.to_s#moved2times,currentxis15 最佳答案 您不能在Ruby中覆盖复合赋值运算符。任务在内部处理。您应该覆盖+,而不是+=。plane.a+=b与plane.a=
我在Ruby程序中有两个URI。一个肯定是绝对URI,另一个可能是绝对URI或相对URI。我想在第一个的上下文中将第二个转换为绝对URI,所以如果第一个是http://pupeno.com/blog第二个是/about,结果应该是http://pupeno.com/about.有什么想法吗? 最佳答案 Ruby的内置URI和Addressablegem,做这个简短的工作。我更喜欢Addressable,因为它功能更全面,但URI是内置的。require'uri'URI.join('http://pupeno.com/blog','/
出于某种原因,heroku尝试要求dm-sqlite-adapter,即使它应该在这里使用Postgres。请注意,这发生在我打开任何URL时-而不是在gitpush本身期间。我构建了一个默认的Facebook应用程序。gem文件:source:gemcuttergem"foreman"gem"sinatra"gem"mogli"gem"json"gem"httparty"gem"thin"gem"data_mapper"gem"heroku"group:productiondogem"pg"gem"dm-postgres-adapter"endgroup:development,:t
我是Ruby和这个网站的新手。下面两个函数是不同的,一个在函数外修改变量,一个不修改。defm1(x)x我想确保我理解正确-当调用m1时,对str的引用被复制并传递给将其视为x的函数。运算符当调用m2时,对str的引用被复制并传递给将其视为x的函数。运算符+创建一个新字符串,赋值x=x+"4"只是将x重定向到新字符串,而原始str变量保持不变。对吧?谢谢 最佳答案 String#+::str+other_str→new_strConcatenation—ReturnsanewStringcontainingother_strconc