草庐IT

c++ - 线程同步101

coder 2023-06-01 原文

以前我写过一些非常简单的多线程代码,我一直都知道在我正在做的任何时候都可能有一个上下文切换,所以我总是通过以下方式保护访问共享变量一个 CCriticalSection 类,它在构造时进入临界区并在销毁时离开它。我知道这是相当激进的,我非常频繁地进入和离开关键部分,有时甚至令人震惊(例如,在函数开始时,我可以将 CCriticalSection 放在更紧凑的代码块中),但我的代码没有崩溃并且运行速度足够快.

在工作中,我的多线程代码需要更紧密,仅在所需的最低级别进行锁定/同步。

在工作中我试图调试一些多线程代码,我遇到了这个:

EnterCriticalSection(&m_Crit4);
m_bSomeVariable = true;
LeaveCriticalSection(&m_Crit4);

现在,m_bSomeVariable是一个 Win32 BOOL(非 volatile ),据我所知,它被定义为一个 int,在 x86 上读取和写入这些值是一条指令,并且由于上下文切换发生在指令边界上,因此不需要同步这个操作带有一个临界区。

我在网上做了一些更多的研究,看看这个操作是否不需要同步,我想出了两个场景:
  • CPU执行乱序或第二个线程在不同的核上运行,更新后的值没有写入RAM供其他核查看;和
  • int 不是 4 字节对齐的。

  • 我相信数字 1 可以使用“volatile”关键字来解决。在 VS2005 及更高版本中,C++ 编译器使用内存屏障来包围对该变量的访问,确保该变量在使用之前始终完全写入/读取到主系统内存。

    数字 2 我无法验证,我不知道为什么字节对齐会有所不同。我不知道 x86 指令集,但知道 mov需要给出一个 4 字节对齐的地址吗?如果不是,您是否需要使用指令组合?那就会引入问题。

    所以...

    问题1:使用“volatile”关键字(暗示使用内存屏障并提示编译器不要优化此代码)是否可以免除程序员在读/写操作之间同步 x86/x64 变量上的 4 字节/8 字节的需要?

    问题2:是否明确要求变量是 4 字节/8 字节对齐的?

    我对我们的代码和类中定义的变量做了更多的挖掘:
    class CExample
    {
    
    private:
    
        CRITICAL_SECTION m_Crit1; // Protects variable a
        CRITICAL_SECTION m_Crit2; // Protects variable b
        CRITICAL_SECTION m_Crit3; // Protects variable c
        CRITICAL_SECTION m_Crit4; // Protects variable d
    
        // ...
    
    };
    

    现在,对我来说这似乎太过分了。我认为临界区在一个进程之间同步线程,所以如果你有一个你可以输入它并且该进程中的其他线程不能执行。您不需要为每个要保护的变量设置临界区,如果您处于临界区,则没有其他任何东西可以打扰您。

    我认为唯一可以从临界区外部更改变量的是进程是否与另一个进程共享一个内存页(你能做到吗?)并且另一个进程开始更改值。互斥体在这里也有帮助,命名互斥体是跨进程共享的,还是只有同名的进程?

    问题 3:我对临界区的分析是否正确,是否应该重写此代码以使用互斥锁?我看过其他同步对象(信号量和自旋锁),它们更适合这里吗?

    问题 4:关键部分/互斥锁/信号量/自旋锁最适合哪里?也就是说,它们应该应用于哪个同步问题。选择一个而不是另一个会导致巨大的性能损失吗?

    当我们在做的时候,我读到自旋锁不应该在单核多线程环境中使用,只能在多核多线程环境中使用。所以,问题 5:这是错的,或者如果不是,为什么是对的?

    预先感谢您的任何回复:)

    最佳答案

    1) 没有 volatile 只是说每次仍然可能更新一半时从内存中重新加载值。

    编辑:
    2) Windows 提供了一些原子函数。查找 "Interlocked" functions .

    这些评论让我多读了一点。如果您通读了 Intel System Programming Guide您可以看到对齐的读取和写入是原子的。

    8.1.1 保证原子操作
    Intel486 处理器(以及此后的更新处理器)保证以下
    基本内存操作将始终以原子方式执行:
    • 读取或写入一个字节
    • 读取或写入在 16 位边界上对齐的字
    • 读取或写入在 32 位边界上对齐的双字
    Pentium 处理器(以及后来的处理器)保证以下
    额外的内存操作将始终以原子方式执行:
    • 读取或写入在 64 位边界上对齐的四字
    • 对适合 32 位数据总线的未缓存内存位置的 16 位访问
    P6 系列处理器(以及之后的更新处理器)保证以下
    额外的内存操作将始终以原子方式执行:
    • 对适合缓存的缓存内存的未对齐 16 位、32 位和 64 位访问
    线
    访问可缓存的内存,这些内存在总线宽度、缓存线和
    英特尔酷睿 2 Duo 不保证页面边界是原子的
    凌动、英特尔酷睿双核、奔腾 M、奔腾 4、英特尔至强、P6 系列、奔腾和
    Intel486 处理器。英特尔酷睿 2 双核、英特尔凌动、英特尔酷睿双核、奔腾 M、
    Pentium 4、Intel Xeon 和 P6 系列处理器提供总线控制信号,
    允许外部存储器子系统使拆分访问原子化;然而,
    非对齐的数据访问将严重影响处理器的性能和
    应该避免。
    访问大于四字的数据的 x87 指令或 SSE 指令
    可以使用多个内存访问来实现。如果这样的指令存储
    到内存,一些访问可能会完成(写入内存),而另一个
    由于架构原因导致操作出错(例如,由于页表条目
    标记为“不存在”)。在这种情况下,已完成访问的影响
    即使整个指令导致了错误,也可能对软件可见。如果TLB
    失效已被延迟(参见第 4.10.3.4 节),可能会发生此类页面错误
    即使所有访问都指向同一页面。

    所以基本上是的,如果你从任何地址进行 8 位读/写,从 16 位对齐地址等进行 16 位读/写等,你将获得原子操作。值得注意的是,您可以在现代机器上的缓存行中进行未对齐的内存读/写。规则看起来很复杂,所以如果我是你,我不会依赖它们。为评论者干杯,这对我来说是一次很好的学习经历:)

    3) 临界区将尝试为其锁旋转锁几次,然后锁定互斥锁。自旋锁定可以无所事事地消耗 CPU 的能力,而互斥锁可能需要一段时间才能完成它的工作。如果您不能使用互锁功能,CriticalSections 是一个不错的选择。

    4)选择一个而不是另一个会导致性能损失。体验这里一切的好处是一个很大的要求。 MSDN 帮助有很多关于这些的很好的信息。我建议阅读它们。

  • Semaphores
  • Critical Sections & Spin locks
  • Events
  • Mutexes

  • 5) 您可以在单线程环境中使用自旋锁,但通常不需要,因为线程管理意味着您不能让 2 个处理器同时访问相同的数据。这是不可能的。

    关于c++ - 线程同步101,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2552172/

    有关c++ - 线程同步101的更多相关文章

    1. ruby-on-rails - 如何优雅地重启 thin + nginx? - 2

      我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server

    2. ruby - RuntimeError(自动加载常量 Apps 多线程时检测到循环依赖 - 2

      我收到这个错误:RuntimeError(自动加载常量Apps时检测到循环依赖当我使用多线程时。下面是我的代码。为什么会这样?我尝试多线程的原因是因为我正在编写一个HTML抓取应用程序。对Nokogiri::HTML(open())的调用是一个同步阻塞调用,需要1秒才能返回,我有100,000多个页面要访问,所以我试图运行多个线程来解决这个问题。有更好的方法吗?classToolsController0)app.website=array.join(',')putsapp.websiteelseapp.website="NONE"endapp.saveapps=Apps.order("

    3. ruby - 使用 `+=` 和 `send` 方法 - 2

      如何将send与+=一起使用?a=20;a.send"+=",10undefinedmethod`+='for20:Fixnuma=20;a+=10=>30 最佳答案 恐怕你不能。+=不是方法,而是语法糖。参见http://www.ruby-doc.org/docs/ProgrammingRuby/html/tut_expressions.html它说Incommonwithmanyotherlanguages,Rubyhasasyntacticshortcut:a=a+2maybewrittenasa+=2.你能做的最好的事情是:

    4. 使用canal同步MySQL数据到ES - 2

      文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目,Java开发。基于数据库增量日志解析,提供增量数据订阅&消费。Git地址:https://github.co

    5. ruby - 如何让Ruby捕获线程中的语法错误 - 2

      我正在尝试使用ruby​​编写一个双线程客户端,一个线程从套接字读取数据并将其打印出来,另一个线程读取本地数据并将其发送到远程服务器。我发现的问题是Ruby似乎无法捕获线程内的错误,这是一个示例:#!/usr/bin/rubyThread.new{loop{$stdout.puts"hi"abc.putsefsleep1}}loop{sleep1}显然,如果我在线程外键入abc.putsef,代码将永远不会运行,因为Ruby将报告“undefinedvariableabc”。但是,如果它在一个线程内,则没有错误报告。我的问题是,如何让Ruby捕获这样的错误?或者至少,报告线程中的错误?

    6. ruby - 如何在 ruby​​ 中运行后台线程? - 2

      我是ruby​​的新手,我认为重新构建一个我用C#编写的简单聊天程序是个好主意。我正在使用Ruby2.0.0MRI(Matz的Ruby实现)。问题是我想在服务器运行时为简单的服务器命令提供I/O。这是从示例中获取的服务器。我添加了使用gets()获取输入的命令方法。我希望此方法在后台作为线程运行,但该线程正在阻塞另一个线程。require'socket'#Getsocketsfromstdlibserver=TCPServer.open(2000)#Sockettolistenonport2000defcommandsx=1whilex==1exitProgram=gets.chomp

    7. ruby - 如何计算 Liquid 中的变量 +1 - 2

      我对如何计算通过{%assignvar=0%}赋值的变量加一完全感到困惑。这应该是最简单的任务。到目前为止,这是我尝试过的:{%assignamount=0%}{%forvariantinproduct.variants%}{%assignamount=amount+1%}{%endfor%}Amount:{{amount}}结果总是0。也许我忽略了一些明显的东西。也许有更好的方法。我想要存档的只是获取运行的迭代次数。 最佳答案 因为{{incrementamount}}将输出您的变量值并且不会影响{%assign%}定义的变量,我

    8. ruby - Rails 开发服务器、PDFKit 和多线程 - 2

      我有一个使用PDFKit呈现网页的pdf版本的Rails应用程序。我使用Thin作为开发服务器。问题是当我处于开发模式时。当我使用“bundleexecrailss”启动我的服务器并尝试呈现任何PDF时,整个过程会陷入僵局,因为当您呈现PDF时,会向服务器请求一些额外的资源,如图像和css,看起来只有一个线程.如何配置Rails开发服务器以运行多个工作线程?非常感谢。 最佳答案 我找到的最简单的解决方案是unicorn.geminstallunicorn创建一个unicorn.conf:worker_processes3然后使用它:

    9. arrays - Ruby 数组 += vs 推送 - 2

      我有一个数组数组,想将元素附加到子数组。+=做我想做的,但我想了解为什么push不做。我期望的行为(并与+=一起工作):b=Array.new(3,[])b[0]+=["apple"]b[1]+=["orange"]b[2]+=["frog"]b=>[["苹果"],["橙子"],["Frog"]]通过推送,我将推送的元素附加到每个子数组(为什么?):a=Array.new(3,[])a[0].push("apple")a[1].push("orange")a[2].push("frog")a=>[[“苹果”、“橙子”、“Frog”]、[“苹果”、“橙子”、“Frog”]、[“苹果”、“

    10. += 的 Ruby 方法 - 2

      有没有办法让Ruby能够做这样的事情?classPlane@moved=0@x=0defx+=(v)#thisiserror@x+=v@moved+=1enddefto_s"moved#{@moved}times,currentxis#{@x}"endendplane=Plane.newplane.x+=5plane.x+=10putsplane.to_s#moved2times,currentxis15 最佳答案 您不能在Ruby中覆盖复合赋值运算符。任务在内部处理。您应该覆盖+,而不是+=。plane.a+=b与plane.a=

    随机推荐