草庐IT

并行机

全部标签

C++ 并行 std::vector 排序与昂贵的复制

假设我有一个vectorintVec和一个vector>matrix.我想排序intVec并对matrix的第一个维度重新排序相应地在C++中。我意识到这个问题之前已经被问过好几次了,但是这个案例有一个转折。vector复制起来很昂贵,所以例如复制intVec和matrix到vector>,对其进行排序并将它们复制回去比平时效率更低。如果没有滚动我自己的自定义排序算法,我该如何排序intVec并对matrix的第一个维度重新排序在不复制matrix的任何元素的情况下同步并调用vector的拷贝构造函数? 最佳答案 Avectoris

c++ - 在并行 omp 循环中同时写入同一内​​存

我想实现以下函数,将数组的某些元素标记为1。voidmark(std::vector&marker){#pragmaompparallelforschedule(dynamic,M)for(inti=0;i如果我们尝试在不同的线程中同时将同一个元素的值设置为1会发生什么?它通常会设置为1还是此循环可能会导致意外行为? 最佳答案 Thisanswer一个基本部分是错误的(强调我的):Ifyouwritewithdifferentthreadstotheverysamelocation,yougetaracecondition.This

c++ - 并行操作 std::vector 的不同元素

假设我有一个std::vector.vector很大(>1000个元素)并且每个Object*需要对其进行大量计算。然后在每个元素上运行每个计算的for循环可以很容易地并行化。事实上,我可以并行处理所有1000个元素以获得最大加速(“令人尴尬的并行?”)现在我想知道两件事:1)读写std::vector的不同元素是否安全没有锁?(不是修改vector本身!)2)是否有简单的方法或约定或模式可以遵循来切断for循环并分派(dispatch)给线程? 最佳答案 1)是2)您可以使用OpenMP来并行处理vector。如果您使用的是Mic

c++ - openMP - 与 for 循环和私有(private)并行化

我编写了一个函数来评估集合(set_)中的点处的给定函数。没有并行化的代码是这样的:voidMethod::evaluateSet(double*funcEvals_,double**set_){for(intj=0;j这一切正常。然后我使用openMP进行并行化,使用并行构造,并为每个线程提供变量set_的私有(private)拷贝。循环是#pragmaompparallelforprivate(set_)for(intj=0;j它崩溃,并且在if评估时发生错误,set_isbeingusedwithoutbeeninitialized。我不明白。由于我将set_变量设置为私有(pr

并行计算与大规模数据处理:Hadoop与Spark

1.背景介绍大数据是指由于互联网、物联网等新兴技术的发展,数据量巨大、高速增长、多源性、不断变化的数据。大数据处理技术是指利用计算机科学技术,对大规模、高速、多源、不断变化的数据进行存储、处理和挖掘,以实现数据的价值化。并行计算是指同时处理多个任务或数据,以提高计算效率。大规模数据处理是指处理的数据量非常大,需要借助分布式系统来完成。Hadoop和Spark是两种常用的大规模数据处理技术,Hadoop是一个开源的分布式文件系统(HDFS)和分布式计算框架(MapReduce)的集合,而Spark是一个基于内存计算的大数据处理框架,它可以在HDFS、本地文件系统和其他分布式存储系统上运行。本文将

c++ - 用于基于任务的并行性的通用 c++11 函数包装器

我正在实现一个工作窃取算法,并正在编写一个通用函数包装器,它将promise作为包装器模板的可变参数之一。我想使用这些函数包装器创建任务,并让每个节点使用promise与依赖节点进行通信。每个节点都维护一个依赖节点和promise/future的列表。每个节点都可以通过检查是否已设置所有future来运行。promises可以根据函数包装器正在返回不同对象的工作而有所不同。如果可以将单个算法分解为单独的操作,例如读取消息和解码消息、对对象执行检查、返回所有检查的结果,则这些操作中的每一个都将返回不同的promise(对象、bool值、结果)。C++ConcurrencyinAction

c++ - 私有(private)子句中的变量与 OpenMP 中并行区域中定义的变量之间有什么区别吗?

我想知道是否有任何理由更喜欢OpenMP中的private(var)子句而不是(私有(private))变量的本地定义,即intvar;#pragmaompparallelprivate(var){...}对比#pragmaompparallel{intvar;...}此外,我想知道私有(private)子句的意义何在。OpenMP:arelocalvariablesautomaticallyprivate?部分解释了这个问题,但我不喜欢这个答案,因为即使C89也不禁止您在函数中间定义变量,只要它们在作用域的开头(当您进入并行区域时会自动出现这种情况)。因此,即使对于老派的C程序员来说

c++ - 如何确定是否在 openMP 并行区域内?

在我的代码中,我想避免从任何openMP并行区域内抛出异常(因为如果未在同一区域内捕获,这将导致未处理的异常)。为此,我尝试使用openmp运行时库函数omp_in_parallel();决定是抛出异常还是写出错误信息并终止。但是,在gcc4.7.0下,如果并行区域只有一个线程,这将不起作用:#include#includevoiddo_something(){if(!omp_in_parallel())//omp_in_parallel()returnsfalse!throw3;//soshouldbeabletosafelythrow}intmain(){omp_set_num_t

c++ - Armadillo 中的并行化

ArmadilloC++linearalgebralibrarydocumentation说明在C++中开发库的原因之一是"easeofparallelisationviaOpenMPpresentinmodernC++compilers",但Armadillo代码不使用OpenMP。我怎样才能获得与Armadillo并行化的好处?这是通过使用high-speedLAPACKandBLASreplacements之一来实现的吗??我的平台是Linux,英特尔处理器,但我怀疑这个问题有一个通用的答案。 最佳答案 好吧,看起来并行化确实

c++ - openmp条件并行循环

如果满足特定条件,我正在尝试使用openmpfor循环。如果条件成立,我可以简单地使用ifelse语句来使用并行for循环,但是for循环中的代码有点长,如果我只使用ifelse语句,代码长度会加倍。所以基本上,我想要一个更好的方法来做到这一点:if(condition_holds){//useparallelforloop#pragmaompparallelforfor(...){//Longpieceofcode}}else{//Don'tuseparallelforloopfor(...){//Longpieceofcode}}这样我就不必在for循环中编写代码两次。