intel-mpi

c++ - 使用 MPI_Bcast 发送具有动态大小的动态数组

OpenMPI:我想读取根节点上的文件并将该文件的内容发送到所有其他节点。我发现MPI_Bcast可以做到这一点:intMPI_Bcast(void*buffer,intcount,MPI_Datatypedatatype,introot,MPI_Commcomm)我找到的所有示例都有已知的count值，但在我的例子中，count值主要在根上已知。其他examples假设MPI_Bcast的相同调用在其他节点上检索数据。我添加了这个:typedefshortDescriptor[128];MPI_DatatypedescriptorType;MPI_Type_contiguous(si

c++ - 如何使用 gcc 和 intel 静态库进行编译？

我有一个用gcc编译的程序。我得到了一个用英特尔编译器(icc)编译的静态库(.a文件)。我如何使用和链接该库？(我没有icc，对方必须使用icc才能使用Intel指令集)。我正在尝试编译(链接到那个库)但是我在Intel指令上遇到错误...我的目标是IntelI7。我遇到的第一个错误是:“对`_intel_fast_memcpy'的undefinedreference”谢谢最佳答案请查看英特尔C++编译器论坛主题中提供的建议:https://software.intel.com/en-us/forums/intel-c-com

amp intel section 英特 c++gcc icc

c++ - 在 MPI 中对 cout 的 "atomic"调用

我感兴趣的是OpenMPI中是否有命令或技术来进行原子调用以写入stdout(或者就此而言，任何流)。我注意到，在MPI程序的执行过程中，写入cout(或其他流)的调用可能会变得困惑，因为每个proc都可能在到达特定代码段时写入。报告结果时，一行可以被多个proc写入，混淆了问题。所以2个不同的过程可能会做这样的事情://Proc10-resultscalculatedsomewhereabove//result1=10//result2=11cout和://Proc20-resultscalculatedsomewhereabove//result1=20//result2=21co

amp atomic section results lt c++blocking cout openmpi

c++ - 简单的 MPI_Send 和 Recv 使用 CUDA 给出段错误(11)和无效权限(2)

我正在尝试对格子玻尔兹曼建模的CUDA代码进行MPI，但在使用MPI_Send和MPI_Recv函数时遇到了令人沮丧的问题。我已经验证我有CUDA感知MPI和一些简单的设备缓冲区到设备缓冲区MPI发送/接收代码，所以我可以在GPU设备内存之间发送和接收数组，而无需通过CPU/主机。我的代码是针对3D晶格的，它在各个节点之间沿z方向划分，节点之间有光晕，以确保流体可以在这些划分之间流动。光环位于GPU上。下面的代码是一个简化和编译给出了与我的主要代码相同的错误。在这里，Rank0节点上的GPUHalo是MPI_Send()到rank1节点，它是MPI_Recv()。我的问题目前看起来很简

amp MPI_Send MPI Anastasia rank c++cuda segmentation-fault runtime-error

c++ - 在 Intel C++ 上检测 C++0x 模式？

在使用Qstd=c++0x编译时，IntelC++是否预定义了一些宏？像GCC中的__GXX_EXPERIMENTAL_CXX0X__这样的东西？__cplusplus仍然是199711。有什么方法可以检测C++0x编译吗？最佳答案 Inteldocumentationindicates它确实在Linux上定义了__GXX_EXPERIMENTAL_CXX0X__，但在Windows上没有定义任何宏。关于c++-在IntelC++上检测C++0x模式？，我们在StackOverflo

amp 43 section code GXX_EXPERIMENTAL_CXX c++c++11 c-preprocessor intel conditional-compilation

c++ - Intel 编译器 (C++) 问题与 std::vector 上的 OpenMP 缩减

从OpenMP4.0开始，支持用户定义的缩减。所以我在C++中完全从here定义了对std::vector的归约。.它适用于GNU/5.4.0和GNU/6.4.0，但它返回随机值以减少intel/2018.1.163。这是例子:#include#include#include#include"omp.h"#pragmaompdeclarereduction(vec_double_plus:std::vector:\std::transform(omp_out.begin(),omp_out.end(),omp_in.begin(),omp_out.begin(),std::plus()

amp 缩减 omp section int c++openmp intel gnu reduction

c++ - 内存对齐 - Sparc(Sun) cc 编译器、Intel(Linux) g++ 编译器、Intel(Windows) MVSC 编译器

我的问题由两部分组成。我注意到使用cc编译器的sparc(sun)上的memalign(block_size,bytes)不检查字节是否为2的幂，这与使用mvsc编译器的intellinux上的memalign和Windows上的_aligned_malloc进行检查相反字节是2的幂。这是sun中的错误，是否有补丁，或者我需要自己编写一个memalign。另外我有一个结构(不是我的代码):typedefstructCLHLockStruct{volatileCLHLockNodeCACHE_ALIGN*Tail;volatileCLHLockNodeCACHE_ALIGN*MyNode

amp Intel CLHLockStruct aligned_malloc section c++algorithm architecture g++memory-alignment

c++ - 全局变量和 MPI

我知道全局变量不好，应该尽量避免。然而，当用MPI编写并行程序时，一些变量只初始化一次，并且永远不会改变(这个任务的数量，任务的总数等)。将这些变量作为全局变量仍然被认为是不好的做法吗？因为你几乎总是需要访问这些变量，所以在main中为它们创建一个类，并将指向它的指针传递给程序中99%的函数似乎很愚蠢。到目前为止，我的方法是将它们隐藏在命名空间mpi_glob中(对于C++，我想我不会费心将它们放在C中的结构中以模拟命名空间)。我想这个问题也适用于其他仅设置一次的变量，例如单位系统等。最佳答案全局变量“不好”的原因是它们在单独的

amp 43 section 的 stackoverflow c++c global-variables mpi

c++ - 如何使用 MPI_Irecv？

来自OpenMPI文档:C++语法RequestComm::Irecv(void*buf,intcount,constDatatype&datatype,intsource,inttag)const所以我想我会做类似的事情:MPI::Requestreq;req=MPI_Irecv(&ballChallenges[i],2,MPI_INT,i,TAG_AT_BALL,MPI_COMM_WORLD);但它提示:error:toofewargumentstofunction‘intMPI_Irecv(void*,int,MPI_Datatype,int,int,MPI_Comm,ompi_

amp MPI_Irecv MPI code int c++openmpi

c++ - MPI_Recv 中的消息被截断

我有邻接矩阵和以下代码:if(is_broadcast_message){MPI_Send(&broadcast_message,1,MPI_INT,j,3,MPI_COMM_WORLD);MPI_Send(&message,20,MPI_CHAR,j,3,MPI_COMM_WORLD);}broadcast_message=128(随机数只是为了知道我何时收到，这是一条广播消息)消息定义为char[20]。elseif(ihavetosendonlytoanode){MPI_Send(&destination,1,MPI_INT,next_hop[destination],3,MPI

amp MPI_Recv MPI code MPI_COMM_WORLD c++c

29 30 313233 34 35