opencl

c++ - 这是否会出错，如果是，如何检查？ (OpenCL)

我正在学习在OpenCL中编写健壮的代码并面对以下内核代码:stringkernel_code="voidkernelsimple_add(globalconstint*A,""globalconstint*B,""globalint*C,intn){""""intindex=get_global_id(0);""C[index]=A[index]+B[index];""}";并故意使用以下代码将其发送到GPU:Kernelker(program,"simple_add");ker.setArg(0,buffer_A);ker.setArg(1,buffer_B);ker.setArg

amp OpenCL section 34 global c++

c++ - 是否有与 Thrust(GPU 的并行 STL)类似的库，但用于 GPGPU AMD Radeon？

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的，因为它们往往会吸引自以为是的答案和垃圾邮件。相反，describetheproblem以及迄今为止为解决该问题所做的工作。关闭9年前。Improvethisquestion是否有类似Thrust的库(用于GPU的并行STL，可以使用OpenMP/TBB，C++CUDA)，但用于GPGPUAMDRadeon(例如使用OpenCL而不是使用CUDA)？所需的标准STL算法(排序、合并、删除/复制、In/Exc

amp Thrust section class notice c++stl opencl gpgpu

c++ - 在 OpenCL 中获得最佳的本地/全局工作组规模？

我正在使用以下函数为我的OpenCL应用程序获取最佳的本地和工作组大小。//maxWGSize==CL_KERNEL_WORK_GROUP_SIZE//wgMultiple==CL_KERNEL_PREFERRED_WORK_GROUP_SIZE_MULTIPLE//compUnits==CL_DEVICE_MAX_COMPUTE_UNITS//rems==maxrequiredworkitemsvoidMyOpenCL::getBestWGSize(cl_uintmaxWGSize,cl_uintwgMultiple,cl_uintcompUnits,cl_uintrems,size

工作组 amp wgMultiple compUnits code c++opencl

c++ - cl::vector 与 std::vector:不同的迭代器行为

编辑:按照PlasmaHH的建议添加了带有内存位置的调试输出。我不明白cl::vector在OpenCL的C++绑定(bind)中的不同行为。考虑以下代码:标题Top.hpp:classTop{public:voidsetBool(boolb);boolgetBool();private:boolstatus;};来源Top.cpp:#include"Top.hpp"voidTop::setBool(boolb){std::cout使用上面的:#define__NO_STD_VECTOR#include#include"CL/cl.hpp"#include"Top.hpp"usingn

vector amp code lt c++iterator opencl

c++ - 如何在 OpenCL 中使用模板？

根据thisdocumentpage6(releasedbyAMD)(andthistopics?),有一些方法可以通过OpenCL使用模板。然而，第一份文件报告说这可以通过使用一些似乎不存在的clBuildProgramWithSource选项来完成......无论如何，假设它是clBuildProgram而不是前一个，我尝试将所谓的“-x”选项与“clc++”一起使用，但仍然无法识别:warning:ignoringbuildoption:"-x"事实上，根据Khronos的文档，此选项不可用!该文档可能会以某种方式被弃用，但是还有其他方法可以在OpenCL代码中使用模板吗？

何在 amp section OpenCL code c++templates

c++ - OpenCl 代码在一台机器上工作，但我在另一台机器上得到 CL_INVALID_KERNEL_ARGS

我有以下代码，它在一台机器上运行良好，但是当我尝试在另一台配备更好显卡的机器上运行它时，我遇到了错误:global[0]=512;global[1]=512;local[0]=16;local[1]=16;ciErrNum=clEnqueueNDRangeKernel(commandQueue,myKernel,2,NULL,global,local,0,NULL,&event);错误:Error@clEnqueueNDRangeKernel:CL_INVALID_KERNEL_ARGSError@clWaitForEvents:CL_INVALID_KERNEL_ARGS知道问题出在

上得上工 code section CL_INVALID_KERNEL_ARGS c++c opencl

c++ - OpenCL 找不到平台？

我正在尝试将C++API用于OpenCL。我已经安装了我的NVIDIA驱动程序并测试了我可以运行提供的简单vector加法程序here.我可以用下面的gcc调用编译这个程序，程序运行没有问题。gccmain.c-ovectorAddition-lOpenCL-I/usr/local/cuda-6.5/include但是，我更愿意使用C++API而不是C所需的非常冗长的主机文件。我从here下载了Khronos的C++绑定(bind)并将cl.hpp文件放在与我的其他cl.h文件相同的位置。该代码使用了一些C++11，因此我可以使用以下代码编译代码:g++main.cpp-ovector

amp OpenCL code cuda li c++gpu

c++ - 如何将字符串传递给 GPU 并从内核中取回以显示它？ (C++ OpenCL)

我想将一个字符串传递到我的GPU并从GPU取回它以打印它。这是为了理解目的-我知道，这个想法听起来毫无意义。我试过:OpenCL:__kernelvoidsame_in_same_out_char(__globaluchar*out,__constantuchar*in){for(unsignedintui=0;uiC++:#define__CL_ENABLE_EXCEPTIONS#include#include#include#include#includeusingnamespacestd;intmain(){vectorplatforms;vectordevices;vector

amp 43 lt code cl c++opencl

c++ - 如何在 OpenCL 内核中包含 C++ 类

我一直在使用OpenCL1.2，但在使用OpenCLC++WrapperAPI(https://www.khronos.org/registry/OpenCL/specs/opencl-cplusplus-1.2.pdf)时遇到了问题。它没有说明在kerenel(cl)文件中包含类“classMyClass”的任何限制，我认为这是可能的，因为平台、设备和上下文是“类”(如果不是，那是什么那么它的目标是什么？X_X)嗯，我在“printer.h”文件中有以下简单类:classPrinter{public:voidprint();}在cl文件中，我有以下几行:#include"printe

中包 amp C++strong OpenCL c++

c++ - 带有 C++ 包装器的 OpenCL - 如何将 cl::CommandQueue 转换为 cl_command_queue？

我将OpenCL与CL/cl.hppc++包装器一起使用。所以我有C++对象，例如cl::CommandQueue而不是cl_command_queue。我还想使用AMD的BLAS库clAmdBlas。那里的函数需要一个cl_command_queue作为它们的参数之一。如何从cl::CommandQueue获取cl_command_queue？最佳答案要获取cl_command_queue对象，您只需使用()运算符:cl::CommandQueuecppQueue;...cl_command_queuequeue=cppQ

amp 43 code cl_command_queue section c++opencl

1 234 5 6