opencl_kernels

c++ - 是否可以在 OpenCL 中并行运行求和计算？

我是OpenCL的新手。但是，我了解C/C++基础知识和OOP。我的问题如下:是否有可能并行运行总和计算任务？理论上可行吗？下面我将描述我尝试做的事情:任务是，例如:double*values=newdouble[1000];//let'spretendithassomerandomvaluesinsidedoublesum=0.0;for(inti=0;i我在OpenCL内核中尝试做的事情(我觉得这是错误的，因为它可能同时从不同的线程/任务访问相同的“sum”变量):__kernelvoidcalculate2dim(__globalfloat*vectors1dim,__globa

求和 amp section OpenCL c++c parallel-processing

c++ - 如何知道 OpenCV 3.0 算法是否在透明 API 中具有 OpenCL 实现

我正在将我的OpenCV2.4.2迁移到OpenCV3.0，以便通过透明API使用OpenCL性能。但是，我注意到某些算法在CPU或GPU实现中花费相同的时间。我在官方文档中搜索，但没有找到答案。如何知道算法是否在透明API中具有自动OpenCL转换？最佳答案如果您有amdgpu，请使用codexl并创建一个新的codexl项目，附加您的项目并从codexl启动session，或者从您的IDE启动您的项目并将codexl附加到它的运行时。然后当程序完成时，codexl最后会自动生成必要的图形和分析信息(如果您选择适当的gpu分析

amp OpenCV section codexl c++algorithm opencl opencv3.0

c++ - OpenCL:是否可以使用模板化对象作为 Boost::compute 的内核参数？

我的内核函数签名如下:templatevoidkernel(constType1arg1,constType2arg2,Field*results){//Sisknownatcompiletime//Fieldmightbefloatordouble//Type1isanobjectholdingdataandalsomethods//Type2isanobjectholdingdataandalsomethods//Thecomputationstarthere}我知道可以使用c++特性的一个子集来使用extension编写内核到AMD的OpenCL实现，但生成的代码仅限于在AMD卡

amp compute kernel thing size c++opencl boost-compute

c++ - 奇怪的 OpenCL 调用 C++ 的副作用以提高循环性能

我正在使用OpenCL开发一个C++项目。我将CPU用作带有intelOpenCLruntime的OpenCL设备我注意到在调用OpenCL函数时有一个奇怪的副作用。这是一个简单的测试:#include#include#include#includeintmain(intargc,char*argv[]){/*cl_intstatus;std::vectorplatforms;cl::Platform::get(&platforms);std::vectordevices;platforms[1].getDevices(CL_DEVICE_TYPE_CPU,&devices);cl::

amp 43 OpenCL section 毫秒 c++intel

c++ - opencl命令队列是如何工作的，我能问它什么

我正在研究一种算法，它可以多次执行几乎相同的操作。由于该操作由一些线性代数(BLAS)组成，我想我会尝试使用GPU来完成此操作。我已经编写了我的内核并开始将内核推送到命令队列中。因为我不想在每次通话后都等待，所以我想我会尝试将我的通话与事件进行菊花链连接，然后开始将这些事件推送到队列中。callkernel1(returnevent1)callkernel2(waitforevent1,returnevent2)...callkernel1000000(vaitforevent999999)现在我的问题是，是否所有这些都被推送到驱动程序存储队列的图形芯片？它限制了我可以使用的事件数量，

amp opencl section event 送到 c++c cuda gpgpu

c++ - 在调用 clFinish 或 clWaitForEvents 之前，OpenCL 内核执行不会开始

我正在尝试在GPU上运行内核并在主机(CPU)上进行额外的计算。我看到了这个效果:只有内核需要大约2000毫秒:clEnqueueNDRangeKernel...clFinish(orclWaitForEvents,Itriedboth)我使用sleep(10)在CPU上模拟了额外的计算:clEnqueueNDRangeKernel...sleep(10);clFinish(orclWaitForEvents)理论上，内核应该在GPU上运行，并且在10秒sleep后内核应该完成。但是时间测量说这一切都需要12000ms而不是10000。clFinish或clWaitForEvents调

clWaitForEvents amp section blockquote c++opencl

c++ - 如何在 OpenCV (3.0.0) OCL 中启动自定义 OpenCL 内核？

我可能滥用了OpenCV，将其用作官方OpenCLC++绑定(bind)的包装器，以便我可以启动自己的内核。但是，OpenCV确实有Program、ProgramSource、Kernel、Queue等类，它们似乎告诉我可以使用OpenCV启动自己的(甚至非基于图像的)内核。我很难找到这些类的文档，更不用说示例了。所以，到目前为止，我尝试了一下:#include#include#include"opencv2/opencv.hpp"#include"opencv2/core/ocl.hpp"#defineARRAY_SIZE128usingnamespacestd;usingnames

自定何在 lt 34 cv c++opencv opencl gpgpu

c++ - OpenCL Hello World

我刚刚开始在opencl中工作，目前正在opencl中开发一个相对基本的hello_world程序。不幸的是，该程序没有输出正确的短语或任何东西，而是挂起而没有输出。知道为什么会这样吗？下面是:openglsource.cpp和hello.cl#defineCL_USE_DEPRECATED_OPENCL_2_0_APIS#include#include#includeintmain(){std::vectorplatforms;cl::Platform::get(&platforms);autoplatform=platforms.front();std::vectordevices

amp OpenCL data 39 section c++visual-studio-2015

c++ - Visual Studio 错误 : LNK1104: cannot open file 'kernel32.lib' - only in WP8 projects/Win32 builds

我最近遇到了这个问题(几天前一切正常):VisualStudio2012开始拒绝构建原生WP8项目。今天，我从模板“WindowsPhoneDirect3D应用程序(仅限native)”创建了新解决方案，以检查WP是否正确支持我新创建的DLL。我尝试编译这个项目，首先没有任何更改或额外的引用-VS生成的纯代码。但是，它因给定错误而失败。我很清楚这是什么意思，可能的原因是什么，但是我不明白，在这种情况下它是从哪里来的。奇怪的事情:这只发生在“Win32”配置中，ARM编译正常:1>------Buildstarted:Project:PhoneDirect3DApp,Configurat

amp projects code pre PhoneDirect3DApp c++visual-studio-2012 windows-phone-8 linker-errors windows-phone-8-sdk

K-means聚类算法的三种改进(K-means++,ISODATA,Kernel K-means)介绍与对比

目录一、概述二、经典K-means算法三、K-means++算法四、ISODATA算法六、数据集测试一、概述在本篇文章中将对四种聚类算法(K-means,K-means++,ISODATA和KernelK-means)进行详细介绍，并利用数据集来真实地反映这四种算法之间的区别。首先需要明确的是上述四种算法都属于"硬聚类”算法，即数据集中每一个样本都是被100%确定得分到某一个类别中。与之相对的"软聚类”可以理解为每个样本是以一定的概率被分到某一个类别中。先简要阐述下上述四种算法之间的关系，已经了解过经典K-means算法的读者应该会有所体会。没有了解过K-

K-means means strong xff xff0c 聚类算法 kmeans

6 7 8910 11 12