草庐IT

CUDA_TOOL

全部标签

java - Java 中 GPGPU/CUDA/OpenCL 的最佳方法?

图形处理单元(GPGPU)上的通用计算是一个非常有吸引力的概念,可以利用GPU的强大功能进行任何类型的计算。我很想将GPGPU用于图像处理、粒子和快速几何运算。目前,该领域的两个竞争者似乎是CUDA和OpenCL。我想知道:OpenCL是否可以在Windows/Mac上的Java中使用?与OpenCL/CUDA接口(interface)的库方法有哪些?是否可以直接使用JNA?我是不是忘记了什么?感谢任何现实世界的经验/例子/war故事。 最佳答案 AFAIK,JavaCL/OpenCL4Java是目前唯一可在所有平台上使用的Open

c++ - 为什么 CUDA 固定内存这么快?

当我使用固定内存进行CUDA数据传输时,我观察到数据传输速度显着加快。在linux上,实现这一点的底层系统调用是mlock。从mlock的手册页中,它指出锁定页面可以防止它被换出:mlock()lockspagesintheaddressrangestartingataddrandcontinuingforlenbytes.AllpagesthatcontainapartofthespecifiedaddressrangeareguaranteedtoberesidentinRAMwhenthecallreturnssuccessfully;在我的测试中,我的系统上有几场空闲内存,所以

c++ - 如何在 Visual Studio 2010 中启动 CUDA 应用程序?

直接问题:如何在VisualStudio2010中创建一个简单的helloworldCUDA项目?背景:我写过CUDA内核。我非常熟悉VisualStudio2005中的.vcproj文件——手动调整了几个。在VS2005中,如果我想构建一个CUDA内核,我添加一个自定义构建规则,然后显式定义nvcc调用来构建文件。我已迁移到Win7和VS2010,因为我真的很想试用nSight。我安装了nSight1.5。但这是我完全迷失的地方。如果我像以前一样继续,nvcc报告它只支持msvc8.0和9.0。但该网站明确声明它支持VS2010。我在其他地方读到我还需要安装VS2008(msvc9.

c++ - 如何在 Visual Studio 2010 中启动 CUDA 应用程序?

直接问题:如何在VisualStudio2010中创建一个简单的helloworldCUDA项目?背景:我写过CUDA内核。我非常熟悉VisualStudio2005中的.vcproj文件——手动调整了几个。在VS2005中,如果我想构建一个CUDA内核,我添加一个自定义构建规则,然后显式定义nvcc调用来构建文件。我已迁移到Win7和VS2010,因为我真的很想试用nSight。我安装了nSight1.5。但这是我完全迷失的地方。如果我像以前一样继续,nvcc报告它只支持msvc8.0和9.0。但该网站明确声明它支持VS2010。我在其他地方读到我还需要安装VS2008(msvc9.

使用 cmake 构建 CUDA 目标文件

我得到了以下设置。我将使用MPI和其他使用CUDA的东西来扩展用C++编写的框架。该项目使用cmake进行构建。我想避免为我的扩展使用库并从我的cuda源构建目标文件。之后,我想链接这些目标文件和用其他编译器编译的其他一些文件。有没有人知道如何实现这一目标?我看过http://code.google.com/p/cudpp/wiki/BuildingCUDPPwithCMake获取有关如何将CUDA与cmake一起使用的概述,但此解决方案也使用库。 最佳答案 可以使用较新版本的cmake附带的CUDA支持来编译目标文件。您使用cud

c++ - 如何让cmake找到CUDA

我正在尝试构建thisproject,它具有CUDA作为依赖项。但是cmake脚本在系统上找不到CUDA安装:cls~/workspace/gpucluster/cluster/build$cmake..--TheCcompileridentificationisGNU4.7.1--TheCXXcompileridentificationisGNU4.7.1--CheckforworkingCcompiler:/usr/bin/gcc--CheckforworkingCcompiler:/usr/bin/gcc--works--DetectingCcompilerABIinfo--De

c++ - CUDA __global__ 函数中的 printf

我目前正在GPU上编写矩阵乘法并想调试我的代码,但由于我不能在设备函数中使用printf,所以我可以做些什么来查看该函数内部发生了什么。这是我当前的功能:__global__voidMatrixMulKernel(MatrixAd,MatrixBd,MatrixXd){inttx=threadIdx.x;intty=threadIdx.y;intbx=blockIdx.x;intby=blockIdx.y;floatsum=0;for(intk=0;k我很想知道Ad和Bd是不是我想的那样,看看是否真的调用了那个函数。 最佳答案 CU

c++ - CUDA __global__ 函数中的 printf

我目前正在GPU上编写矩阵乘法并想调试我的代码,但由于我不能在设备函数中使用printf,所以我可以做些什么来查看该函数内部发生了什么。这是我当前的功能:__global__voidMatrixMulKernel(MatrixAd,MatrixBd,MatrixXd){inttx=threadIdx.x;intty=threadIdx.y;intbx=blockIdx.x;intby=blockIdx.y;floatsum=0;for(intk=0;k我很想知道Ad和Bd是不是我想的那样,看看是否真的调用了那个函数。 最佳答案 CU

c++ - 如何使用 "Tool Tips"捕获屏幕?

我正在使用GDI捕获屏幕,我注意到屏幕截图中没有包含“工具提示”。这是我的基本代码:HDChdcDesk=GetDC(0);HDChdcMem=CreateCompatibleDC(hdcDesk);HBITMAPhbmMem=CreateCompatibleBitmap(hdcDesk,1920,1080);SelectObject(hdcMem,hbmMem);StretchBlt(hdcMem,0,0,1920,1080,hdcDesk,0,0,1920,1080,SRCCOPY);//Nowsavethebitmap...这可以解决吗,还是我应该使用其他方法来捕获屏幕(GDI除

c++ - 如何使用 "Tool Tips"捕获屏幕?

我正在使用GDI捕获屏幕,我注意到屏幕截图中没有包含“工具提示”。这是我的基本代码:HDChdcDesk=GetDC(0);HDChdcMem=CreateCompatibleDC(hdcDesk);HBITMAPhbmMem=CreateCompatibleBitmap(hdcDesk,1920,1080);SelectObject(hdcMem,hbmMem);StretchBlt(hdcMem,0,0,1920,1080,hdcDesk,0,0,1920,1080,SRCCOPY);//Nowsavethebitmap...这可以解决吗,还是我应该使用其他方法来捕获屏幕(GDI除