nvidia-cuda-toolkit

c++ - 如何使用 CUDA c++ 将 vector 乘以矩阵

很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visitthehelpcenter.关闭10年前。任何人都可以帮助我，我如何使用CUDAc++将vector(1*N)和矩阵(N*M)相乘并将结果存储在新vector(1*M)上。

c++ - CUDA 对 CPU 和 GPU 具有相同的功能

这个问题在这里已经有了答案:CUDAfunctioncall-ablebyeitherthedeviceorhost(1个回答)关闭8年前。为了从主机代码和GPU内核调用相同的函数，我是否必须保留相同函数的两个拷贝，如下所示:intsum(inta,intb){returna+b;}__deviceintsumGPU(inta,intb){returna+b;}或者是否有任何技术可以保留/管理函数的单个拷贝？

c++ - Cuda C++ 中的简单文件 I/O

我现在正在研究CudaC++。但是我在使用CUDA读写文件时遇到了问题。如何在CudaC++中实现文件输入输出过程？我想将.obj文件读入我的Cuda内核。我该怎么办？最佳答案使用普通主机(C++)文件操作读取文件。如果需要，然后使用普通的cudaMalloc和cudaMemcpy操作将数据传输到设备。您无法直接在CUDAC++中实现文件I/O，因为没有用于此的API，而且GPU不直接连接到文件系统。您必须通过操作系统才能获得文件系统服务。关于c++-CudaC++中的简单文件I/

c++ - Cuda Hello World printf 即使使用 -arch=sm_20 也不工作

我不认为我是Cuda的新手，但显然我是。我最近将我的cuda设备升级到了1.3到2.1的一种功能(GeforceGT630)。我还想全面升级到Cuda工具包5.0。我可以编译通用的cuda内核，但即使设置了-arch=sm_20，printf也无法正常工作。代码:#include#include#include#include__global__voidtest(){printf("HiCudaWorld");}intmain(intargc,char**argv){test>>();return0;}编译器:Error2errorMSB3721:Thecommand""C:\Prog

c++ - 为什么我调用 CUDA 数学库 sqrt() 函数失败？

我是Cuda的新手，我有以下功能:__global__voidsquare(float*myArrayGPU){myArrayGPU[threadIdx.x]=sqrt(threadIdx.x);}我想使用cuda数学库，我尝试了#include"math.h"但我仍然遇到错误错误:不允许从__global__函数(“square”)调用__host__函数(“__sqrt”)知道我应该包含什么库来使用sqrt吗？最佳答案 threadIdx.x是int类型。CUDA数学库仅针对单精度(float)和double(double)重

c++ - CUDA，使用 memset(或 fill 或 ...)将 float 数组设置为 max val possible

编辑:感谢之前的回答。但实际上我想在CUDA中进行，显然CUDA没有Fill函数。我必须为每个线程填充一次矩阵，所以我想确保我使用的是最快的方法。这是我最好的选择吗？我想将float矩阵设置为可能的最大值(在float中)。做这项工作的正确方法是什么？float*matrix=newfloat[N*N];for(inti=0;i提前致谢。最佳答案 CUDA中最简单的方法是使用thrust::fill.Thrust包含在CUDA4.0及更高版本中，或者您可以installit如果您使用的是CUDA3.2。#include#inclu

c++ - X11 和 nVidia 驱动程序的奇怪 EGL 行为

我现在有一个奇怪的问题，我有这个使用GTK2、OpenGL和EGL的示例应用程序。我描述的奇怪行为只发生在带有官方nVidia驱动程序的Linux上的nVidiaGPU上。在程序中你看到一条注释，如果你在代码的这个点上不使用glFlush或glGetError，代码将不会绘制三角形，它只会显示红色(清晰的颜色)。如果您调用glGetError或glFlush，它会起作用。有人可以向我解释为什么会这样吗？这是代码:#include#include#include#include#includestaticEGLDisplayegl_display;staticEGLSurfaceegl_

c++ - 从 Nvidia PTX 访问 bool (C++11) 数组的可移植方法

我需要对boolean数组进行GPU计算bool[](注意，不是std::vector)它是在CPU内存中创建的(使用C++11代码)，然后通过cuMemCpy复制到GPU或类似的。第一个问题:sizeof(bool)报告1个字节。这是C++11标准保证的吗？第二个问题:是true(false)始终表示为1(0)(在unsignedchar表示中)还是编译器在这里有自由？(如果需要，它可以使用任何小于256的非零整数)第三个问题(特定于PTX):在PTX逻辑运算中or,xor等仅对大于8位的类型进行操作。那就是我可以对unsignedint进行逻辑运算与or.u32,,.但是自从C++

c++ - GLSL 着色器不适用于 AMD/ATI，但适用于 NVIDIA

我有一个非常奇怪的问题我不能pindown几天了。我正在制作一个简单的逐顶点照明，它在Nvidia上工作正常，但不会渲染任何带有灯光阴影的内容AMD/ATI.我找到了与属性有关的问题-特别是颜色属性。这是我的顶点着色器:#version140uniformmat4modelViewProjectionMatrix;invec3in_Position;//(x,y,z)invec4in_Color;//(r,g,b,a)invec2in_TextureCoord;//(u,v)outvec2v_TextureCoord;outvec4v_Color;uniformboolen_Color

c++ - CUDA/C++ - 链接错误 : undefined reference to

我是一名新手，正在寻求有关使用g++将一些已编译的CUDA目标代码链接到C++项目的帮助。之前有一些针对此帖子的问题和解决方案(here和here)，但没有一个对我有用，我似乎无法弄清楚原因。不幸的是，为此我一直在使用Windows。我尝试开始工作的简单示例如下所示://kernel.hintcuda_vec_add(float*h_a,float*h_b,float*h_c,intn);添加两个vector的CUDA代码。//kernel.cu#include__global__voidvec_add_kernel(float*a,float*b,float*c,intn){inti