我正在使用CUDA,我创建了一个int2_类来处理复杂的整数。ComplexTypes.h文件中的类声明如下:namespaceLibraryNameSpace{classint2_{public:intx;inty;//Constructors__host____device__int2_(constint,constint);__host____device__int2_();//etc.//Equalitieswithothertypes__host____device__constint2_&operator=(constint);__host____device__const
我正在尝试了解我的每个CUDA线程的资源使用情况,以用于手写内核。我使用nvcc-arch=sm_20-ptxas-options=-v将我的kernel.cu文件编译为kernel.o文件我得到了以下输出(通过c++filt):ptxasinfo:Compilingentryfunction'searchkernel(octree,int*,double,int,double*,double*,double*)'for'sm_20'ptxasinfo:Functionpropertiesforsearchkernel(octree,int*,double,int,double*,do
我正在尝试了解我的每个CUDA线程的资源使用情况,以用于手写内核。我使用nvcc-arch=sm_20-ptxas-options=-v将我的kernel.cu文件编译为kernel.o文件我得到了以下输出(通过c++filt):ptxasinfo:Compilingentryfunction'searchkernel(octree,int*,double,int,double*,double*,double*)'for'sm_20'ptxasinfo:Functionpropertiesforsearchkernel(octree,int*,double,int,double*,do