VexCL似乎是一个非常有吸引力的gpu编程库。不幸的是,这是一个非常年轻的图书馆,那里的信息很少。我一直在寻找如何执行矩阵vector乘法,但我发现的唯一矩阵表示是vex::SpMat,它包含一个稀疏矩阵。如果矩阵是稠密的,那么通常情况下,稀疏表示的计算效率较低。我所有的矩阵都是密集的,我想知道如何在VexCL中有效地执行它。 最佳答案 我是VexCL的开发者图书馆。我不得不承认密集的线性代数运算不在我的优先列表中。我认为很难以一种在VexCL(即OpenCL/CUDA)支持的各种设备之间实现性能可移植的方式来实现它们。此任务可能