草庐IT

c++ - VexCL 中的密集矩阵 vector 乘法

VexCL似乎是一个非常有吸引力的gpu编程库。不幸的是,这是一个非常年轻的图书馆,那里的信息很少。我一直在寻找如何执行矩阵vector乘法,但我发现的唯一矩阵表示是vex::SpMat,它包含一个稀疏矩阵。如果矩阵是稠密的,那么通常情况下,稀疏表示的计算效率较低。我所有的矩阵都是密集的,我想知道如何在VexCL中有效地执行它。 最佳答案 我是VexCL的开发者图书馆。我不得不承认密集的线性代数运算不在我的优先列表中。我认为很难以一种在VexCL(即OpenCL/CUDA)支持的各种设备之间实现性能可移植的方式来实现它们。此任务可能

c++ - VexCL、Thrust 和 Boost.Compute 的区别

只要粗略了解这些库,它们看起来就非常相似。我知道VexCL和Boost.Compute使用OpenCl作为后端(尽管v1.0版本的VexCL也支持CUDA作为后端),而Thrust使用CUDA。除了不同的后端,它们之间有什么区别。具体来说,他们解决了哪些问题空间以及我为什么要使用一个而不是另一个。此外,在推力常见问题解答中指出TheprimarybarriertoOpenCLsupportisthelackofanOpenCLcompilerandruntimewithsupportforC++templates如果是这样,VexCL和Boost.Compute怎么可能存在。