我需要比较大量相似的小尺寸图片(最大200x200)。所以我尝试实现SSIM(结构相似性参见https://en.wikipedia.org/wiki/Structural_similarity)算法。SSIM需要计算两个8位灰度图像的协方差。一个简单的实现如下所示:floatSigmaXY(constuint8_t*x,constuint8_t*y,size_tsize,floataverageX,floataverageY){floatsum=0;for(size_ti=0;i但是性能很差。所以我希望用SIMD或者CUDA来改进一下(听说可以)。不幸的是,我没有这样做的经验。它看起