草庐IT

c++ - AVX2 赢家通吃差异搜索

我正在使用AVX2优化视差估计算法的“赢家通吃”部分。我的标量例程是准确的,但在QVGA分辨率和48个视差下,我的笔记本电脑上的运行时间慢得令人失望,大约为14毫秒。我创建了LR和RL视差图像,但为了简单起见,我将只包含RL搜索的代码。我的标量例程:intMAXCOST=32000;for(inti=maskRadius;i我尝试使用AVX2:intMAXCOST=32000;int*dispVals=(int*)_mm_malloc(sizeof(int32_t)*16,32);for(inti=maskRadius;i视差空间图像(DSI)的大小为HxWxD(320x240x48)