由于我只能使用SSE和SSE2指令的限制,我需要用另一个vector中的0元素替换4元素__m128ivector的最低有效(0)元素。对于浮点vector,任务很简单——可以使用_mm_move_ss()内在函数将元素替换为另一个vector中的0元素。它生成一条movss指令,因此效率很高。使用两个转换内在函数,还可以说服编译器使用单个SSEmovss指令来移动整数数据。源代码最终看起来像这样:__m128iNewVector=_mm_castps_si128(_mm_move_ss(_mm_castsi128_ps(Take3FromThisVector),_mm_castsi1