作者:Devil灬旋律 | 来源:互联网 | 2023-05-27 11:04
我正在使用SSE内在函数来确定矩形(由四个int32
值定义)是否已更改:
__m128i oldRect; // contains old left, top, right, bottom packed to 128 bits
__m128i newRect; // contains new left, top, right, bottom packed to 128 bits
__m128i xor = _mm_xor_si128(oldRect, newRect);
此时,xor
如果矩形未更改,则结果值将全为零.那么最有效的方法是什么呢?
目前我这样做:
if (xor.m128i_u64[0] | xor.m128i_u64[1])
{
// rectangle changed
}
但我认为有一种更聪明的方法(可能使用了一些我还没有找到的SSE指令).
我在x64上定位SSE4.1,我在Visual Studio 2013中编写C++.
1> Paul R..:
您可以通过_mm_testz_si128内在函数(SSE4.1)使用PTEST instuction ,如下所示:
#include "smmintrin.h" // SSE4.1 header
if (!_mm_testz_si128(xor, xor))
{
// rectangle has changed
}
请注意,_mm_testz_si128
如果AND
两个参数的按位为零,则返回1 .
2> stgatilov..:
具有讽刺意味的是,在某些情况下ptest
,SSE 4.1的指令可能比pmovmskb
SSE2 慢.我建议简单地使用:
__m128i cmp = _mm_cmpeq_epi32(oldRect, newRect);
if (_mm_movemask_epi8(cmp) != 0xFFFF)
//registers are different
请注意,如果您确实需要该xor
值,则必须单独计算它.
对于像Ivy Bridge这样的英特尔处理器,PaulR的版本使用xor
并_mm_testz_si128
转换为4 uop ,而没有计算的建议版本xor
转换为3 uop(另请参见此主题).这可能会提高我的版本的吞吐量.