首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >比较SSE Intrinsics中的符号位

比较SSE Intrinsics中的符号位
EN

Stack Overflow用户
提问于 2011-12-09 11:39:33
回答 2查看 1.9K关注 0票数 2

如何使用SSE内部函数创建掩码,例如,如果比较a和b,其中a是1.0 -1.0 0.0 2.0,b是1.0 1.0 1.0,我们得到的掩码是true false true true。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-12-09 11:53:37

这里有一个解决方案:

代码语言:javascript
复制
const __m128i MASK = _mm_set1_epi32(0xffffffff);

__m128 a = _mm_setr_ps(1,-1,0,2);
__m128 b = _mm_setr_ps(1,1,1,1);

__m128  f = _mm_xor_ps(a,b);
__m128i i = _mm_castps_si128(f);

i = _mm_srai_epi32(i,31);
i = _mm_xor_si128(i,MASK);

f = _mm_castsi128_ps(i);

//  i = (0xffffffff, 0, 0xffffffff, 0xffffffff)
//  f = (0xffffffff, 0, 0xffffffff, 0xffffffff)

在这段代码中,if将具有相同的位掩码。我假设您想将其转换为__m128类型,所以我添加了f = _mm_castsi128_ps(i);以将其从__m128i转换回来。

请注意,此代码对零的符号敏感。所以0.0-0.0会影响结果。

说明:

代码的工作方式如下:

代码语言:javascript
复制
f = _mm_xor_ps(a,b);       //  xor the sign bits (well all the bits actually)

i = _mm_castps_si128(f);   //  Convert it to an integer. There's no instruction here.

i = _mm_srai_epi32(i,31);  //  Arithmetic shift that sign bit into all the bits.

i = _mm_xor_si128(i,MASK); //  Invert all the bits

f = _mm_castsi128_ps(i);   //  Convert back. Again, there's no instruction here.
票数 5
EN

Stack Overflow用户

发布于 2011-12-09 12:13:54

看看_mm_movemask_ps指令,它从4个浮点数中提取最高有效位(即符号位)。请参阅http://msdn.microsoft.com/en-us/library/4490ys29.aspx

例如,如果你有1.0 -1.0 0.0 2.0,那么movemask_ps将返回4,或者以二进制表示为0100。因此,如果您为每个向量获取movemask_ps并比较结果(可能不是按位异或),那么这将指示是否所有符号都相同。

代码语言:javascript
复制
a = [1.0 -1.0 0.0 2.0]
b = [1.0 1.0 1.0 1.0]
movemask_ps a = 4
movemask_ps b = 0
NOT (a XOR b) = 0xB, or binary 1011

因此,除了第二个向量元素之外,符号都是相同的。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8440764

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档