首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >哪种更好些呢?mask_compress +商店或mask_compressstoreu

哪种更好些呢?mask_compress +商店或mask_compressstoreu
EN

Stack Overflow用户
提问于 2021-09-19 23:52:31
回答 1查看 50关注 0票数 1

我正在使用sde (英特尔的模拟器)来运行avx512代码,并且没有实际的硬件来进行基准测试。

由于某些原因,我找不到关于compress + store和compressstore之间的性能比较的信息。

compress + store将存储整个寄存器,而不仅仅是选定的元素,但我对此没有意见。而压缩存储必须屏蔽未选择的元素。

哪个更好?据我所知,英特尔的网站上没有延迟信息。

EN

回答 1

Stack Overflow用户

发布于 2021-09-20 00:13:57

我看错了地方:压缩指令只适用于epi32,而且这些指令有延迟:

_mm256_mask_compress_epi32的延迟是6,_mm256_mask_compressstoreu_epi32的延迟是11,其他的似乎需要VBMI2,这些在我的目标上是不可用的。

所以看起来compress + store应该更好。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69247880

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档