我正在尝试学习更多关于SSE/SSE2如何工作的知识:我知道SSE/SSE2使用128位(16字节)大小的mmx寄存器,并且这些寄存器通常有4个浮点单元,我可以通过打包来存储浮点数。在得到结果之前,我应该“解包”。
我的问题是:既然我是菜鸟,为什么要将这些值打包到xmm寄存器中,又为什么要将它们解包?这样做的优势是什么?
发布于 2013-01-31 02:19:56
你不需要打包/解包它们。如果数字格式正确,您只需使用适当的移动指令将其加载到寄存器中,或使用内存操作数将内存内容用作加法、减法等的第二个操作数。
有时确实会发生的情况是,数据从计算中并没有到达它需要去的正确位置,这就是各种打包和解包指令派上用场的地方。
例如,假设您正在对此进行3D图形数学运算
struct coord { float X, Y, Z, W; };但是为了提高计算效率,我们一次加载四个这样的结构,其中X来自一个寄存器中的所有四个,Y来自另一个寄存器中的所有四个,依此类推。现在,例如,在我们将所有的X,Y,Z和W值一次四次与变换矩阵相乘以缩放/旋转对象后,我们需要再次将其存储为X,Y,Z和W,这是通过将适当的元素“解包”回其相应的X,Y,Z,<代码>D10W>单独条目来完成的。
当然,如果没有coord值的数组,而是存储了X、Y、Z和W值的四个数组,我们可以只将新值存储到数组中它们各自的槽中,而不需要打包/解包这些值。
发布于 2013-01-31 02:20:19
因为这些寄存器是SSE指令的输入/输出。
https://stackoverflow.com/questions/14610749
复制相似问题