作为背景,
A20 = s0,B8 = s1,I= s4和j= s5
所以一个同学帮了我这个忙,得到了:
lw t0,80(s0)
add t0, t0,s4
Sub t0,t0,s5
sw to,32(s1)难道不是更好/可能有:
lw t0,80(s0)
sub t1,s4,s5 for i - j
add t2, t0,t1 for A[20] + (i-j)
sw t2, 32(s1) 现在我不知道我所认为的答案是否正确,但希望我走在正确的轨道上。
发布于 2021-03-04 04:26:58
这些基本情况如下:
val = a[20]
val = val + i
val = val - j
b[8] = val与
val = a[20]
diff = i - j
result = val + diff
b[8] = result这两种方法都应该完成相同的任务,并在相同数量的指令中这样做。
您的版本减去i-j,然后将差异添加到a[20]中,然后将其存储在b[8]中。您的同学的版本添加了a[20]和i,然后从该总和中减去j,然后将结果存储在b[8]中。这基本上只是做同样的事情的不同的顺序。
不过,你同学的版本确实使用较少的寄存器。这本身并不能使它变得更好,但是因为这个原因,有人可能会认为它更好。
发布于 2021-03-04 18:44:26
您的版本更好,原因如下:
(A + i) -j可能会溢出:(a+i)-j可能溢出,当A+(i-j)不一定会溢出时(并且看到1,这里的原表达式表示它的行为相同),在下一个循环中不使用t0的负载,因此负载--使用延迟被覆盖--它实际上将比替代的运行一个周期快。
让我们注意到,sub和add指令会捕获溢出。在溢出是感兴趣还是重要的问题中没有说明。要完全忽略溢出,请使用subu和addu。
https://stackoverflow.com/questions/66468439
复制相似问题