我有一段代码是由其他人编写的,运行在TI TMS320命令法律加速器上。所以它在大小和速度上都进行了优化。
为了得到1/x,代码总是这样做。
float32 y = __meinvf32(x);
y = y * (2.0f - y*x);
y = y * (2.0f - y*x);我发现这条线提出了类似的建议,但在我的例子中,最后没有夹紧。
有人能帮我理解这背后的意图吗?
发布于 2020-07-23 20:01:30
Y=e+ 1/x,其中e是一些小误差。
因此,(2.0 - y*x)接近1.0,并且在每次传递时都有降低e的效果。
https://stackoverflow.com/questions/63062015
复制相似问题