在我们的R模型中发布Azure ML Web服务和预装数据时,我们看到性能不一致。第一次呼叫速度很慢,但接下来的呼叫速度很快,等待下一次呼叫的等待时间会延长。
发布于 2016-06-22 12:52:42
Azure ML Web服务在后台的工作方式意味着在一个非常动态的多租户环境中提供和移动承载模型的实例。缓存数据(热身)可能很有帮助,但这并不意味着所有后续调用都将以缓存中可用的相同数据在同一个实例上。
对于需要大量内存数据的模型,Azure ML Web服务托管层在这一点上所能提供的内容是有限的。Microsoft服务器可以替代托管这些大型ML工作负载并查看Service以进行扩展
https://stackoverflow.com/questions/37943572
复制相似问题