我一直在使用ML Studio (经典),但遇到了一个“执行Python”脚本的问题。我注意到执行一些内部任务需要额外的时间,之后它将开始在ML Studio中执行实际的Python代码。这种延迟导致每个模块的时间增加了40-60秒,当通过批处理执行系统消耗或手动运行实验时,该时间聚合并导致每次执行的延迟400-500秒。(我有多个模块的“执行Python”脚本)
例如,如果我在本地系统中运行一段代码,假设需要2-3秒。在Azure ML Studio中,这同样需要50-60秒的时间。
您能帮助理解这背后的原因或任何可以做的优化吗?
向您致敬,Anant
发布于 2020-07-02 21:07:48
Machine Learning Studio (经典)的已知限制是:
Python运行时被沙箱保护,不允许以持久方式访问网络或本地文件系统。
模块完成后,本地保存的所有文件都会被隔离并删除。Python代码不能访问运行它的机器上的大多数目录,只有当前目录及其子目录例外。
当您将压缩文件作为资源提供时,这些文件将从您的工作区复制到实验执行空间,解压缩,然后使用。复制和解包资源会消耗内存。
该模块可以输出单个数据帧。不可能将任意的Python对象(例如经过训练的模型)直接返回Studio (经典)运行时。但是,您可以将对象写入存储或工作区。另一种选择是使用pickle将多个对象序列化为一个字节数组,然后在数据帧内返回该数组。
希望这能有所帮助!
https://stackoverflow.com/questions/62696966
复制相似问题