首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >机器学习模型持久性选项

机器学习模型持久性选项
EN

Stack Overflow用户
提问于 2014-02-13 12:12:42
回答 3查看 2.4K关注 0票数 5

对于坚持和重复使用经过训练的机器学习模型有什么建议/最佳实践吗?我正在用Python或R开发模型,那么这些模型必须在生产工作流中用于评分(在没有R的情况下)。例如,在R.中可以有一个logistic回归模型,现在需要对这个模型进行新的观察。评分引擎必须是快速和可伸缩的。我想过要跟著

  1. PMML (语言)。将R中的大多数模型转换成pmml是很容易的。然而,我找不到一个有用的PMML模型评分引擎。例如,有奥古斯都(https://code.google.com/p/augustus/),但它实现的模型只有3-4个。
  2. 在Python中使用泡菜序列化模型,用Python编写使用者。

对正确的方法有什么想法或建议吗?

EN

回答 3

Stack Overflow用户

发布于 2014-02-13 12:24:50

Scikit-学习是该领域的一个成熟库,它使用模型持续存在的泡菜。我想您正在编写自己的函数来训练模型,但是查看已建立的库可以告诉您最佳实践。

另一方面,JSON可以从多种语言中读取。这是它的主要优势。如果您为模型服务的计划来自另一种语言,而且您的模型是相当简单的Python对象,那么将它们序列化为JSON应该非常容易。

票数 2
EN

Stack Overflow用户

发布于 2017-09-20 05:59:20

您可以在python中使用泡菜保存和加载模型,如下所示,

代码语言:javascript
复制
import pickle
s = pickle.dumps(clf)
clf2 = pickle.loads(s)

另一种方法是在内部携带大型numpy数组的对象上使用joblib,这是更有效的方法,就像安装的scikit学习估计器的情况一样。

代码语言:javascript
复制
from sklearn.externals import joblib
joblib.dump(clf, 'filename.pkl')
clf = joblib.load('filename.pkl') 

然后,这个模型可以作为RESTful API部署到生产中。

票数 0
EN

Stack Overflow用户

发布于 2020-05-17 13:28:34

你可以用信息包。它使用类似于JSON的格式来存储模型。速度快,占用的内存也少。味精包

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21753928

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档