很抱歉,如果这个问题已经在某个地方得到了答复,但我已经找了一个小时了,却找不到一个好的答案。
我有一个简单的Logistic回归模型,在Scikit中进行了培训--了解我正在导出到一个.pmml文件。
from sklearn2pmml import PMMLPipeline, sklearn2pmml
my_pipeline = PMMLPipeline(
( classifier", LogisticRegression() )
)
my_pipeline.fit(blah blah)
sklearn2pmml(my_pipeline, "filename.pmml")等等..。
因此,我想知道的是,是否/如何将该文件导入Python (最好是2.7)或Scikit--学习如何使用Java/Scala。与…有关的东西
"import (filename.pmml) as pm pm.predict(data)
谢谢你的帮助!
发布于 2017-09-16 17:24:53
Scikit-学习不提供对导入PMML文件的支持,所以恐怕无法实现您想要实现的目标。
使用库(如sklearn2pmml )的概念实际上是扩展sklearn在支持模型导出到PMML格式时所没有的功能。
通常,那些使用sklearn2pmml的用户实际上是在其他平台(例如IBM的SPSS、Apache SPSS、Apache Spark、Weka或数据挖掘集团网站上的任何其他消费者如表所示 )中重新使用PMML模型。
如果您希望保存一个使用scikit创建的模型--学习,然后再与scikit一起重用它--那么您应该探索它的本地持久性模型机制,名为Pickle,它使用二进制数据格式。
您可以阅读更多关于如何以Pickle格式保存/加载模型(以及它的已知问题) 这里。
发布于 2019-05-20 13:47:55
我创建了一个简单的解决方案来从pmml文件中生成sklearn kmeans模型,我从knime分析平台导出了这些文件。你可以检查一下pmml2sklearn
发布于 2019-07-25 04:29:44
例如,可以使用PyPMML使用Python中的PMML对新的数据集进行预测:
from pypmml import Model
model = Model.fromFile('the/pmml/file/path')
result = model.predict(data)数据可以是dict,json,Series或DataFrame的潘达斯。
https://stackoverflow.com/questions/46255229
复制相似问题