我是PMML的新手:预测模型标记语言(www.dmg.org),我想知道是否有某种类型的Java (开源/专业)来创建/解析PMML文件。
最初,我只想到了从Java环境以编程方式创建/解析PMML文件的可能性。
我一直在“谷歌搜索”,我发现了几种可能性:
开放来源:
来自爪哇。
专业的。
DIY
我感谢你所有的意见。
提前感谢
奥斯卡
发布于 2014-05-31 20:35:40
您应该认识到,答案可能取决于您想要使用的模型元素。创建PMML和解析PMML的最佳选择也很可能来自不同的软件包。我将假设“创建PMML”指的是文档而不是模型。我从未听说过有人将自动模型与执行相结合,但也许它已经存在了。当然,可以使用SOAP传递PMML模型。
我无法与其他项目交谈,但泽曼提斯提供的产品(称为阿帕 )仅用于PMML的执行。此产品假设有一个模型拟合应用程序,它将通过将拟合模型导出到PMML来完成创建。已经有很多很好的模型拟合应用,所以我认为这是一个合理的假设。
我所使用的版本(3.6)通常是快速的,但是如果没有一个特别大的堆,它无法处理典型随机森林大小(500+树)的集合。我想他们可能已经用更新的版本修复了这个问题。虽然它没有广告,泽曼提斯似乎没有提供一些模型,即文本模型,序列,基线模型,或时间序列( PMML标准目前只有指数平滑)。我的版本也没有K近邻,但我听说最近的版本也有。
除非您正在考虑集成的拟合和执行(在这种情况下,您应该考虑在线学习),我的建议是考虑以下问题:
如果您查看DMG组的成员列表,您会发现许多商业供应商要么在供应方,要么在供应方(例如。SAS,SPSS,to,Rapid或需求侧(这么多要列出).
在您的列表中,您也没有提到Weka,而是提到了他们还执行了一些PMML模型。,并且有基于R/Java的解决方案,因此您可以在Java环境中执行PMML->R imports (see fileToXMLNode) (但也可以只执行R)。
最后,如果您心中有一个非常具体的模型,并且从数学上理解‘执行它’意味着什么,那么构建自己需要的东西应该不会太困难。
https://stackoverflow.com/questions/7280845
复制相似问题