我想使用spark构建模型(特别是决策树),然后使用纯python (而不是pyspark)应用程序来应用它们
似乎PMML导出是预期的方法,但是树模型还不支持它,而且我还没有找到正在开发中的用于python的PMML库
发布于 2015-09-15 14:02:29
不再开发的是奥古斯都,在https://code.google.com/p/augustus/。最近,已经有一些工作在https://github.com/alex-pirozhenko/sklearn-pmml上支持scikitlearn pmml导入/导出,这可能是一种选择。
正如@zero323所指出的,PMML导出仅适用于某些型号。对于其他模型,如果您的目标是一个特定的服务平台,您可以编写自己的自定义导出代码或编写自己的解析代码(对于决策树是以自定义拼接格式写出的)。
https://stackoverflow.com/questions/32574143
复制相似问题