首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Caret模型随机森林到PMML错误

Caret模型随机森林到PMML错误
EN

Stack Overflow用户
提问于 2014-12-12 01:21:57
回答 2查看 3.6K关注 0票数 3

我想使用pmml库导出一个Caret随机森林模型,这样我就可以在Java中使用它进行预测。这是我得到的错误的复制品。

代码语言:javascript
复制
data(iris)
require(caret)
require(pmml)
rfGrid2 <- expand.grid(.mtry = c(1,2))
fitControl2 <- trainControl(
  method = "repeatedcv",
  number = NUMBER_OF_CV, 
  repeats = REPEATES)

model.Test <- train(Species ~ .,
  data = iris,
  method ="rf",
  trControl = fitControl2,
  ntree = NUMBER_OF_TREES,
  importance = TRUE,  
  tuneGrid = rfGrid2)

print(model.Test)
pmml(model.Test)

Error in UseMethod("pmml") : 
  no applicable method for 'pmml' applied to an object of class "c('train', 'train.formula')"

我在谷歌上搜索了一段时间,发现关于导出到PMML的信息实际上很少。一般来说,pmml库中包含随机森林:

代码语言:javascript
复制
methods(pmml)
 [1] pmml.ada          pmml.coxph        pmml.cv.glmnet    pmml.glm          pmml.hclust       pmml.itemsets     pmml.kmeans      
 [8] pmml.ksvm         pmml.lm           pmml.multinom     pmml.naiveBayes   pmml.nnet         pmml.randomForest pmml.rfsrc       
[15] pmml.rpart        pmml.rules        pmml.svm 

它使用直接随机森林模型,但不是插入符号训练的模型。

代码语言:javascript
复制
library(randomForest)
iris.rf <- randomForest(Species ~ ., data=iris, ntree=20)
# Convert to pmml
pmml(iris.rf)
# this works!!!
str(iris.rf)

List of 19
 $ call           : language randomForest(formula = Species ~ ., data = iris, ntree = 20)
 $ type           : chr "classification"
 $ predicted      : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
...

str(model.Test)
List of 22
 $ method      : chr "rf"
 $ modelInfo   :List of 14
  ..$ label     : chr "Random Forest"
  ..$ library   : chr "randomForest"
  ..$ loop      : NULL
  ..$ type      : chr [1:2] "Classification" "Regression"
...
EN

回答 2

Stack Overflow用户

发布于 2014-12-12 04:08:05

不能使用traintrain.formula类型调用pmml方法(即,这是您的model.Test对象的类型)。

train方法的Caret文档指出,您可以访问作为finalModel字段的最佳模型。然后,您可以在该对象上调用pmml方法。

代码语言:javascript
复制
rf = model.Test$finalModel
pmml(rf)

不幸的是,事实证明,Caret使用“矩阵接口”指定RF模型(即。通过设置xy字段),而不是使用更常见的“公式界面”(即,通过设置formula字段)。AFAIK,"pmml“包不支持导出此类RF模型。

所以,看起来你最好的选择是使用两级方法。首先,使用Caret包为您的数据集找到最合适的RF参数化。其次,使用此参数化的“公式界面”手动训练最终的RF模型。

票数 5
EN

Stack Overflow用户

发布于 2015-02-20 17:17:14

您可以使用r2pmml package来完成此工作:

代码语言:javascript
复制
library("caret")
library("r2pmml")

data(iris)

train.rf = train(Species ~ ., data = iris, method = "rf")
print(train.rf)
r2pmml(train.rf, "/tmp/train-rf.pmml")
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/27428748

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档