我正在Python上做一些机器学习任务。我需要构建RandomForest,然后构建一个图表,它将显示训练和测试样本的质量如何取决于随机森林中的树数。每一次都有必要用一定数量的树木建造一个新的随机森林吗?或者我可以以迭代的方式添加树(如果可能的话,你能给出代码的例子-怎么做)?
发布于 2015-08-04 14:13:27
您可以使用warm start参数的RandomForestClassifier来做到这一点。
下面是一个您可以适应特定需求的示例:
errors = []
growing_rf = RandomForestClassifier(n_estimators=10, n_jobs=-1,
warm_start=True, random_state=1514)
for i in range(40):
growing_rf.fit(X_train, y_train)
growing_rf.n_estimators += 10
errors.append(log_loss(y_valid, growing_rf.predict_proba(X_valid)))
_ = plt.plot(errors, '-r')我得到的是:

https://stackoverflow.com/questions/31808821
复制相似问题