注:OneR: 1 (SO); mlr: 2 (Github); ranger: 4 (Github); SuperLearner: 5 (Github) 该排名基于 CRAN ( The Comprehensive 一些包则只在 Github 中发挥强大功能: mlr 和 SuperLearner 是另外两个元包(meta-package),为 caret 提供类似的符号插入的功能,ranger 提供了随机森林(random
idx = np.random.permutation(150) X = data.data[idx] y = data.target[idx] from mlens.ensemble import SuperLearner fitting # the scorer should be a simple function accepting to vectors and returning a scalar ensemble = SuperLearner
集成学习常见的集合学习算法有随机森林(Random Forests)、XGBoost和SuperLearner,这些算法将在下文中介绍。 一个算法家族的例子是SuperLearner,它已被应用于流行病学研究问题。 SuperLearner使用交叉验证来估计几个描述性和预测性ML模型的性能,或者在同一模型中使用不同的设置,并且在模型拟合过程中与使用的最佳预测算法一样渐进地准确工作。 其他研究使用SuperLearner进行死亡风险预测。 例如,一项研究使用教养设施的特征和囚犯的总体特征来预测监狱暴力,用SuperLearner评估囚犯对囚犯的攻击次数,但未能达到高水平的准确性。
from mlens.ensemble import SuperLearner # Instantiate the ensemble with 10 folds sl = SuperLearner(
caret—R语言150个机器学习算法的统一接口 SuperLearner and subsemble—该包集合了多种机器学习算法 Introduction to Statistical Learning
caret—R语言 150 个机器学习算法的统一接口 SuperLearner and subsemble—该包集合了多种机器学习算法 Introduction to Statistical Learning
目前用于估计 PS 值的方法有 logistic 回归,Probit 回归、神经网络、支持向量机、分类与回归数、Boosting 算法、SuperLearner 等。