首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >英特尔daal4py分类器与scikit学习

英特尔daal4py分类器与scikit学习
EN

Stack Overflow用户
提问于 2019-10-05 17:06:07
回答 1查看 177关注 0票数 0

我正在测试最新版本的英特尔daal4py分类器与sklearn兼容的包装器。英特尔k-最近分类器可以很好地工作在sklearn的cross_val_score()和GridSearchCV中。英特尔分类器的性能提升是显著的,而英特尔和sklearn模型在10个不同的大型公共数据集和一些模拟数据集上提供了一般可比较的结果。用于英特尔随机林分类器的与sklearn兼容的包装器似乎完全崩溃了。score()方法不起作用,因此我不能继续使用intel随机森林包装器类。

我在英特尔人工智能开发者论坛上发布了这篇文章,但我想知道这里是否有人让英特尔滑板兼容的随机森林分类器起作用了。

我的下一步是测试本机daal4py随机森林对象,并可能编写自己的包装器,因为本机daal4py api与sklearn非常不同。我希望能避免这种情况。关于包装器类的名称,英特尔网站上似乎有些混乱。

我正在使用:

K-最近的daal4py.sklearn.neighbors.kdtree_knn_classifier:

  • (这很好)随机森林的
  • :daal4py.sklearn.ensemble.decision_forest.RandomForestClassifier

英特尔RandomForestClassifier中的失败是在forest.py中,因为n_classes_是一个int。n_classes_匹配传递的标签变量的类数。label变量是一个整数。

代码语言:javascript
复制
predictions = [np.zeros((n_samples, n_classes_[k]))
                for k in range(self.n_outputs_)]
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-10-10 06:26:58

下面是我们为daal4py RandomForestClassifier计算分数的步骤

(i)用于cross_val_score

代码语言:javascript
复制
from daal4py.sklearn.ensemble.decision_forest import RandomForestClassifier
from sklearn.model_selection import cross_val_score
clf = RandomForestClassifier()
scores = cross_val_score(clf, train_data, train_labels, cv=3)
print(scores)

(Ii)用于GridSearchCV

代码语言:javascript
复制
from sklearn.model_selection import GridSearchCV
from daal4py.sklearn.ensemble.decision_forest import RandomForestClassifier
param_grid = { 
    'n_estimators': [200, 700],
    'max_features': ['auto', 'sqrt', 'log2']
}
clf = RandomForestClassifier()
CV_rfc = GridSearchCV(estimator=clf, param_grid=param_grid, cv= 5)
CV_rfc.fit(train_data, train_labels)
score=CV_rfc.score(train_data, train_labels)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58250560

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档