我正在测试最新版本的英特尔daal4py分类器与sklearn兼容的包装器。英特尔k-最近分类器可以很好地工作在sklearn的cross_val_score()和GridSearchCV中。英特尔分类器的性能提升是显著的,而英特尔和sklearn模型在10个不同的大型公共数据集和一些模拟数据集上提供了一般可比较的结果。用于英特尔随机林分类器的与sklearn兼容的包装器似乎完全崩溃了。score()方法不起作用,因此我不能继续使用intel随机森林包装器类。
我在英特尔人工智能开发者论坛上发布了这篇文章,但我想知道这里是否有人让英特尔滑板兼容的随机森林分类器起作用了。
我的下一步是测试本机daal4py随机森林对象,并可能编写自己的包装器,因为本机daal4py api与sklearn非常不同。我希望能避免这种情况。关于包装器类的名称,英特尔网站上似乎有些混乱。
我正在使用:
K-最近的daal4py.sklearn.neighbors.kdtree_knn_classifier:
英特尔RandomForestClassifier中的失败是在forest.py中,因为n_classes_是一个int。n_classes_匹配传递的标签变量的类数。label变量是一个整数。
predictions = [np.zeros((n_samples, n_classes_[k]))
for k in range(self.n_outputs_)]发布于 2019-10-10 06:26:58
下面是我们为daal4py RandomForestClassifier计算分数的步骤
(i)用于cross_val_score
from daal4py.sklearn.ensemble.decision_forest import RandomForestClassifier
from sklearn.model_selection import cross_val_score
clf = RandomForestClassifier()
scores = cross_val_score(clf, train_data, train_labels, cv=3)
print(scores)(Ii)用于GridSearchCV
from sklearn.model_selection import GridSearchCV
from daal4py.sklearn.ensemble.decision_forest import RandomForestClassifier
param_grid = {
'n_estimators': [200, 700],
'max_features': ['auto', 'sqrt', 'log2']
}
clf = RandomForestClassifier()
CV_rfc = GridSearchCV(estimator=clf, param_grid=param_grid, cv= 5)
CV_rfc.fit(train_data, train_labels)
score=CV_rfc.score(train_data, train_labels)https://stackoverflow.com/questions/58250560
复制相似问题