文档提供了以下示例:
>>> clf = svm.SVC(kernel='linear', C=1)
>>> scores = cross_validation.cross_val_score(
... clf, iris.data, iris.target, cv=5)
...
>>> scores
array([ 0.96..., 1. ..., 0.96..., 0.96..., 1. ])这些分数本身有什么用?有什么方法可以获得性能最好的模型的参数吗?
发布于 2015-09-15 05:59:56
如果要进行模型选择,您可能正在寻找另一种方法:grid_search.GridSearchCV,请参阅文档这里
更具体地说,cross_validation.cross_val_score只计算交叉验证的分数,这意味着您不改变模型的参数,您只改变了用于训练和测试模型的数据。
grid_search.GridSearchCV正在做的是为网格中的每个点计算一个交叉验证的分数,即每一组参数。这允许您选择最佳的参数集,即得分最高的参数集。
因此,在AGS答复中,clf将是:
clf = GridSearchCV(SVC(C=1), tuned_parameters, cv=5,
scoring='%s_weighted' % score)我认为这个例子与您想要做的非常相似。
https://stackoverflow.com/questions/32573659
复制相似问题