文章/答案/技术大牛

发布

问滑雪训练数据的预测
EN

Stack Overflow用户

提问于 2017-04-04 15:04:36

回答 1查看 805关注 0票数 0

我使用scikit-learn的支持向量机如下所示：

clf = svm.SVC()
clf.fit(td_X, td_y)

我的问题是，当我使用分类器来预测训练集成员的类时，即使在scikit学习实现中，分类器是否也会出错。(例如，clf.predict(td_X[a])==td_Y[a])

python

machine-learning

scikit-learn

svm

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-04-04 15:14:03

是的，请运行下面的代码，例如：

from sklearn import svm
import numpy as np
clf = svm.SVC()
np.random.seed(seed=42)
x=np.random.normal(loc=0.0, scale=1.0, size=[100,2])
y=np.random.randint(2,size=100)
clf.fit(x,y)
print(clf.score(x,y))

评分为0.61，近40%的训练数据被错误分类。部分原因是，尽管默认内核是'rbf' (理论上它应该能够完美地分类任何训练数据集，只要您没有两个相同的训练点和不同的标签)，也有正则化来减少过度拟合。默认的正则化程序是C=1.0。

如果您运行与上面相同的代码，但将clf = svm.SVC()切换到clf = svm.SVC(C=200000)，那么您将获得0.94的精度。

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/43210970

复制

相似问题

问滑雪训练数据的预测
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问滑雪训练数据的预测EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问滑雪训练数据的预测
EN