我正试图为支持向量机编写代码。我的目的是预测每周标普股票的股价。我用苹果每周的y_train股价,而我的x_train是市场价格和两个法玛-法国因素。
在我遇到的代码末尾:
未知标签类型:“连续”。
我不知道问题出在哪里。你能帮上忙吗?这是我的代码:
import pandas as pd
import numpy as np
import sklearn
from sklearn import svm
from sklearn import metrics
data = pd.read_csv('combine_weekly.csv',sep=',')
data= data[['return_app','return_sp','SMB','HML']]
predict='return_app'
x= np.array(data.drop([predict],1))
y= np.array(data[predict])
x_train, x_test, y_train, y_test =
sklearn.model_selection.train_test_split(x,y,test_size=0.2)
clf = svm.SVC(kernel= 'linear', C= 4)
clf.fit(x_train, y_train). <<<<< >>>*** here I get the error ***
y_pred = clf.predict(x_test )
acc= metrics.accuracy_score(y_test, y_pred)
print(acc)发布于 2020-04-24 06:07:27
您的标签是连续数字(如1、2、3.5、4.2、5.6等),它们可以作为回归问题处理。虽然您使用的是svm.SVC,它是一个分类器(在这里,我们将类作为“水果”、“蔬菜”等标签,而不是像您这样的实数)&而不是回归者。您可以选择LinearRegression、XGBRegressor等来解决这个问题。
https://stackoverflow.com/questions/61402024
复制相似问题