我有一个X值的数据,还有一个我认为是正确格式的y值。我取了一个特征y,并将它转换为假人,所以它是二进制的,是m行n个特性。
from sklearn.model_selection import train_test_split
X = df.drop('target',axis=1)
y = pd.get_dummies(df['target'], sparse=True, drop_first=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=99, train_size=0.60我一直在试图从文档中找出确切的数据,但没有多少运气。
我首先尝试了以下几点:
import skmultilearn.problem_transform import BinaryRelevance
from sklearn.naive_bayes import GaussianNB
classifier = BinaryRelevance(GaussianNB())
classifier.fit(X_train, y_train)其中X,y的火车是熊猫的数据。这将导致以下错误:
TypeError: no suppoerted conversion for types: (dytype('O'),)然后我转换成矩阵:
X_train = X_train.asmatrix()
y_train = y_train.asmatrix()我也收到了同样的错误。然后我试着
X_train = np.matrix(X_train)
y_train = np.matrix(y_train)又犯了同样的错误。是否有一个简单的方法从数据到适当的格式为skmultilearn模型?
发布于 2018-04-23 22:52:33
有些功能是绝对的,所以必须转换成整数。
然后,我运行这个程序以获得正确格式的数据:
import scipy.sparse as sp
X_train = sp.csr_matrix(X_train)
y_train = sp.csr_matrix(y_train)https://datascience.stackexchange.com/questions/30573
复制相似问题