文章/答案/技术大牛

发布

社区首页 >问答首页 >格式化SKmultilearn中使用的数据

问格式化SKmultilearn中使用的数据
EN

Data Science用户

提问于 2018-04-20 13:44:57

回答 1查看 491关注 0票数 0

我有一个X值的数据，还有一个我认为是正确格式的y值。我取了一个特征y，并将它转换为假人，所以它是二进制的，是m行n个特性。

from sklearn.model_selection import train_test_split

X = df.drop('target',axis=1)
y = pd.get_dummies(df['target'], sparse=True, drop_first=True)

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=99, train_size=0.60

我一直在试图从文档中找出确切的数据，但没有多少运气。

我首先尝试了以下几点：

import skmultilearn.problem_transform import BinaryRelevance
from sklearn.naive_bayes import GaussianNB

classifier = BinaryRelevance(GaussianNB())
classifier.fit(X_train, y_train)

其中X，y的火车是熊猫的数据。这将导致以下错误：

TypeError: no suppoerted conversion for types: (dytype('O'),)

然后我转换成矩阵：

X_train = X_train.asmatrix()
y_train = y_train.asmatrix()

我也收到了同样的错误。然后我试着

X_train = np.matrix(X_train)
y_train = np.matrix(y_train)

又犯了同样的错误。是否有一个简单的方法从数据到适当的格式为skmultilearn模型？

python

scikit-learn

multilabel-classification

data-formats

回答 1

Data Science用户

回答已采纳

发布于 2018-04-23 22:52:33

有些功能是绝对的，所以必须转换成整数。

然后，我运行这个程序以获得正确格式的数据：

import scipy.sparse as sp
X_train = sp.csr_matrix(X_train)
y_train = sp.csr_matrix(y_train)

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/30573

复制

相似问题

问格式化SKmultilearn中使用的数据
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问格式化SKmultilearn中使用的数据EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问格式化SKmultilearn中使用的数据
EN