首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >格式化SKmultilearn中使用的数据

格式化SKmultilearn中使用的数据
EN

Data Science用户
提问于 2018-04-20 13:44:57
回答 1查看 491关注 0票数 0

我有一个X值的数据,还有一个我认为是正确格式的y值。我取了一个特征y,并将它转换为假人,所以它是二进制的,是m行n个特性。

代码语言:javascript
复制
from sklearn.model_selection import train_test_split

X = df.drop('target',axis=1)
y = pd.get_dummies(df['target'], sparse=True, drop_first=True)

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=99, train_size=0.60

我一直在试图从文档中找出确切的数据,但没有多少运气。

我首先尝试了以下几点:

代码语言:javascript
复制
import skmultilearn.problem_transform import BinaryRelevance
from sklearn.naive_bayes import GaussianNB

classifier = BinaryRelevance(GaussianNB())
classifier.fit(X_train, y_train)

其中X,y的火车是熊猫的数据。这将导致以下错误:

代码语言:javascript
复制
TypeError: no suppoerted conversion for types: (dytype('O'),)

然后我转换成矩阵:

代码语言:javascript
复制
X_train = X_train.asmatrix()
y_train = y_train.asmatrix()

我也收到了同样的错误。然后我试着

代码语言:javascript
复制
X_train = np.matrix(X_train)
y_train = np.matrix(y_train)

又犯了同样的错误。是否有一个简单的方法从数据到适当的格式为skmultilearn模型?

EN

回答 1

Data Science用户

回答已采纳

发布于 2018-04-23 22:52:33

有些功能是绝对的,所以必须转换成整数。

然后,我运行这个程序以获得正确格式的数据:

代码语言:javascript
复制
import scipy.sparse as sp
X_train = sp.csr_matrix(X_train)
y_train = sp.csr_matrix(y_train)
票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/30573

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档