文章/答案/技术大牛

发布

社区首页 >问答首页 >Sklearn:如何将数据馈送到sklearn RandomForestClassifier

问Sklearn:如何将数据馈送到sklearn RandomForestClassifier
EN

Stack Overflow用户

提问于 2013-04-08 03:31:58

回答 2查看 6.9K关注 0票数 4

我有这样的数据：

print training_data
print labels

# prints

[[1, 0, 1, 1], [1, 1, 1, 1], [1, 0, 1, 1], [1, 1, 1, 0], [1, 1, 0, 1], [1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 0,0], [1, 1, 1, 1], [1, 0, 1, 1]]
['a', 'b', 'a', 'b', 'a', 'b', 'b', 'a', 'a', 'a', 'b']

我正试着把它从sklearn python库提供给一个RandomForestClassifier。

classifier = RandomForestClassifier(n_estimators=10)
classifier.fit(training_data, labels)

但是会收到这个错误：

Traceback (most recent call last):
  File "learn.py", line 52, in <module>
    main()
  File "learn.py", line 48, in main
    classifier = train_classifier()
  File "learn.py", line 33, in train_classifier
    classifier.fit(training_data, labels)
  File "/Library/Python/2.7/site-packages/scikit_learn-0.14_git-py2.7-macosx-10.8-intel.egg/sklearn/ensemble/forest.py", line 348, in fit
    y = np.ascontiguousarray(y, dtype=DOUBLE)
  File "/Library/Python/2.7/site-packages/numpy-1.8.0.dev_bbcfcf6_20130307-py2.7-macosx-10.8-intel.egg/numpy/core/numeric.py", line 419, in ascontiguousarray
    return array(a, dtype, copy=False, order='C', ndmin=1)
ValueError: could not convert string to float: a

我的猜测是，我没有正确地格式化此数据以进行拟合。但是我不明白为什么从the documentation

这似乎是一个非常基本、简单的问题。有人知道答案吗？

python

scikit-learn

random-forest

回答 2

Stack Overflow用户

发布于 2013-04-08 03:44:48

尝试使用LabelEncoder预先转换标签。

票数 7

Stack Overflow用户

发布于 2015-05-28 00:01:31

您可以使用由分类器自动识别的numpy数组，如下所示：

import numpy as np
from sklearn.ensemble import RandomForestClassifier
np_training = np.array(training_data)
np_labels = np.array(labels)

clf = RandomForestClassifier(n_estimators=20, max_depth=5)
clf.fit(np_training, np_labels)

这应该是可行的

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/15866843

复制

相似问题

问Sklearn:如何将数据馈送到sklearn RandomForestClassifier
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Sklearn:如何将数据馈送到sklearn RandomForestClassifierEN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Sklearn:如何将数据馈送到sklearn RandomForestClassifier
EN