文章/答案/技术大牛

发布

社区首页 >问答首页 >load_files中的scikit学习不加载目录中的所有文件

问load_files中的scikit学习不加载目录中的所有文件
EN

Stack Overflow用户

提问于 2015-05-04 09:43:59

回答 1查看 2.2K关注 0票数 1

我有一个名为“电子邮件”的文件夹，两个子文件夹的名称与他们所拥有的文件的分类相对应的标签(垃圾邮件或非垃圾邮件，都是.txt文件)。这两个子文件夹中有3000个文件。使用load_files：

data = load_files('emails', shuffle='False')
print len(data)
print len(data.target)

这个打印'5‘然后'3000’。如果发现了3000种分类标签，数据的长度怎么可能只有5？

python

machine-learning

dataset

scikit-learn

classification

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-05-04 10:13:06

您的数据存储在data.data中，目标存储在data.target中。试一试print(len(data.data))。

load_files()只返回一个sklearn.datasets.base.Bunch，这是一个简单的数据包装器。因此，data的格式如下：

{
'DESCR': None,
 'data': [],
 'filenames': array(),
 'target': array(),
 'target_names': []
}

这就是为什么len(data)返回5的原因。

希望这能有所帮助！

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/30027027

复制

相似问题

问load_files中的scikit学习不加载目录中的所有文件
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问load_files中的scikit学习不加载目录中的所有文件EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问load_files中的scikit学习不加载目录中的所有文件
EN