我目前正在处理一个图像数据集(25万个图像,因此与特征向量一样多,每个特征向量都由132个特性组成),并试图使用sklearn提供的KMeans函数。
我在MacOSX10.10、Python2.7和sklearn 0.15.2上运行它,过了一会儿我只获得了一个:
被害:9人
运行以下命令行时出错:
nb_cls = int(raw_input("Number of clusters chosen :"))
clusterer = sklearn.cluster.KMeans(n_clusters=nb_cls)
clusters_labels = clusterer.fit_predict(X)
silhouette = sklearn.metrics.silhouette_score(X, clusters_labels)
print "n clusters =", nb_cls, "/ silhouette_score =", silhouette请注意,白化计算的剪影分数,代码没有杀死
对于较小的数据集(±2500幅图像),同样的算法是有效的,并且没有类似的Python错误。
我怎样才能避免这个致命的9错误呢?这个计算对我的笔记本电脑来说是不是太雄心勃勃了?
发布于 2015-05-19 09:33:46
这意味着你的脚本被操作系统杀死了。在大多数情况下,这是因为它占用了太多的内存。在您的情况下,当您只使用2 500张图像时,您的代码可能工作得很好。
如果这是内存问题,您将不得不获得更多的RAM (在mac上是不可能的),使用另一台具有更多RAM的计算机,或者缩小数据集的大小。
https://stackoverflow.com/questions/30321683
复制相似问题