我正在尝试Python而不是R来进行数据分析,并且遇到了一些麻烦。因此,我一直在阅读scikit的文档,并尝试自己运行他们的kmeans示例,但是得到了以下错误信息:
使用稀疏向量器跟踪从训练数据集中提取特征(最近一次调用): 文件"kmeans.py",第104行,在X= vectorizer.fit_transform(dataset.data)中 文件"/Library/Python/2.7/site-packages/scikit_learn-0.15_git-py2.7-macosx-10.9-intel.egg/sklearn/feature_extraction/text.py",第1238行,在fit_transform返回self._tfidf.transform(X,copy=False)中 文件"/Library/Python/2.7/site-packages/scikit_learn-0.15_git-py2.7-macosx-10.9-intel.egg/sklearn/feature_extraction/text.py",第1010行,转换为X=规范化(X,norm=self.norm,copy=False) 文件"/Library/Python/2.7/site-packages/scikit_learn-0.15_git-py2.7-macosx-10.9-intel.egg/sklearn/preprocessing/data.py",第542行,以规范化inplace_csr_row_normalize_l2(X)表示 文件"sparsefuncs.pyx",第146行,在sklearn.utils.sparsefuncs.inplace_csr_row_normalize_l2中(sklearn/utils/sparsefuncs.c.c:2714) ValueError:缓冲区类型错配,期望'int‘,但得到’长‘
作为参考,代码如下:clustering.html
我花了一点功夫才得到整个copy堆栈,但我确信我现在已经有了,只是想知道为什么复制粘贴他们的代码然后运行它会产生一个错误(我肯定他们不会在他们的站点上放置带有bug的代码)。知道修复是什么/发生了什么吗?
发布于 2014-11-26 10:47:27
你是怎么安装枕木堆栈的?我强烈建议您不要尝试自己组装堆栈,因为这样做很有挑战性。我宁愿强迫你使用anaconda https://store.continuum.io/cshop/anaconda/。
免责声明: 1)这些人我不工作。2)蟒蛇有一个免费的版本。好。
发布于 2014-12-10 14:06:50
一种有用的方法是安装Anaconda和PyCharm或Eclipse。将您的整数从IDE指向Anaconda lib。有关更多指南,请参阅此链接:integration.html。另外,用"conda update“和"anaconda update”从shell中更新pkgs (包括scikit )也是非常容易的。
https://stackoverflow.com/questions/22776195
复制相似问题