我一直在Jupyter笔记本上做一个项目,想要使用重复数据删除。通过anaconda,windows机器上只有dedupe-hcluster可用,所以我安装了它,并尝试在笔记本中导入hcluster,这给出了这个错误:
"ImportError: DLL加载失败:%1不是有效的Win32应用程序。“
根据我所读到的,这意味着Python是32位而hcluster是64位,反之亦然。然而,我并不清楚如何解决这个问题。
然后,我尝试将笔记本转换为Pycharm脚本,以便可以使用其他版本的重复数据删除: dedupe、dedupe-hcluster或pandas-dedupe。我在安装pandas-dedupe时遇到了问题,所以我选择了前者。导入重复数据消除会出现以下错误:
"ImportError:没有名为_lowlevel的模块“
导入hcluster会产生以下错误:
"ImportError:无法导入名称_hierarchy“
我已经对所有3个问题进行了无休止的阅读,但没有更进一步地解决它们。任何关于如何解决上述任何问题的建议都将不胜感激。
发布于 2019-02-06 00:48:17
看起来您需要安装64位版本的Python;您可以使用以下命令检查您使用的是哪个版本:
import struct
print( 8 * struct.calcsize("P"))这将输出32或64
然后确保重复数据删除已正确安装。Dedupe库有一个大小合适的轮子,但它很容易安装。(很容易在Python3上使用,对Python2不太确定)
发布于 2019-02-18 06:51:04
如果您正在使用Anaconda和Jupyter笔记本电脑,请确保您的Anaconda环境在笔记本电脑中处于活动状态。
https://stackoverflow.com/questions/54526204
复制相似问题