首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么pd.unique()比np.unique()快?

为什么pd.unique()比np.unique()快?
EN

Stack Overflow用户
提问于 2018-11-15 07:57:31
回答 1查看 1.4K关注 0票数 5

我试着比较两个,一个是pandas.unique(),另一个是numpy.unique(),我发现后者实际上超过了第一个。

我不确定优势是否是线性的。

有人能告诉我为什么在代码实现方面存在这样的差异吗?在什么情况下我应该使用哪个?

EN

回答 1

Stack Overflow用户

发布于 2020-06-16 14:59:11

np.unique()将数据视为一个数组,因此它逐个遍历每个值,然后标识唯一字段。

然而,pandas已经预先构建了包含此信息的元数据,而pd.unique()只是调用包含“唯一”信息的元数据,因此它不必再次计算它。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53310547

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档