我试着比较两个,一个是pandas.unique(),另一个是numpy.unique(),我发现后者实际上超过了第一个。
我不确定优势是否是线性的。
有人能告诉我为什么在代码实现方面存在这样的差异吗?在什么情况下我应该使用哪个?
发布于 2020-06-16 14:59:11
np.unique()将数据视为一个数组,因此它逐个遍历每个值,然后标识唯一字段。
然而,pandas已经预先构建了包含此信息的元数据,而pd.unique()只是调用包含“唯一”信息的元数据,因此它不必再次计算它。
https://stackoverflow.com/questions/53310547
复制相似问题