我有两个熊猫系列
s1=pd.Series(np.round(np.linspace(-1.5, 4, 55001), 4))
s2=pd.Series(np.round(np.random.uniform(-1.5, 4, 500), 4))我想找出在s1中,s2发生在哪些索引上。我正在使用isin函数。然而,当我检查长度时,我得到了以下结果
>>>d=s1.isin(s2)
>>>len(np.where(d)[0])
499
>>>d=s2.isin(s1)
>>>len(np.where(d)[0])
500从技术上讲,这两个结果的答案应该是相同的,但我得到了不同的长度。请让任何人知道这个问题。
发布于 2018-06-28 16:43:23
首先,我们将指定一个随机种子
np.random.seed(0)您的问题与s2中的重复值相关联,要检查它,只需执行以下操作:
print(s2.drop_duplicates().shape)
print(s2.shape)isin函数类似于内部联接。
https://stackoverflow.com/questions/51078183
复制相似问题