在纯Python中,None or True返回True。
然而,对于熊猫来说,当我在两个包含无值的系列之间做|时,结果并不像我预期的那样:
>>> df.to_dict()
{'buybox': {0: None}, 'buybox_y': {0: True}}
>>> df
buybox buybox_y
0 None True
>>> df['buybox'] = (df['buybox'] | df['buybox_y'])
>>> df
buybox buybox_y
0 False True预期结果:
>>> df
buybox buybox_y
0 True True我通过两次使用OR操作得到了我想要的结果,但是我不明白为什么我要这样做。
我不是在寻找解决办法(我已经连续应用了两次df['buybox'] = (df['buybox'] | df['buybox_y']) ),而是一个解释,因此标题中的“为什么”。
发布于 2021-04-09 21:28:11
熊猫|操作符不依赖于Python or expression,其行为也有所不同。
如果两个操作数都是布尔值,则结果是数学定义的,Python和Pandas的结果是相同的。
但在您的案例中,"buybox“是object类型,"buybox_y”是bool。在本例中,Pandas |运算符是非交换性。
bitwise or,None | True是无效的操作,导致None因此,
>>> df['buybox'] | df['buybox_y']
0 False
>>> df['buybox_y'] | df['buybox']
0 True要获得可预测的结果,您可以清除数据,并在尝试布尔操作之前使用Pandas astype转换为布尔类型。
发布于 2021-04-15 05:17:39
对于布尔对象(即Py_True和Py_False),代码将进入快速处理分支;对于其他对象,PyObject_IsTrue()将用于计算int类型的值。
在计算过程中,PyObject_IsTrue()函数将依次获得nb_bool、mp_length和sq_length的值,这应该对应于两种神奇方法bool()和len()的返回值。
https://stackoverflow.com/questions/66970702
复制相似问题