文章/答案/技术大牛

发布

社区首页 >问答首页 >用向量化方式向熊猫DataFrame中添加列对其他列值进行条件调整

问用向量化方式向熊猫DataFrame中添加列对其他列值进行条件调整
EN

Stack Overflow用户

提问于 2016-12-09 14:08:07

回答 2查看 1K关注 0票数 1

我有一只熊猫df

>>> df
           a  b  c  
0          1  1  0             
1          1 -1  1                    
2          1  0  0

现在，我想在列a和b上添加一个新列df'e‘条件条件。我想以矢量化的方式创建新列。

就目前而言，我做的事情如下：

df["e"] = [-1 if (df['a'] == 1 and df['b'] == 1) else 1]

哪一项应产出：

>>> df
               a  b  c  e 
    0          1  1  0 -1          
    1          1 -1  1  1                  
    2          1  0  0  1

但我得到了以下错误：

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Users/hmishfaq/anaconda/lib/python2.7/site-packages/pandas/core/generic.py", line 917, in __nonzero__
    .format(self.__class__.__name__))
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

我做错了什么，这里有什么正确的矢量化方法？

PS:我需要使用的原始数据文件非常大，因此-循环要花费很长时间才能完成。

conditional-statements

vectorization

python

pandas

dataframe

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-12-09 14:09:30

您可以使用非常快的numpy.where

df['e'] = np.where((df['a'] == 1) & (df['b'] == 1), -1, 1)
print (df)
   a  b  c  e
0  1  1  0 -1
1  1 -1  1  1
2  1  0  0  1

票数 4

Stack Overflow用户

发布于 2019-12-26 20:15:05

您的错误源于这样一个事实:您使用的是and而不是&。切换到后者，您的错误就会消失。

解决方案：

df["e"] = [-1 if (df['a'] == 1 & df['b'] == 1) else 1]

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/41062277

复制

相似问题

问用向量化方式向熊猫DataFrame中添加列对其他列值进行条件调整
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用向量化方式向熊猫DataFrame中添加列对其他列值进行条件调整EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用向量化方式向熊猫DataFrame中添加列对其他列值进行条件调整
EN