首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何根据第一列和第二列之间的差异来获取dataframe中第三列的值?

如何根据第一列和第二列之间的差异来获取dataframe中第三列的值?
EN

Stack Overflow用户
提问于 2019-10-15 14:36:39
回答 1查看 411关注 0票数 3

因此,我有一个表,如下所示:

开始结束5 5 4 8 10 19 4 4

现在我想做的是,如果特定行中两列的值相等,那么在第三列中只打印其中一列。如果它们不同,则按print - start + "-“+ end。数据在数据帧中。示例如下:

起始结束范围5 5 5 4 8 4-8 10 10 10-19 4 4 4

这是我正在尝试的代码:

代码语言:javascript
复制
if df['start'] - df['end'] != 0:
   df['range'] = df['start'] + "-" + df['end']
else:
   df['range'] = df['start']

但这是行不通的。我该怎么做呢?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-10-15 14:38:09

使用numpy.where

代码语言:javascript
复制
df['range'] = np.where(df['start'] != df['end'], df['start'] + "-" + df['end'], df['start'])

类似的另一种解决方案:

代码语言:javascript
复制
df['range'] = df['start'] + np.where(df['start'] != df['end'], "-" + df['end'], '')

print (df)
  start end  range
0     5   5      5
1     4   8    4-8
2    10  19  10-19
3     4   4      4

值不是字符串时的解决方案:

代码语言:javascript
复制
s = df['start'].astype(str) 
e = df['end'].astype(str)

df['range'] = np.where(df['start'] != df['end'], s + "-" + e, s)

类似的另一种解决方案:

代码语言:javascript
复制
df['range'] = s + np.where(df['start'] != df['end'], "-" + e, '')
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58388559

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档