首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >熊猫从细胞中移除重复的

熊猫从细胞中移除重复的
EN

Stack Overflow用户
提问于 2020-07-17 11:21:37
回答 1查看 122关注 0票数 3

我需要删除--单元格中的重复号和单元格中的重复百分比符号

我有两项投入:

Input1-

  1. 51 %
  2. 4%
  3. (0.9 %)
  4. 53 %
  5. 44 %
  6. 29 %

名称:已付损失率,dtype: object

Req'd output1:

  1. 51
  2. 4.
  3. -0.9
  4. 53
  5. 44
  6. 29

名称:已付损失率,dtype: object

下面的脚本适用于本例:

F1‘已付损失率'.str.split('%').apply(set).str.join('').str.rstrip()

试图删除重复的“在一个单元格中签名”

input2 -

  1. 88 %
  2. 102 %
  3. 84 84 %
  4. ( 0.8 %)
  5. 93 %

名称:常数损失率,dtype: object

Req'd Output2:

  1. 88 %
  2. 102 %
  3. 84 %
  4. -0.8%
  5. 93 %

尝试了以下内容,但是它不能正常工作:

re.sub(r'(0-9)(.*)\1+',r‘1’,str(ab))

试图删除一个单元格中重复的"84“号

还有合并这两个脚本/模式的方法吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-07-17 11:52:47

您对第一个输入的要求与输出不匹配,因为您似乎只想删除一个双百分号?如果我是对的,我想你可以:

代码语言:javascript
复制
(\S+)(?=\s\1)\s

查看在线演示

一个示例Python脚本可以是:

代码语言:javascript
复制
df = df.replace(r'(\S+)(?=\s\1)\s','', regex=True)

指纹:

代码语言:javascript
复制
0    51 %
1     4 %
2     9 %
3    53 %
4    44 %
5    29 %
6    88 %
7   102 %
8    84 %
9     Nan
10   93 %
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62952915

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档