首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何基于列表更改大熊猫字符串

如何基于列表更改大熊猫字符串
EN

Stack Overflow用户
提问于 2021-10-26 11:29:35
回答 2查看 43关注 0票数 1

我有一个地图,如下所示

代码语言:javascript
复制
MAPPER = {
    'g': ['gm', 'gram', 'grams', 'gms'],
    'ml': ['mls', 'milli-litre', 'mili-litre', 'milli litre', 'mili litre'],
    'kg': ['kilo', 'kilo-gram', 'kilo gram', 'kilo grams'] 
}

和熊猫系列如下

代码语言:javascript
复制
Salt 500 gm
Sugar Powder 500 gm
Sugar 500 gm
Flour 500 gm
Repellent 10 mls

我希望将gm和mls更改为映射器中的键,这样结果如下

代码语言:javascript
复制
Salt 500 g
Sugar Powder 500 g
Sugar 500 g
Flour 500 g
Repellent 10 ml

我该怎么做呢?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-10-26 11:33:32

首先将二分法的嵌套列表压平为带有单词边界的二叉树,然后传递给Series.replace

代码语言:javascript
复制
s = s.replace({rf'\b{x}\b': k  for k, v in MAPPER.items() for x in v}, regex=True)
print (s)
0            Salt 500 g
1    Sugar Powder 500 g
2           Sugar 500 g
3           Flour 500 g
4       Repellent 10 ml
Name: a, dtype: object

如果需要总是重新计算单元,如果字符串的最后一部分为字符串的匹配结尾添加$

代码语言:javascript
复制
s = s.replace({rf'\b{x}\b$': k  for k, v in MAPPER.items() for x in v}, regex=True)
票数 2
EN

Stack Overflow用户

发布于 2021-10-26 11:33:21

一种办法是:

代码语言:javascript
复制
MAPPER = {
    'g': ['gm', 'gram', 'grams', 'gms'],
    'ml': ['mls', 'milli-litre', 'mili-litre', 'milli litre', 'mili litre'],
    'kg': ['kilo', 'kilo-gram', 'kilo gram', 'kilo grams']
}

lookup = { v : k for k, vs in MAPPER.items() for v in vs }
res = ser.str.replace(rf"\b({'|'.join(lookup)})\b", lambda x: lookup[x.group()], regex=True)
print(res)

输出

代码语言:javascript
复制
0            Salt 500 g
1    Sugar Powder 500 g
2           Sugar 500 g
3           Flour 500 g
4       Repellent 10 ml
Name: 0, dtype: object
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69722279

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档