首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用regex从火花中的描述中获取数量

使用regex从火花中的描述中获取数量
EN

Stack Overflow用户
提问于 2019-11-06 12:02:42
回答 1查看 54关注 0票数 1

我有一个捕获代码及其描述的数据,我们需要从描述中提取数量。如何用正则表达式提取数量,就像数跟G/KG/L/ML一样

df

代码语言:javascript
复制
code description
1    ABC CHILLIE POWDER 100G
2    DEF POWDER 200G
3    DIL PDWR POWDER 100G
4    RAIN HILL HERB SOU GREED 40G 2 1FRE
5    DEAR CHILLI 200G+COCO POWDER 330ML
6    DIL PDWR 10L POWDER

result_df

代码语言:javascript
复制
code description                                 qty
1    ABC CHILLIE POWDER 100G                     100G
2    DEF POWDER 200G                             200G
3    DIL PDWR POWDER 100G                        100G
4    RAIN HILL HERB SOU GREED 40G 2 1FRE         40G
5    DEAR CHILLI 200G+COCO POWDER 330ML          200G
6    DIL PDWR 10L POWDER                         10L

我在用

代码语言:javascript
复制
df.withColumn("qty", F.regex_extract(F.col("description"), "\dG", 1)
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-11-06 12:21:04

你可以用

代码语言:javascript
复制
df.withColumn("qty", F.regex_extract(F.col("description"), r"(\d+\s?(?:K?G|M?L))\b", 1)

(\d+\s?(?:K?G|M?L))\b模式匹配

  • (\d+\s?(?:K?G|M?L)) -捕获组1:
    • \d+ - 1+数字,
    • 然后,\s? -1或0白空间
    • (?:K?G|M?L) -要么是可选的KG,要么是可选的M然后是L

  • \b -词边界。

regex演示

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58729748

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档