首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在OpenRefine中使用GREL提取文本

在OpenRefine中使用GREL提取文本
EN

Stack Overflow用户
提问于 2021-08-31 11:35:39
回答 2查看 204关注 0票数 0

我正在尝试使用GREL根据OpenRefine中的一列添加一个列。

我需要以科学的名义提取第二个空格之后的每一个文本。

下面是两个原始单元数据的例子-->我想要提取的内容:

[医]马蹄癣科平斯和沙伊德。-> (Hoffm.)科平斯和沙伊德。Agonimia tristicula (Nyl.)扎尔布尔。-> (Nyl.)扎尔布尔。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-08-31 17:07:33

这里有三种方法来达到预期的结果对给定的数据,排序从容易理解到更先进。

使用列分裂

您可以选择一个空格作为分隔符,将分隔列分为三列,并在相应的对话框中将新列的数量限制为3列。然后,您可以删除前两列并获得所需的结果。

使用数组函数

你可以通过GREL和列阵使用同样的技术.在空格上拆分,丢弃前两个条目,并在空白上加入其余的条目。

代码语言:javascript
复制
value.split(" ").slice(2).join(" ")

使用正则表达式

您还可以在正则表达式中使用匹配函数

代码语言:javascript
复制
value.match(/\S+\s\S+\s(.+)/)[0]
票数 0
EN

Stack Overflow用户

发布于 2021-08-31 14:58:09

一个解决方案:在一个看起来很好的分隔符上进行分区:" (“,取正确的部分并添加一个缺失”(“在开头”)。

代码语言:javascript
复制
"("+value.partition(" (")[2]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68997950

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档