首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >下面Regex的Uima Ruta规则

下面Regex的Uima Ruta规则
EN

Stack Overflow用户
提问于 2017-02-22 06:48:23
回答 1查看 175关注 0票数 0

我需要对下面的案例进行注释。我有文本块&需要获取文本子块,其中包含banks.For示例,下面是一个完整的文本块,我需要将、美国银行注释为银行名称。

  • ,以下所述,以下简称为所有者和美洲银行NA,继承的利息。

银行名称可能有很多种情况。

  • 美国银行启动
  • 皇家银行苏格兰银行位于中部
  • 是的,银行在末尾,等等。

因此,文本需要注释,完全取决于银行,我无法编写通用规则来涵盖所有的情况,到目前为止,我已经尝试了以下规则

代码语言:javascript
复制
 - Rule 1



     W[0,3] BankNameKeyWord W[0,3] {-> MARK(BANKNAME,1,3)};(looking around bank for 3 words)

 - Rule 2

       W? W? W? BankNameKeyWord W? W? W? {-> MARK(BANKNAME,1,7)};

我在寻找覆盖所有案例的通用方法。

EN

回答 1

Stack Overflow用户

发布于 2017-02-22 08:08:36

你也许可以应用这样的规则:

代码语言:javascript
复制
(CW[0,3] @BankNameKeyWord SW.ct=="of"? CW[0,3]) {-> MARK(BANKNAME,1,3)};

但这不能解决你的问题。正如逗号所指出的,您需要像块一样进行一些语言预处理。如果只是银行的名字,你可以考虑一本字典。

免责声明:我是UIMA Ruta的开发人员

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42384509

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档