我需要对下面的案例进行注释。我有文本块&需要获取文本子块,其中包含banks.For示例,下面是一个完整的文本块,我需要将、美国银行注释为银行名称。
银行名称可能有很多种情况。
因此,文本需要注释,完全取决于银行,我无法编写通用规则来涵盖所有的情况,到目前为止,我已经尝试了以下规则
- Rule 1
W[0,3] BankNameKeyWord W[0,3] {-> MARK(BANKNAME,1,3)};(looking around bank for 3 words)
- Rule 2
W? W? W? BankNameKeyWord W? W? W? {-> MARK(BANKNAME,1,7)};我在寻找覆盖所有案例的通用方法。
发布于 2017-02-22 08:08:36
你也许可以应用这样的规则:
(CW[0,3] @BankNameKeyWord SW.ct=="of"? CW[0,3]) {-> MARK(BANKNAME,1,3)};但这不能解决你的问题。正如逗号所指出的,您需要像块一样进行一些语言预处理。如果只是银行的名字,你可以考虑一本字典。
免责声明:我是UIMA Ruta的开发人员
https://stackoverflow.com/questions/42384509
复制相似问题