我正在编写一个Ruta脚本来识别货币,但是我遇到了像美元符号($)这样的特殊字符问题。
我试着用简单的字符:
W{REGEXP("(dollar|nzd|$)") -> MARK(EntityType)};转义它:
打包uima.ruta.example;
W{REGEXP("(dollar|nzd|\$)") -> MARK(EntityType)};在第一种情况下,我的模式无法识别,在第二种情况下,我的编辑器会给我一个错误。
识别特殊字符的正确方法是什么?
干杯。
发布于 2019-10-24 18:03:54
在UIMA Ruta中,特殊字符是默认种子注释SPECIAL的一部分。您的规则只在单词标记W上匹配;因此它不会触发。
如果您希望只匹配$作为特殊字符,那么可以使用REGEXP条件限制SPECIAL注释,就像对W所做的那样
// I spent $100.
SPECIAL{REGEXP("\\$"} -> Currency} NUM{-> Amount};如果这有帮助,请告诉我。
https://stackoverflow.com/questions/58533090
复制相似问题