我想在我的正则表达式中使用Unicodes。
例如,RegExp="\u0061“与"a”匹配。但似乎dk.brics.automaton并不支持这一点。事实证明它与"u0061“匹配。我还尝试了RegExp=“u0061”和RegExp=“u0061”。都不会起作用。
如果你有使用这个工具的经验,你能给我一些解决方案吗?
谢谢!
发布于 2012-04-09 06:00:12
最后,我找到了一种绕过这个问题的方法。
首先,我们可以在Java代码中使用Unicodes,但它必须单独创建。例如,String str = "\u0061"+"b";,而String str = "\u0061b";不能很好地工作。
其次,如果我们想从文本文件中读取字符串,比如包含"\u0061b\u0063“的test.txt,我们必须(据我所知)手动将Unicode替换为相应的符号,因为它们是混合的。然后我们可以得到值为"abc“的String str。
发布于 2012-04-05 20:15:07
我没有使用dk.brics.automaton的经验,但我猜FAQ和JavaDoc for the RegExp Class中都有相关内容。
据我所知,您可以使用unicode字符,但必须将它们表示为字符("a"),而不是使用\u0061表示法。
https://stackoverflow.com/questions/10026301
复制相似问题