因此,我有一个被问到的same example here,它是包含如下mediawiki标记的xml:
12世纪的...collected,其中[亚历山大大帝]是英雄,他在其中被代表,有点像英国人[亚瑟王亚瑟]
使用这个regexp:
Pattern p = Pattern.compile("\\[\\[([\\w | \\w]+)\\]\\]");--它运行得很好,和我得到了这个输出:
Alexander the Great
King Arthur|ArthurThe problem:如果我有一个文本,比如带有两个或多个垂直条的[[Alexander|the |Great]],这应该不匹配,但它匹配。
因此,我将正则表达式更改为只匹配一个垂直条,但没有工作:
Pattern p = Pattern.compile("\\[\\[([\\w |? \\w]+)\\]\\]");发布于 2014-04-01 06:58:26
要在[[和]]中找到包含字母数字字符、空格和完全一个管道的表达式,可以使用以下正则表达式
\[\[[\w ]+[\|]{1}[\w ]+\]\]然而,这只说明了在某些情况下,管道不是第一个字符或最后一个字符,但假设从您的问题出发,这种情况不应该发生。
发布于 2014-04-01 06:51:07
你可以用这个:
Pattern p = Pattern.compile("\\[\\[([\\w ]+\\|?[\\w ]*)\\]\\]");或者,如@fge的评论:
Pattern p = Pattern.compile("\\[\\[([\\w ]+(?:\\|[\\w ])?)\\]\\]");https://stackoverflow.com/questions/22778732
复制相似问题