要匹配以dog开头的字符串,后面跟着cat(但不使用cat),这是可行的:
local lpeg = require 'lpeg'
local str1 = 'dogcat'
local patt1 = lpeg.C(lpeg.P('dog')) * #lpeg.P('cat')
print(lpeg.match(patt1, str1))输出:dog
为了匹配以dog开头的字符串,后面跟着任何字符序列,然后是cat(但不使用它),就像regexlookearve(dog.+?)(?=cat)一样,我尝试了以下方法:
local str2 = 'dog and cat'
local patt2 = lpeg.C(lpeg.P("dog") * lpeg.P(1) ^ 1) * #lpeg.P("cat")
print(lpeg.match(patt2, str2))我的预期结果是dog and,但它返回nil。
如果我抛出前瞻性部分(即使用模式lpeg.C(lpeg.P("dog") * lpeg.P(1) ^ 1)),它可以成功地匹配整个字符串。这意味着* lpeg.P(1) ^ 1部件匹配任何字符序列都是正确的,不是吗?
怎么修呢?
发布于 2014-11-19 06:31:57
您需要在可以匹配的前面的每个位置上否定"cat“:
local patt2 = lpeg.C(lpeg.P"dog" * (lpeg.P(1)-lpeg.P"cat") ^ 1) * #lpeg.P"cat"我认为插入我一直在使用的调试器(聚乙二醇调试)是合适的,因为它在这种情况下很有帮助。下面是它为原始lpeg表达式生成的输出:
+ Exp 1 "d"
+ Dog 1 "d"
= Dog 1-3 "dog"
+ Separator 4 " "
= Separator 4-11 " and cat"
+ Cat 12 ""
- Cat 12
- Exp 1您可以看到分隔器表达式“吃掉”了所有字符,包括"cat“,没有什么可以与P"cat"相媲美了。
修改后的表达式的输出如下:
+ Exp 1 "d"
+ Dog 1 "d"
= Dog 1-3 "dog"
+ Separator 4 " "
= Separator 4-8 " and "
+ Cat 9 "c"
= Cat 9-11 "cat"
= Exp 1-8 "dog and "
/ Dog 1 0
/ Separator 4 0
/ Exp 1 1 "dog and "下面是完整的脚本:
require 'lpeg'
local peg = require 'pegdebug'
local str2 = 'dog and cat'
local patt2 = lpeg.P(peg.trace { "Exp";
Exp = lpeg.C(lpeg.V"Dog" * lpeg.V"Separator") * #lpeg.V"Cat";
Cat = lpeg.P("cat");
Dog = lpeg.P("dog");
Separator = (lpeg.P(1) - lpeg.P("cat"))^1;
})
print(lpeg.match(patt2, str2))https://stackoverflow.com/questions/27009411
复制相似问题