我正在尝试为一个旧的文件格式写一个PEG,它有大约100个不能用作标识符的关键字。
以下是关键字规则的示例:
IN = { ^"in" } // Caret means case insensitivity
keyword = { IN } // plus others标识符规则如下所示:
identifier = @{ ( "_" | ASCII_ALPHA ) ~ ASCII_ALPHANUMERIC* }目前,此标识符规则将匹配所有关键字。因此标识符规则变为:
identifier = @{ !keyword ~ ( "_" | ASCII_ALPHA ) ~ ASCII_ALPHANUMERIC* }除非标识符以与关键字相同的字母开头,否则这种方法是可行的。例如,标识符inner被视为后跟文本的关键字in。
如何允许标识符以关键字开头?注意,在PEST解析器生成器中,只能将终端指定为字符串,而不能指定为正则表达式。
发布于 2020-09-23 22:20:54
您可以使用predicate强制keyword仅匹配完整的单词。例如:
identifier_start = _{ "_" | ASCII_ALPHA }
identifier_continue = _{ "_" | ASCII_ALPHANUMERIC }
keyword = @{ (^"for" | ^"in") ~ !identifier_continue }
identifier = @{ !keyword ~ identifier_start ~ identifier_continue* ~ !identifier_continue }这将匹配for和in,但不匹配form或int。
https://stackoverflow.com/questions/64018056
复制相似问题