我正在尝试让一个非常基本的Marpa语法正常工作。我使用的代码如下:
use strict;
use warnings;
use Marpa::R2;
use Data::Dumper;
my $grammar = Marpa::R2::Scanless::G->new(
{
source => \(<<'END_OF_SOURCE'),
:start ::= ExprSingle
ExprSingle ::= Expr AndExpr
Expr ~ word
AndExpr ~ word*
word ~ [\w]+
:discard ~ ws
ws ~ [\s]+
END_OF_SOURCE
}
);
my $reader = Marpa::R2::Scanless::R->new(
{
grammar => $grammar,
}
);
my $input = 'foo';
$reader->read(\$input);
my $value = $reader->value;
print Dumper $value;这将打印$VAR1 = \'foo';。所以它可以很好地识别一个单词。但我希望它能识别一串单词
my $input='foo bar'现在,该脚本打印:
Error in SLIF G1 read: Parse exhausted, but lexemes remain, at position 4我认为这是因为ExprSingle使用了~ (匹配)运算符,这使其成为标记化级别G0的一部分,而不是结构级别G1;:discard规则允许G1规则之间的空格,而不是G0规则。所以我像这样改变了语法:
ExprSingle ::= Expr AndExpr现在没有输出任何警告,但是结果值是undef,而不是包含'foo'和'bar'的值。老实说,我不确定这是什么意思,因为在此之前,失败的解析抛出了一个实际的错误。
我试着改变语法以进一步分离我认为是G0和G1规则的东西,但仍然没有成功:
:start ::= ExprSingle
ExprSingle ::= Expr AndExpr
Expr ::= token
AndExpr ::= token*
token ~ word
word ~ [\w]+
:discard ~ ws
ws ~ [\s]+最终的值仍然是undef。trace_terminals显示'foo‘和'bar’都被接受为标记。我需要做什么来修正这个语法(我的意思是获得一个包含字符串'foo‘和'bar’的值,而不仅仅是undef)?
发布于 2013-06-18 08:02:03
默认情况下,规则返回值undef,因此在本例中,从$reader> value ()返回\undef表示解析成功。也就是说,返回undef表示失败,而返回\undef表示成功,其中解析的计算结果为undef。
要从更有用的语义开始,一个好的、快速的方法是添加以下行:
:默认数组操作=> ::=
这会导致解析生成一个AST。
https://stackoverflow.com/questions/17156718
复制相似问题