文章/答案/技术大牛

发布

社区首页 >问答首页 >在语法中分离G0和G1规则的问题

问在语法中分离G0和G1规则的问题
EN

Stack Overflow用户

提问于 2013-06-18 04:56:36

回答 1查看 186关注 0票数 4

我正在尝试让一个非常基本的Marpa语法正常工作。我使用的代码如下：

use strict;
use warnings;
use Marpa::R2;
use Data::Dumper;
my $grammar = Marpa::R2::Scanless::G->new(
    {
        source => \(<<'END_OF_SOURCE'),
            :start ::= ExprSingle
            ExprSingle ::= Expr AndExpr

            Expr ~ word

            AndExpr ~ word*
            word ~ [\w]+

            :discard ~ ws
            ws ~ [\s]+
END_OF_SOURCE
    }
);
my $reader = Marpa::R2::Scanless::R->new(
    {
        grammar => $grammar,
    }
);
my $input = 'foo';
$reader->read(\$input);
my $value = $reader->value;
print Dumper $value;

这将打印$VAR1 = \'foo';。所以它可以很好地识别一个单词。但我希望它能识别一串单词

my $input='foo bar'

现在，该脚本打印：

Error in SLIF G1 read: Parse exhausted, but lexemes remain, at position 4

我认为这是因为ExprSingle使用了~ (匹配)运算符，这使其成为标记化级别G0的一部分，而不是结构级别G1；:discard规则允许G1规则之间的空格，而不是G0规则。所以我像这样改变了语法：

ExprSingle ::= Expr AndExpr

现在没有输出任何警告，但是结果值是undef，而不是包含'foo'和'bar'的值。老实说，我不确定这是什么意思，因为在此之前，失败的解析抛出了一个实际的错误。

我试着改变语法以进一步分离我认为是G0和G1规则的东西，但仍然没有成功：

:start ::= ExprSingle
ExprSingle ::= Expr AndExpr

Expr ::= token

AndExpr ::= token*
token ~ word
word ~ [\w]+

:discard ~ ws
ws ~ [\s]+

最终的值仍然是undef。trace_terminals显示'foo‘和'bar’都被接受为标记。我需要做什么来修正这个语法(我的意思是获得一个包含字符串'foo‘和'bar’的值，而不仅仅是undef)？

parsing

tokenize

marpa

perl

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-06-18 08:02:03

默认情况下，规则返回值undef，因此在本例中，从$reader> value ()返回\undef表示解析成功。也就是说，返回undef表示失败，而返回\undef表示成功，其中解析的计算结果为undef。

要从更有用的语义开始，一个好的、快速的方法是添加以下行：

：默认数组操作=> ::=

这会导致解析生成一个AST。

票数 5

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/17156718

复制

相似问题

问在语法中分离G0和G1规则的问题
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在语法中分离G0和G1规则的问题EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在语法中分离G0和G1规则的问题
EN