从大表达式中解析/识别双引号字符串的问题。
use strict;
use Marpa::R2;
use Data::Dumper;
my $grammar = Marpa::R2::Scanless::G->new({
default_action => '[values]',
source => \(<<'END_OF_SOURCE'),
:start ::= expression
expression ::= expression OP expression
expression ::= expression COMMA expression
expression ::= func LPAREN PARAM RPAREN
expression ::= PARAM
PARAM ::= STRING | REGEX_STRING
:discard ~ sp
sp ~ [\s]+
COMMA ~ [,]
STRING ~ [^ \/\(\),&:\"~]+
REGEX_STRING ~ yet to identify
OP ~ ' - ' | '&'
LPAREN ~ '('
RPAREN ~ ')'
func ~ 'func'
END_OF_SOURCE
});
my $recce = Marpa::R2::Scanless::R->new({grammar => $grammar});my $input1 = "func(foo)&func(bar)"; ->可以通过解析foo和bar作为字符串LEXEME来正确解析它。
my $input2 = "\"foo\""; ->在这里,我想将foo解析为regex_string LEXEME。REGEX_STRING是用双引号括起来的东西。
my $input3 = "func(\"foo\") - func(\"bar\")"; ->在这里,func应该被当作func LEXEME,(应该是LPAREN,)应该是RPAREN,foo作为REGEX_STRING,- as和func(\"bar\")相同。
my $input4 = "func(\"foo\")"; ->在这里,func应该被当作func LEXEME,(应该是LPAREN,)应该是RPAREN,foo作为REGEX_STRING。
print "Trying to parse:\n$input\n\n";
$recce->read(\$input);
my $value_ref = ${$recce->value};
print "Output:\n".Dumper($value_ref);我尝试了什么:1方法: My REGEX_STRING应该是什么:REGEX_STRING -> ~ '\"([^:]*?)\"'
如果我尝试将上面的REGEX_STRING放在输入表达式为my $input4 = "func(\"foo\")";的代码中,就会得到以下错误:
SLIF解析中的错误:在第1行、第5列*在错误之前的字符串: func( *错误位于第1行第5列和字符0x0022‘“、.*此处:"foo") Marpa::R2异常处未找到
第二种方法:
尝试包括这样的规则:
PARAM ::= STRING | REGEX_STRING
REGEX_STRING ::= '"' QUOTED_STRING '"'
STRING ~ [^ \/\(\),&:\"~]+
QUOTED_STRING ~ [^ ,&:\"~]+这里的问题是->输入是使用以下方法提供的:
my $input4 = "func(\"foo\")";
所以,这里会出现错误,因为现在有两种方法来解析这个表达式,一个是双引号之间的整件事,即func(\"foo\")被当作QUOTED_STRING,或者func应该作为func等等。
请帮我解决这件事。
发布于 2018-03-22 12:25:26
use 5.026;
use strictures;
use Data::Dumper qw(Dumper);
use Marpa::R2 qw();
my $grammar = Marpa::R2::Scanless::G->new({
bless_package => 'parsetree',
source => \<<'',
:default ::= action => [values] bless => ::lhs
lexeme default = bless => ::name latm => 1
:start ::= expression
expression ::= expression OP expression
expression ::= expression COMMA expression
expression ::= func LPAREN PARAM RPAREN
expression ::= PARAM
PARAM ::= STRING | REGEXSTRING
:discard ~ sp
sp ~ [\s]+
COMMA ~ [,]
STRING ~ [^ \/\(\),&:\"~]+
REGEXSTRING ::= '"' QUOTEDSTRING '"'
QUOTEDSTRING ~ [^ ,&:\"~]+
OP ~ ' - ' | '&'
LPAREN ~ '('
RPAREN ~ ')'
func ~ 'func'
});
# say $grammar->show_rules;
for my $input (
'func(foo)&func(bar)', '"foo"', 'func("foo") - func("bar")', 'func("foo")'
) {
my $r = Marpa::R2::Scanless::R->new({
grammar => $grammar,
# trace_terminals => 1
});
$r->read(\$input);
say "# $input";
say Dumper $r->value;
}发布于 2018-03-26 17:20:20
问题中的第二种方法对我有效。我只需要包括:
lexeme default = latm => 1在我的密码里。
https://stackoverflow.com/questions/49418453
复制相似问题