我简化了用Treetop表示的语法,并尝试使用自定义节点将解析器的输出过滤为AST。
grammar Elem
rule top
lpar 'top' space
args_:(lpar 'args' space ((ident / number) space?)* rpar) space?
rpar <Top>
end
rule ident
[a-zA-Z] [a-zA-Z0-9_]* <Ident>
end
rule number
[0-9]+ <Number>
end
rule space
[\s]+
end
rule lpar
space? '(' space?
end
rule rpar
space? ')' space?
end
end基本上,它可以解析以下示例:
(top (args foo bar 42))自定义节点都继承Treetop::Runtime::SyntaxNode。
现在,我需要将Treetop生成的解析树过滤为AST。
我遵循这里解释的策略,但没有成功:我的AST只是空的.
我的编译器驱动程序如下:
require 'treetop'
require 'pp'
require_relative 'elem'
require_relative 'node_extension'
class ElemCompiler
def initialize
@parser=ElemParser.new
end
def compile filename
puts "==> compiling #{filename}"
@ast=parse(filename)
puts "==> AST in memory. Good."
end
def parse filename
pp tree=@parser.parse(IO.read(filename))
pp clean(tree)
end
private
def clean(root_node)
return if(root_node.elements.nil?)
pp root_node.elements.collect {|node| node.class.name =="Treetop::Runtime::SyntaxNode" }
pp root_node.elements.delete_if{|node| node.class.name == "Treetop::Runtime::SyntaxNode" }
root_node.elements.each {|node| clean(node) }
end
end
compiler=ElemCompiler.new.parse ARGV[0]我错过了什么?
发布于 2014-06-15 15:27:04
您的代码确实正确地解析了所提供的表达式。
但是,在清洁方法中有一个小错误:
def clean(root_node)
return if(root_node.elements.nil?)
pp root_node.elements.collect {|node| node.class.name =="Treetop::Runtime::SyntaxNode" }
pp root_node.elements.delete_if{|node| node.class.name == "Treetop::Runtime::SyntaxNode" }
root_node.elements.each {|node| clean(node) }
endclean方法返回最后一个求值表达式,即数组元素的每个方法。您想要返回的是根节点,因此行pp clean(tree)实际上会打印出结果的干净树,而不是每个表达式的结果。
您可以通过两种方法解决问题,一种是添加root_node作为返回表达式:
def clean(root_node)
(...)
pp root_node.elements.delete_if{|node| node.class.name == "Treetop::Runtime::SyntaxNode" }
root_node # here
end也可以将解析方法更改为:
def parse filename
pp tree = @parser.parse(IO.read(filename))
clean(tree) # we clean the tree
pp tree # since tree is an object, side-effects will persist here
end不过,我不建议清理这棵树。我在这方面有过一些非常糟糕的经验。确实,您可以更好地理解一个更干净的结构,因为Treetop通常保存了许多您实际上不需要的信息,但您可能会丢失使用它的标识符(自定义标签或非终端符号的自动定义的元素访问器方法 )引用解析表达式的可能性(这是一个webarchive链接)。
而且,在某些情况下,仅仅因为节点的类名是"Treetop::Runtime::SyntaxNode",清理它就是不正确的,因为在某些情况下,必须使用模块而不是类来扩展节点,在这种情况下,节点类名仍然是"Treetop::Runtime::SyntaxNode“,但是节点将从树中被清除,您将失去混合的模块功能。
如果我说的很清楚,请告诉我(不幸的是,文档站点似乎被关闭了,它有很多有用的示例我想向您展示,而且由于我已经有一段时间没有玩语法了,所以我真的不记得了)。
https://stackoverflow.com/questions/24209732
复制相似问题