首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将树顶解析树转换为抽象语法树(AST)

将树顶解析树转换为抽象语法树(AST)
EN

Stack Overflow用户
提问于 2014-06-13 16:14:08
回答 1查看 638关注 0票数 2

我简化了用Treetop表示的语法,并尝试使用自定义节点将解析器的输出过滤为AST。

代码语言:javascript
复制
grammar Elem

 rule top
   lpar 'top' space 
      args_:(lpar 'args' space ((ident / number) space?)* rpar)  space? 
   rpar <Top>
 end

 rule ident
   [a-zA-Z] [a-zA-Z0-9_]* <Ident>
 end

 rule number
   [0-9]+ <Number>
 end

 rule space
  [\s]+
 end

 rule lpar
  space? '(' space? 
 end

 rule rpar
  space? ')' space? 
 end
end

基本上,它可以解析以下示例:

代码语言:javascript
复制
(top (args foo bar 42))

自定义节点都继承Treetop::Runtime::SyntaxNode

现在,我需要将Treetop生成的解析树过滤为AST。

我遵循这里解释的策略,但没有成功:我的AST只是空的.

我的编译器驱动程序如下:

代码语言:javascript
复制
require 'treetop'
require 'pp'

require_relative 'elem'
require_relative 'node_extension'

class ElemCompiler
  def initialize
    @parser=ElemParser.new
  end

  def compile filename
    puts "==> compiling #{filename}"
    @ast=parse(filename)
    puts "==> AST in memory. Good."
  end

  def parse filename
    pp tree=@parser.parse(IO.read(filename))
    pp clean(tree)
  end

  private

  def clean(root_node)
    return if(root_node.elements.nil?)
    pp root_node.elements.collect {|node| node.class.name =="Treetop::Runtime::SyntaxNode" }
    pp root_node.elements.delete_if{|node| node.class.name == "Treetop::Runtime::SyntaxNode" }
    root_node.elements.each {|node| clean(node) }
  end


end

 compiler=ElemCompiler.new.parse ARGV[0]

我错过了什么?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-06-15 15:27:04

您的代码确实正确地解析了所提供的表达式。

但是,在清洁方法中有一个小错误:

代码语言:javascript
复制
def clean(root_node)
    return if(root_node.elements.nil?)
    pp root_node.elements.collect {|node| node.class.name =="Treetop::Runtime::SyntaxNode" }
    pp root_node.elements.delete_if{|node| node.class.name == "Treetop::Runtime::SyntaxNode" }
    root_node.elements.each {|node| clean(node) }
end

clean方法返回最后一个求值表达式,即数组元素的每个方法。您想要返回的是根节点,因此行pp clean(tree)实际上会打印出结果的干净树,而不是每个表达式的结果。

您可以通过两种方法解决问题,一种是添加root_node作为返回表达式:

代码语言:javascript
复制
def clean(root_node)
    (...)
    pp root_node.elements.delete_if{|node| node.class.name == "Treetop::Runtime::SyntaxNode" }
    root_node  # here
end

也可以将解析方法更改为:

代码语言:javascript
复制
def parse filename
    pp tree = @parser.parse(IO.read(filename))
    clean(tree) # we clean the tree
    pp tree     # since tree is an object, side-effects will persist here
end

不过,我不建议清理这棵树。我在这方面有过一些非常糟糕的经验。确实,您可以更好地理解一个更干净的结构,因为Treetop通常保存了许多您实际上不需要的信息,但您可能会丢失使用它的标识符(自定义标签或非终端符号的自动定义的元素访问器方法 )引用解析表达式的可能性(这是一个webarchive链接)。

而且,在某些情况下,仅仅因为节点的类名是"Treetop::Runtime::SyntaxNode",清理它就是不正确的,因为在某些情况下,必须使用模块而不是类来扩展节点,在这种情况下,节点类名仍然是"Treetop::Runtime::SyntaxNode“,但是节点将从树中被清除,您将失去混合的模块功能。

如果我说的很清楚,请告诉我(不幸的是,文档站点似乎被关闭了,它有很多有用的示例我想向您展示,而且由于我已经有一段时间没有玩语法了,所以我真的不记得了)。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24209732

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档