文章/答案/技术大牛

发布

问用Java CUP解析树生成
EN

Stack Overflow用户

提问于 2011-05-17 15:33:53

回答 1查看 12.4K关注 0票数 5

我使用CUP和JFlex来验证表达式语法。我已经具备了基本的功能:我可以判断表达式是否有效。

下一步是实现简单的算术操作，例如"add 1“。例如，如果我的表达式是"1 + a"，则结果应该是"2 + a“。我需要访问解析树才能做到这一点，因为简单地标识一个数字术语是做不到的:在"(1 + a) * b“中添加1的结果应该是"(1 + a) *b+ 1"，而不是"(2 + a) * b”。

是否有人有生成解析树的CUP示例？我想我可以从那里拿走它。

另外，是否有一种方法可以使用JFlex获取表达式中所有标记的列表？似乎是一个典型的用例，但我想不出怎么做。

编辑：发现了一条关于堆栈溢出的有前途的线索：Create abstract tree problem from parser

关于CUP和AST的讨论：

http://pages.cs.wisc.edu/~fischer/cs536.s08/lectures/Lecture16.4up.pdf

具体而言，本段：

解析器返回的符号与语法的开始符号相关联，并包含整个源程序的AST

这没什么用。如果符号类没有指向其子类的任何导航指针，如何遍历给定符号实例的树？换句话说，它不像树节点，也不像树节点：

package java_cup.runtime;
/**
 * Defines the Symbol class, which is used to represent all terminals
 * and nonterminals while parsing.  The lexer should pass CUP Symbols 
 * and CUP returns a Symbol.
 *
 * @version last updated: 7/3/96
 * @author  Frank Flannery
 */

/* ****************************************************************
  Class Symbol
  what the parser expects to receive from the lexer. 
  the token is identified as follows:
  sym:    the symbol type
  parse_state: the parse state.
  value:  is the lexical value of type Object
  left :  is the left position in the original input file
  right:  is the right position in the original input file
******************************************************************/

public class Symbol {

/*******************************
  Constructor for l,r values
 *******************************/

  public Symbol(int id, int l, int r, Object o) {
    this(id);
    left = l;
    right = r;
    value = o;
  }

/*******************************
  Constructor for no l,r values
********************************/

  public Symbol(int id, Object o) {
    this(id, -1, -1, o);
  }

/*****************************
  Constructor for no value
  ***************************/

  public Symbol(int id, int l, int r) {
    this(id, l, r, null);
  }

/***********************************
  Constructor for no value or l,r
***********************************/

  public Symbol(int sym_num) {
    this(sym_num, -1);
    left = -1;
    right = -1;
    value = null;
  }

/***********************************
  Constructor to give a start state
***********************************/
  Symbol(int sym_num, int state)
    {
      sym = sym_num;
      parse_state = state;
    }

/*. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .*/

  /** The symbol number of the terminal or non terminal being represented */
  public int sym;

  /*. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .*/

  /** The parse state to be recorded on the parse stack with this symbol.
   *  This field is for the convenience of the parser and shouldn't be 
   *  modified except by the parser. 
   */
  public int parse_state;
  /** This allows us to catch some errors caused by scanners recycling
   *  symbols.  For the use of the parser only. [CSA, 23-Jul-1999] */
  boolean used_by_parser = false;

/*******************************
  The data passed to parser
 *******************************/

  public int left, right;
  public Object value;

  /*****************************
    Printing this token out. (Override for pretty-print).
    ****************************/
  public String toString() { return "#"+sym; }
}

parsing

grammar

lexer

jflex

cup

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-05-20 17:17:32

好的，我知道了。但不幸的是，我无法将我的所有代码按-原样发布。无论如何，我都会尝试概述解决方案，如果有什么不清楚的地方，请提出问题。

JFlex使用自己的Symbol类。请看这里:JFlex.jar/java_杯。运行时/Symbol.class

您将看到添加了几个构造函数：

public Symbol(int id, Symbol left, Symbol right, Object o){
    this(id,left.left,right.right,o);
}
public Symbol(int id, Symbol left, Symbol right){
    this(id,left.left,right.right);
}

这里的关键是Object o，它是符号的值。

定义自己的类来表示AST树节点，并定义另一个类来表示lexer令牌。当然，您可以使用相同的类，但我发现使用不同的类来区分这两个类更清楚。JFlex和CUP都会生成java代码，而且很容易将令牌和节点混合起来。

然后，在您的parser.flex中，在词法规则部分，您希望对每个令牌执行如下操作：

{float_lit}        { return symbol(sym.NUMBER, createToken(yytext(), yycolumn)); }

对你所有的代币都这么做。您的createToken可能是这样的：

%{
    private LexerToken createToken(String val, int start) {
        LexerToken tk = new LexerToken(val, start);
        addToken(tk);
        return tk;
    }
}%

现在让我们继续讨论parser.cup。声明所有终端为LexerToken类型，所有非终端为Node类型。您想要阅读CUP手册，但是对于快速刷新，终端将是由词法(例如数字、变量、运算符)识别的任何东西，而非终端将是语法的一部分(例如表达式、因子、术语.)。

最后，所有这些都在语法定义中结合在一起。请考虑以下示例：

   factor    ::= factor:f TIMES:times term:t
                 {: RESULT = new Node(times.val, f, t, times.start); :}
                 |
                 factor:f DIVIDE:div term:t
                 {: RESULT = new Node(div.val, f, t, div.start); :}
                 |
                 term:t
                 {: RESULT = t; :}
                 ;

语法factor:f意味着您将因子的值别名为f，您可以在下面的{: ... :}部分中引用它。记住，我们的终端有LexerToken类型的值，而非终端的值是Node的。

表达式中的术语可能有以下定义：

   term  ::= LPAREN expr:e RPAREN
         {: RESULT = new Node(e.val, e.start); :}
         |
         NUMBER:n
         {: RESULT = new Node(n.val, n.start); :}
         ;

当您成功地生成解析器代码时，您将在parser.java中看到节点之间建立父-子关系的部分：

  case 16: // term ::= UFUN LPAREN expr RPAREN 
    {
      Node RESULT =null;
    int ufleft = ((java_cup.runtime.Symbol)CUP$parser$stack.elementAt(CUP$parser$top-3)).left;
    int ufright = ((java_cup.runtime.Symbol)CUP$parser$stack.elementAt(CUP$parser$top-3)).right;
    LexerToken uf = (LexerToken)((java_cup.runtime.Symbol) CUP$parser$stack.elementAt(CUP$parser$top-3)).value;
    int eleft = ((java_cup.runtime.Symbol)CUP$parser$stack.elementAt(CUP$parser$top-1)).left;
    int eright = ((java_cup.runtime.Symbol)CUP$parser$stack.elementAt(CUP$parser$top-1)).right;
    Node e = (Node)((java_cup.runtime.Symbol) CUP$parser$stack.elementAt(CUP$parser$top-1)).value;
     RESULT = new Node(uf.val, e, null, uf.start); 
      CUP$parser$result = parser.getSymbolFactory().newSymbol("term",0, ((java_cup.runtime.Symbol)CUP$parser$stack.elementAt(CUP$parser$top-3)), ((java_cup.runtime.Symbol)CUP$parser$stack.peek()), RESULT);
    }
  return CUP$parser$result;

很抱歉，我不能发布完整的代码示例，但希望这将节省某人几个小时的尝试和错误。没有完整的代码也是好的，因为它不会使所有的CS作业都无用。

作为生命的证明，这是我的样本AST的漂亮指纹。

输入表达式：

T21 + 1A / log(max(F1004036, min(a1, a2))) * MIN(1B, 434) -LOG(xyz) - -3.5+10 -.1 + .3 * (1)

结果AST：

|--[+]
   |--[-]
   |  |--[+]
   |  |  |--[-]
   |  |  |  |--[-]
   |  |  |  |  |--[+]
   |  |  |  |  |  |--[T21]
   |  |  |  |  |  |--[*]
   |  |  |  |  |     |--[/]
   |  |  |  |  |     |  |--[1A]
   |  |  |  |  |     |  |--[LOG]
   |  |  |  |  |     |     |--[MAX]
   |  |  |  |  |     |        |--[F1004036]
   |  |  |  |  |     |        |--[MIN]
   |  |  |  |  |     |           |--[A1]
   |  |  |  |  |     |           |--[A2]
   |  |  |  |  |     |--[MIN]
   |  |  |  |  |        |--[1B]
   |  |  |  |  |        |--[434]
   |  |  |  |  |--[LOG]
   |  |  |  |     |--[XYZ]
   |  |  |  |--[-]
   |  |  |     |--[3.5]
   |  |  |--[10]
   |  |--[.1]
   |--[*]
      |--[.3]
      |--[1]

票数 11

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/6033303

复制

相似问题

问用Java CUP解析树生成
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用Java CUP解析树生成EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用Java CUP解析树生成
EN