首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >操作V8 ast

操作V8 ast
EN

Stack Overflow用户
提问于 2013-04-03 19:01:35
回答 1查看 1.2K关注 0票数 8

我打算直接在v8代码中实现一个js代码覆盖率。我最初的目标是为抽象语法树中的每个语句添加一个简单的打印。我看到有一个AstVisitor类,它允许您遍历AST。所以我的问题是,如何在访问者当前正在访问的语句之后向AST添加语句?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-04-12 05:56:27

好了,我来总结一下我的实验。首先,我写的内容适用于V8,因为它是在Chromium版本的r157275中使用的,所以事情可能不再起作用--但我仍然会链接到当前版本中的位置。

如上所述,您需要自己的AST访问器,比如MyAstVisior,它继承自AstVisitor,并且必须从那里实现一组VisitXYZ方法。插入/检查执行代码唯一需要的是VisitFunctionLiteral。执行代码要么是一个函数,要么是源(文件)中的一组松散语句,V8将其包装在一个函数中,然后执行该函数。

然后,在将解析的AST转换为代码、here (从松散语句生成的函数的编译)和there (运行时编译,当预定义函数第一次执行时)之前,将访问器传递给函数文字,该函数将在访问器上调用VisitFunctionLiteral

代码语言:javascript
复制
MyAstVisitor myAV(info);
info->function()->Accept(&myAV);
// next line is the V8 compile call
if (!MakeCode(info)) {

我将CompilationInfo指针info传递给了自定义访问者,因为需要它来修改AST。构造函数如下所示:

代码语言:javascript
复制
MyAstVisitor(CompilationInfo* compInfo) :
    _ci(compInfo), _nf(compInfo->isolate(), compInfo->zone()), _z(compInfo->zone()){};

_ci、_nf和_z是指向CompilationInfoAstNodeFactory<AstNullVisitor>Zone的指针。

现在,在VisitFunctionLiteral中,您可以遍历函数体,还可以根据需要插入语句。

代码语言:javascript
复制
void MyAstVisitor::VisitFunctionLiteral(FunctionLiteral* funLit){
    // fetch the function body
    ZoneList<Statement*>* body = funLit->body();
    // create a statement list used to collect the instrumented statements
    ZoneList<Statement*>* _stmts = new (_z) ZoneList<Statement*>(body->length(), _z);
    // iterate over the function body and rewrite each statement
    for (int i = 0; i < body->length(); i++) {
       // the rewritten statements are put into the collector
       rewriteStatement(body->at(i), _stmts);
    }
    // replace the original function body with the instrumented one
    body->Clear();
    body->AddAll(_stmts->ToVector(), _z);
}

rewriteStatement方法中,您现在可以检查语句。_stmts指针保存一系列语句,这些语句最终将替换原始的函数体。因此,要在每条语句之后添加一条print语句,首先要添加原始语句,然后添加您自己的print语句:

代码语言:javascript
复制
void MyAstVisitor::rewriteStatement(Statement* stmt, ZoneList<Statement*>* collector){
    // add original statement
    collector->Add(stmt, _z);

    // create and add print statement, assuming you define print somewhere in JS:

    // 1) create handle (VariableProxy) for print function
    Vector<const char> fName("print", 5);
    Handle<String> fNameStr = Isolate::Current()->factory()->NewStringFromAscii(fName, TENURED);
    fNameStr = Isolate::Current()->factory()->SymbolFromString(fNameStr);
    // create the proxy - (it is vital to use _ci->function()->scope(), _ci->scope() crashes)
    VariableProxy* _printVP = _ci->function()->scope()->NewUnresolved(&_nf, fNameStr, Interface::NewUnknown(_z), 0);

    // 2) create message
    Vector<const char> tmp("Hello World!", 12);
    Handle<String> v8String = Isolate::Current()->factory()->NewStringFromAscii(tmp, TENURED);
    Literal* msg = _nf.NewLiteral(v8String);

    // 3) create argument list, call expression, expression statement and add the latter to the collector
    ZoneList<Expression*>* args = new (_z) ZoneList<Expression*>(1, _z);
    args->Add(msg);
    Call* printCall = _nf.NewCall(_printVP, args, 0);
    ExpressionStatement* printStmt = _nf.NewExpressionStatement(printCall);
    collector->Add(printStmt, _z);   
}

NewCallNewUnresolved的最后一个参数是一个数字,用于指定脚本中的位置。我假设这是用于调试/错误消息,以告知错误发生的位置。我至少从来没有遇到过将它设置为0的问题(在kNoPosition中也有一个常量)。

最后一句话:这实际上不会在每个语句后面添加一条打印语句,因为Blocks (例如循环体)是表示一组语句的语句,而循环是具有条件表达式和主体块的语句。因此,您需要检查当前处理的是哪种类型的语句,并以递归方式查看它。重写代码块与重写函数体几乎是一样的。

但是,当您开始替换或修改现有语句时,您会遇到问题,因为AST还包含有关分支的信息。因此,如果您在某些情况下替换跳转目标,则会破坏代码。我猜,如果直接向单个表达式和语句类型添加重写功能,而不是创建新的类型来替换它们,就可以涵盖这一点。

到目前为止,我希望它能有所帮助。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15785548

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档