首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Mono csharp AOT优化

Mono csharp AOT优化
EN

Stack Overflow用户
提问于 2020-02-27 13:54:37
回答 1查看 166关注 0票数 1

我开始学习C#,来自C++背景。我想了解C#内存模型,并将其与C++的模型进行比较。在这样做的过程中,我找到了一篇文章C#记忆模型的理论与实践。到目前为止,没有什么令人惊讶的事情,但我尝试在本文中复制编译器优化,删除额外的内存读取,然后遇到问题。我使用的是mono编译器,无法再现优化。以下是C#代码:

代码语言:javascript
复制
// test.cs

class MainApp {
  static void Main() {
    Foo foo = new Foo();
    foo.bar();
  }
}

class Foo {
  private int _A = 0, _B = 1;
  public bool bar() {
    if (_B == -1) throw new Exception();
    int a = _A;
    int b = _B;
    return a > b;
  }
}

然后运行以下编译命令:

代码语言:javascript
复制
mcs -optimize+ test.cs
mono --aot -O=all test.exe

当我检查objdump -d test.exe.so的输出时,我会看到以下(相关的)装配线:

代码语言:javascript
复制
0000000000000500 <Foo_bar>:
 500:   48 83 ec 08             sub    $0x8,%rsp
 504:   48 89 3c 24             mov    %rdi,(%rsp)
 508:   48 8b c7                mov    %rdi,%rax
 50b:   48 63 40 14             movslq 0x14(%rax),%rax
 50f:   83 f8 ff                cmp    $0xffffffff,%eax
 512:   74 1b                   je     52f <Foo_bar+0x2f>
 514:   48 8b 0c 24             mov    (%rsp),%rcx
 518:   48 63 41 10             movslq 0x10(%rcx),%rax
 51c:   48 63 49 14             movslq 0x14(%rcx),%rcx
 520:   3b c1                   cmp    %ecx,%eax
 522:   40 0f 9f c0             setg   %al
 526:   48 0f b6 c0             movzbq %al,%rax
 52a:   48 83 c4 08             add    $0x8,%rsp
 52e:   c3                      retq  

 ... # exception stuff

因此,指令50b51851c似乎表明读取仍在重复进行,即使可以优化它。我的问题是,我是不是做错了什么,这是错过了优化的机会,还是这里还有其他的问题(有一个很好的理由,为什么这个优化不会发生)?我现在还没有访问Visual的权限,我很想知道它是否真的进行了这种优化。

这篇文章声称我应该得到这样的东西:

代码语言:javascript
复制
push        eax
mov         edx,dword ptr [ecx+8]
cmp         edx,0FFFFFFFFh
je          00000016
mov         eax,dword ptr [ecx+4]
cmp         eax,edx

我决定检查一下C++的情况是否不同,并对我的发现感到有点惊讶。以下代码:

代码语言:javascript
复制
class Foo {
  int _A{0};
  int _B{1};

  public:
  __attribute__ ((noinline)) bool bar() volatile {
    if (_B == -1) throw 0;
    int a = _A;
    int b = _B;
    return a > b;
  }
};

int main(int argc, char **argv) {
  volatile Foo foo;
  foo.bar();
}

导致以下(相关)大会:

代码语言:javascript
复制
00000000000007e4 <_ZNV3Foo3barEv>:
 7e4:   8b 47 04                mov    0x4(%rdi),%eax
 7e7:   83 f8 ff                cmp    $0xffffffff,%eax
 7ea:   74 0b                   je     7f7 <_ZNV3Foo3barEv+0x13>
 7ec:   8b 17                   mov    (%rdi),%edx
 7ee:   8b 47 04                mov    0x4(%rdi),%eax
 7f1:   39 c2                   cmp    %eax,%edx
 7f3:   0f 9f c0                setg   %al
 7f6:   c3                      retq   

 ... # exception stuff

因此,优化也不会在这里进行(不过,公平地说,如果没有((noinline)),这段代码甚至不会出现在对象文件中)。这是来自clang的相同信息

代码语言:javascript
复制
0000000000400610 <_ZNV3Foo3barEv>:
  400610:   50                      push   %rax
  400611:   8b 47 04                mov    0x4(%rdi),%eax
  400614:   83 f8 ff                cmp    $0xffffffff,%eax
  400617:   74 0a                   je     400623 <_ZNV3Foo3barEv+0x13>
  400619:   8b 07                   mov    (%rdi),%eax
  40061b:   3b 47 04                cmp    0x4(%rdi),%eax
  40061e:   0f 9f c0                setg   %al
  400621:   59                      pop    %rcx
  400622:   c3                      retq   

 ... # exception stuff

因此,在cmp指令中仍然有一个额外的读,只是“内联”。

相关--version

代码语言:javascript
复制
Mono C# compiler version 4.6.2.0
g++ (Ubuntu 7.4.0-1ubuntu1~18.04.1) 7.4.0
clang version 6.0.0-1ubuntu2 (tags/RELEASE_600/final)
EN

回答 1

Stack Overflow用户

发布于 2020-02-27 14:02:00

我把你的代码扔给了SharpLab,得到了:

代码语言:javascript
复制
    L0000: push rsi
    L0001: sub rsp, 0x20
    L0005: mov eax, [rcx+0xc]
    L0008: cmp eax, 0xffffffff
    L000b: jz L001e
    L000d: mov ecx, [rcx+0x8]
    L0010: cmp ecx, eax
    L0012: setg al
    L0015: movzx eax, al
    L0018: add rsp, 0x20
    L001c: pop rsi
    L001d: ret
    L001e: mov rcx, 0x7ffa2f8d4170
    L0028: call 0x7ffa8f384690
    L002d: mov rsi, rax
    L0030: mov rcx, rsi
    L0033: call System.Exception..ctor()
    L0038: mov rcx, rsi
    L003b: call 0x7ffa8f33a4f0
    L0040: int3

我的程序集比您的程序集更生疏,但是我只能看到每个字段被访问一次?

请注意,.NET核心JIT是2层,而SharpLab只显示第一层,因此如果它处于热路径上,可能会对其进行进一步优化。

所以这看起来像个Mono的东西?

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60434849

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档