这个标题说明了一切--这些自我愈合的障碍是什么,为什么它们在神兰多阿2.0中很重要?
发布于 2020-09-29 17:27:59
这一解释将在第一部分和第二部分上传回我试图在Shenandoah 2.0上提出的一些答案。
要真正回答这个问题,我们需要了解load reference barrier是如何实现的,以及GC cycle一般是如何工作的。
当某个GC cycle被触发时,它首先选择垃圾最多的区域;也就是说:集合中的对象非常少(这在将来会很重要)。理解这个主题的最简单的方法是通过一个例子。假设这是一个现在存在于某个区域的计划:
refA refB
|
---------
| mark |
---------
| i = 0 |
| j = 0 |
--------- 区域中存在一个对象,并且有两个引用指向它:refA和refB。GC启动,这个区域被选择为垃圾收集。同时,应用程序中有一些活动线程试图通过refA和refB访问该对象。因为这个对象在某个时候是alive,所以它需要被疏散到一个新的区域( mark-compact阶段的一部分)。
因此:GC是活动的,同时,我们通过refA/refB阅读。当我们完成这一读取时,我们将步进load-reference-barrier,实现这里。注意它内部有一些“过滤器”(通过一堆if/else语句)。具体地说:
obj == fwd。在这个时候,发生了一些事情。首先创建一个副本,然后mark 成为前进者
refA refB
|
-------------- ---------
| forwardee | ---- | mark |
-------------- ---------
| i = 0 | | i = 0 |
| j = 0 | | j = 0 |
--------- ---------只有在代码的后面,才会更新refA和refB,以指向新的(复制的)对象。但这意味着一件有趣的事情。这意味着,在refA和refB被实际指定为指向新对象之前,它们当前指向的对象位于“集合集”中。因此,如果GC是活动的,即使已经建立了forwardee,load-reference-barrier仍然需要做一些工作。
因此,Shenandoah背后的非常聪明的人说:为什么不在forwardee建立之后(或者当forwardee已经因为其他引用而闻名时)立即更新那里的引用呢?这正是他们所做的。
让我们假设我们回到最初的绘图:
refA refB
|
---------
| mark |
---------
| i = 0 |
| j = 0 |
--------- 再一次,我们“启用”所有过滤器:
refA读取的线程refA和refB背后的对象是活动的。这就是“自我治愈障碍”将会发生的情况:
refB refA
| |
-------------- ---------
| forwardee | ---- | mark |
-------------- ---------
| i = 0 | | i = 0 |
| j = 0 | | j = 0 |
--------- ---------区别是显而易见的:refA被移动到通过CAS指向新对象的现场。如果要通过refA再次读取(GC仍然处于活动状态),这将导致一个更快的加载引用屏障执行。为什么?因为refA指向一个不在“集合集”中的对象。
但这也意味着,如果我们通过refB阅读并看到fwd != obj --代码可以完成同样的任务并在适当的地方更新refB,此时第一次读取是通过refB进行的。
据知情人士说,这提高了业绩,我相信他们。
https://stackoverflow.com/questions/64124676
复制相似问题