A Bayesian Perspective on Evidence for Evolving Dark Energy
演化暗能量:基于贝叶斯模型比较的再审视
https://arxiv.org/pdf/2511.10631
本文《A Bayesian Perspective on Evidence for Evolving Dark Energy》的核心重点可以概括为以下几点:
总而言之,本文通过严谨的贝叶斯分析,挑战了当前关于暗能量演化的主流结论,指出其背后的驱动力可能是数据集间的系统性张力,而非对暗能量物理本质的直接观测。它提醒科学界,在解读前沿宇宙学数据时,必须同时考虑多种统计方法和数据组合的影响,避免过度解读单一框架下的显著性结果。

DESI合作组报告称,当将其数据与其他前沿宇宙学探测结果结合时,显著倾向于动态暗能量模型(w0waCDM),而非宇宙学常数模型(ΛCDM)。我们采用嵌套采样方法进行直接的贝叶斯模型比较,计算贝叶斯证据,得出了相反的结论:对于DESI DR2 BAO数据与Planck CMB数据的关键组合,我们的贝叶斯证据略微支持ΛCDM模型(对数贝叶斯因子 ln B = −0.57±0.26),这与合作组所报告的3.1σ频率学显著性(支持w0waCDM)形成对比。将分析扩展至同时结合DES-Y5超新星目录后,我们的贝叶斯分析得出支持w0waCDM模型的显著性为3.07±0.10 σ。通过执行全面的张力分析,运用五种互补性度量指标,我们定位了问题根源:在ΛCDM框架内,DESI DR2与DES-Y5之间存在显著的(2.95±0.04 σ)、低维张力;而w0waCDM模型之所以被偏好,正是因其额外参数能够缓解这一特定的数据集冲突。我们的发现与独立的几何分析结果一致,表明对动态暗能量的偏好主要源于其对数据集间张力的缓解作用,因此对其统计显著性的解释应持谨慎态度。
引言
DESI DR2数据发布[1]报告称,基于似然比检验统计量推导出的频率学假设检验,其数据对动态暗能量模型(w0waCDM)相对于ΛCDM模型的偏好高达4.2σ。这一强有力的证据源于对DESI DR2 BAO数据、Planck 2018 CMB测量数据[2]以及DES-Y5超新星目录[3]的联合分析。该结果在宇宙学界引发了广泛关注,暗示着可能偏离标准宇宙学模型[4]。近期一些独立分析从多个角度对该结论提出了质疑,尤其聚焦于DES-Y5超新星目录的稳健性[5,6],或考察了不同DESI数据版本之间的一致性[7]。尽管关于结合早期与晚期宇宙探测数据仍存在持续争议,但学界共识认为,仅使用早期宇宙探测数据——即Planck CMB与DESI BAO数据的组合——已显示出3σ频率学显著性,支持暗能量演化模型而非ΛCDM。根据公认的频率学结果解释准则,这一显著性已超过“新物理”存在的证据阈值[8]。
贝叶斯模型比较方法在宇宙学中已被广泛应用,它通过计算贝叶斯证据提供了一种互补性的分析途径——该方法通过对先验体积积分自然惩罚模型复杂度[9](即贝叶斯奥卡姆剃刀)。同时采用频率学和贝叶斯视角进行分析已日益普遍[10];而对于像“暗能量演化”这样重大的科学主张,运用这些成熟可靠的分析框架[11]至关重要。
在本文中,我们使用嵌套采样方法(PolyChord)[12, 13]对DESI DR2数据进行了贝叶斯分析。完整细节见我们即将发表的配套论文[14]。本文重点比较ΛCDM模型与w0waCDM模型在DESI表VI[1]所列数据组合下的表现。我们发现,当运行这一成熟的贝叶斯模型比较流程时,支持暗能量演化的贝叶斯证据显著减弱;CMB与BAO数据的联合分析反而更倾向于ΛCDM模型。最后,我们对两种方法得出不同结论的原因进行了一些讨论。
方法




其中,Φ⁻¹ 是标准正态累积分布函数的反函数。通过这种转换,我们可以将推导出的贝叶斯因子转化为显著性水平的上限,以便与频率学结果进行比较。将贝叶斯因子转换为显著性水平可实现频率学与贝叶斯假设检验框架之间的直接比较,但这一过程应极为谨慎地进行[22–24]。我们选择了一种通用且保守的转换方法,以确保所报告的显著性水平是一个合理可达到的上限值。在贝叶斯框架下,解释贝叶斯因子的最佳实践是引用“下注赔率”,并由读者自行判断是否愿意“下注”。尽管这种转换存在细微差别,且两种框架之间确实存在某些根本性的哲学差异,但人们普遍预期这两种假设检验的结果在优选模型上应当达成一致。
结果



我们发现,DESI DR2与CMB的结合与几何分析Efstathiou [7]一致,表明ΛCDM得到了独立支持。关于贝叶斯和频率论模型比较之间存在较大差异的报告需要仔细审查。对于这类问题,成熟的贝叶斯工作流程预计将产生与频率论构造紧密平行的结果;特别是,潜在的计算应该是密切相关的[27]。此外,当适当校准时,频率论假设检验已经支撑了包括希格斯玻色子发现[28]在内的里程碑式发现。在众所周知的病理学机制之外[29],广泛声称要么推断范式根本上存在缺陷是难以证明的。
因此,粒子物理学的标准做法是通过广泛的蒙特卡洛伪实验来验证将检验统计量转化为显著性的渐近近似[30],尽管计算成本相当高。这种验证策略在概念上类似于这里采用的嵌套采样蒙特卡洛机制[31]。鉴于在所有包含DESI DR2的组合中持续存在的显著差异,并且考虑到该数据集的相对较小的有效大小(一个13分量压缩数据向量),合理地质疑不仅是频率论框架本身,还有渐近公式在此实例中的适用性。对此可能性的系统调查留给未来的工作。

结论

原文链接:https://arxiv.org/pdf/2511.10631