AlphaEvolve:一个由Gemini驱动的编码智能体,用于设计高级算法
2025年5月14日
AlphaEvolve团队
新型AI智能体通过结合大语言模型的创造性与自动评估器,为计算领域的数学与实际应用进化算法。
大语言模型具有显著的通用性。它们可以总结文档、生成代码,甚至头脑风暴新想法。现在我们已将这些能力扩展到针对数学和现代计算中基础且高度复杂的问题。
今天,我们宣布推出AlphaEvolve——一个由大语言模型驱动的进化编码智能体,用于通用算法发现与优化。AlphaEvolve将Gemini模型的创造性问题解决能力与验证答案的自动评估器相结合,并利用进化框架来改进最有前景的想法。
AlphaEvolve提升了某机构数据中心、芯片设计和AI训练过程的效率——包括训练支撑AlphaEvolve自身的大语言模型。它还帮助设计了更快的矩阵乘法算法,并为未解决的数学问题找到了新解法,展现了在众多领域应用的巨大潜力。
使用大语言模型设计更好的算法
2023年,我们首次证明大语言模型可以生成用计算机代码编写的函数,帮助在一个开放的科学问题上发现新的、可验证正确的知识。AlphaEvolve是一个智能体,它能够超越单个函数的发现,进化整个代码库,开发更复杂的算法。
AlphaEvolve利用了一系列最先进的大语言模型:最快、最高效的Gemini Flash模型,最大化探索思路的广度;而最强大的Gemini Pro模型,则通过富有洞察力的建议提供关键的深度。这些模型共同提出实现算法解决方案的计算机程序代码。
图示:提示采样器首先为大语言模型组装提示,然后模型生成新程序。这些程序由评估器评估并存储在程序数据库中。该数据库实现了一个进化算法,决定哪些程序将用于未来的提示。
AlphaEvolve使用自动评估指标来验证、运行和评分所提出的程序。这些指标对每个解决方案的准确性和质量提供客观、可量化的评估。这使得AlphaEvolve在进展可以被清晰、系统化测量的广泛领域中特别有用,例如数学和计算机科学。
优化计算生态系统
在过去一年中,我们已将AlphaEvolve发现的算法部署到某机构的计算生态系统中,包括数据中心、硬件和软件。这些改进的影响在AI和计算基础设施中被放大,为所有用户构建更强大、更可持续的数字生态系统。
图示:AlphaEvolve如何帮助某机构提供更高效的数字生态系统——从数据中心调度、硬件设计到AI模型训练。
改进数据中心调度
AlphaEvolve发现了一个简单但非常有效的启发式方法,帮助Borg系统更高效地协调某机构庞大的数据中心。该解决方案已在生产环境中运行一年多,平均持续恢复某机构全球计算资源的0.7%。这种持续的效率提升意味着在任何给定时刻,相同的计算资源可以完成更多任务。AlphaEvolve的解决方案不仅带来了强大的性能,还提供了可读代码的显著操作优势:可解释性、可调试性、可预测性和易于部署。
辅助硬件设计
AlphaEvolve提出了一个Verilog重写方案,移除了一个关键的、高度优化的矩阵乘法算术电路中不必要的位。关键的是,该方案必须通过强大的验证方法,以确保修改后的电路保持功能正确性。该方案已被集成到即将推出的Tensor Processing Unit(某机构的自定义AI加速器)中。通过建议使用芯片设计人员标准语言的修改,AlphaEvolve促进了AI与硬件工程师之间的协作方法,加速了未来专用芯片的设计。
增强AI训练与推理
AlphaEvolve正在加速AI性能和研发速度。通过找到更聪明的方法将大型矩阵乘法操作分解为更易管理的子问题,它将Gemini架构中这一关键内核的速度提升了23%,从而使Gemini的训练时间减少了1%。由于开发生成式AI模型需要大量计算资源,每获得一点效率,就能转化为可观的节省。除了性能提升,AlphaEvolve还将内核优化所需的工程时间从专家数周的努力减少到数天的自动实验,使研究人员能够更快地创新。
AlphaEvolve还可以优化底层GPU指令。这个极其复杂的领域通常已被编译器高度优化,因此人类工程师通常不直接修改它。AlphaEvolve在基于Transformer的AI模型中为FlashAttention内核实现实现了高达32.5%的加速。这种优化帮助专家定位性能瓶颈,并轻松地将改进集成到其代码库中,从而提高生产力,并在未来节省计算和能源。
推进数学与算法发现的前沿
AlphaEvolve还可以为复杂的数学问题提出新方法。给定一个计算机程序的最小代码骨架,AlphaEvolve设计了一种新颖的基于梯度的优化过程的许多组件,该过程发现了多种新的矩阵乘法算法——这是计算机科学中的一个基本问题。
图示:AlphaEvolve为发现更快的矩阵乘法算法而提出的一系列更改。在此示例中,AlphaEvolve提出了跨多个组件的大量更改,包括优化器和权重初始化、损失函数以及超参数扫描。这些更改非常复杂,在进化过程中需要15次变异。
AlphaEvolve的过程发现了一种使用48次标量乘法来乘4x4复值矩阵的算法,改进了此前在该领域被认为最佳的Strassen 1969年算法。这一发现表明,相较于我们之前专门研究矩阵乘法算法的AlphaTensor工作有了显著进步——对于4x4矩阵,AlphaTensor仅改进了二进制算术。
为了研究AlphaEvolve的广度,我们将该系统应用于数学分析、几何学、组合数学和数论中的50多个开放问题。该系统的灵活性使我们在几小时内就能完成大多数实验的设置。据我们所知,在大约75%的情况下,它重新发现了最先进的解决方案。
在20%的情况下,AlphaEvolve改进了先前已知的最佳解决方案,在相应的开放问题上取得了进展。例如,它推进了接吻数问题。这个几何挑战已经吸引了数学家300多年,涉及与一个单位球体相切的最大非重叠球体数量。AlphaEvolve发现了一个由593个外球体组成的构型,并在11维中建立了新的下限。
前进之路
AlphaEvolve展示了从发现特定领域的算法到为广泛的现实世界挑战开发更复杂算法的进展。我们期望AlphaEvolve能够随着大语言模型能力的提升而持续改进——特别是当它们在编程方面变得更好时。
我们与某团队一起,正在构建一个与AlphaEvolve交互的友好用户界面。我们计划为选定的学术用户提供一个早期访问计划,并正在探索使AlphaEvolve更广泛可用的可能性。
虽然AlphaEvolve目前正在应用于数学和计算领域,但其通用性意味着它可以应用于任何解决方案可以被描述为算法并能自动验证的问题。我们相信AlphaEvolve在材料科学、药物发现、可持续性以及更广泛的技术和商业应用等更多领域可能具有变革性。FINISHED
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。