图片来源:Intel
OpenAI 已任命新的负责人来监督其"星际之门"计算计划,此前该公司决定从主要云服务商租用更多 AI 服务器 ,而非自建数据中心。这一消息来自两位了解变动内情的人士。
据知情人士透露,作为重组的一部分,OpenAI 已将其计算工作划分为三个团队:OpenAI 所用数据中心的技术设计、与云服务商及芯片公司等企业的商业合作,以及 OpenAI 所使用设施的现场管理。
虽然 Stargate 最初指代 OpenAI、Oracle 与软银共建数据中心的计划,如今它已演变为 OpenAI 在未来数年上线千兆瓦级服务器容量的整体战略。OpenAI 正与 Anthropic、Google 等公司展开激烈的技术竞赛,但其业务与技术发展均受限于可调用的服务器规模。该公司预计到 2030 年将在云服务器上投入惊人的 6650 亿美元 。
包括 Microsoft 和 Anthropic 在内的主要人工智能开发商和云服务提供商,一直在争相控制高质量的数据中心站点 ,或与其他正在开发此类站点的云服务提供商签订服务器租赁协议。
据 The Information 报道,OpenAI 新的基础设施领导层上任之际,其竞争对手 Anthropic 近几个月来一直在悄悄加强其数据中心团队 。
在 OpenAI,前 Intel 高管 Sachin Katti 于 11 月底被任命为 OpenAI 的基础设施负责人,目前负责监督 Stargate 项目组。
此前,几位这样的领导者向 OpenAI 总裁 Greg Brockman 汇报,团队按项目而非角色组织。其中一个先前的团队致力于实现 OpenAI 建设自有数据中心的雄心。最近,这一雄心已让位于租赁云服务器。(The Information 此前报道 ,Katti 正计划重组计算团队。)
“人工智能需求发展迅猛,我们的计算团队已在云服务、芯片和基础设施领域构建了强大的生态系统来满足这一需求,”Katti 在一份声明中表示。“进展令人惊叹,我对未来的工作充满期待,我们将继续构建让全球各地的人们都能受益于人工智能突破的系统。”
云服务协议
在 Katti 加入之前,OpenAI 由两位高管——长期任职于 OpenAI 的前德勤经理 Peter Hoeschele,以及曾在 Meta 和 Google 任职的工程师 Chris Malone——分别负责两个数据中心团队,两人均向 Brockman 汇报。Hoeschele 现向 Katti 汇报,并领导一个名为"产业计算生态系统与合作伙伴关系"的团队(内部称为 Epic),该团队主要专注于公司不断扩大的商业合作关系网络。
这些合作关系包括 OpenAI 与其他公司(主要是 Microsoft、Oracle 和 Amazon)的云交易,以及芯片合作协议,其中包括一项多年期协议:OpenAI 将使用高达 6 吉瓦的 AMD 芯片,以换取 AMD 最高 10%的普通股;此外还有与初创公司 Cerebras Systems 达成的芯片使用协议。
新成立的技术工程与设计团队旨在重新构思 OpenAI 所用 AI 服务器集群的设计与部署方案,以优化其 AI 性能。这包括确定集群的规模大小以及设施的地理选址。该团队由 Malone 与前 Microsoft 工程负责人 Adrian Caulfield 共同领导。
该团队密切评估 OpenAI 将使用的不同芯片如何影响其数据中心需求,与此同时,一个由前 Google 芯片高管 Richard Ho 领导的半导体团队正与芯片设计公司博通合作开发内部芯片,两者分属不同体系。OpenAI 希望这些芯片有朝一日能帮助降低推理成本,即运行 ChatGPT 及其他由其模型驱动的产品所产生的开销。与 Satti 一样,Ho 也向 Brockman 汇报。
Katti 领导下的另一个团队由 Nick Saddock 负责,他曾是谷歌数据中心部门的前总监,负责监督其他公司为 OpenAI 建设的实体数据中心的所有时间线和运营事宜。这包括 OpenAI 计划获取大量计算资源的 Oracle 运营站点。Saddock 的职责涉及与这些 OpenAI 商业伙伴沟通,其中还包括施工经理、网络运营团队以及其他负责确保 OpenAI 服务器尽快上线的人员。
Saddock 的角色填补了 Keith Heyde 离职几周后留下的空缺,后者曾负责 Stargate 物理数据中心的建设工作。
参考资料:
https://www.theinformation.com/articles/openai-names-new-infrastructure-leaders-following-stargate-strategy-shift?rc=jn0pp4