首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏数据派THU

    讲座预告 | 大模型、AI经济与AI基础设施

    blocks|key|2175393|text||type|atomic|depth|inlineStyleRanges|entityRanges|offset|length|data|2175397|2175400|entityMap|IMAGE|mutability|IMMUTABLE|imageUrl|https://developer.qcloudimg.com/http-save/yehe-1269631/26b591d9cc02373fa34c7f8f2c5b910b.png|imageAlt|

    36520编辑于 2023-04-25
  • 来自专栏AI

    保护前沿AI研究基础设施的安全

    我们的使命是确保先进AI惠及每个人,而这一工作的基础是支持我们研究的基础设施。为了安全地实现这一使命,我们优先考虑这些系统的安全性。这里,我们概述了当前支持大规模前沿模型安全训练的架构和操作。 这包括设计用于在安全环境中保护敏感模型权重的措施以促进AI创新。尽管这些安全功能将随着时间的推移而发展,但我们认为提供当前对我们研究基础设施安全性的看法是有价值的。 我们希望这些见解能帮助其他AI研究实验室和安全专业人员在保障他们自己的系统时(我们也在招聘)。威胁模型研究基础设施由于实验工作负载的多样性和快速演变性,呈现出独特的安全挑战。 未来控制的研究与开发保护日益先进的AI系统需要持续的创新和适应。我们在开发新的安全控制方面处于前沿,如我们在“重新构想先进AI的安全基础设施”博客文章中所述。 我们对研究和开发的承诺确保我们始终领先于新兴威胁,并继续增强我们的AI基础设施的安全性。加入我们在OpenAI,我们致力于不断发展和保护先进的AI。我们邀请AI和安全社区加入我们的使命。

    39410编辑于 2024-06-06
  • 迎接AI挑战:构建新一代AI网络基础设施

    随着人工智能(AI)技术的飞速发展,AI模型的复杂度和数据规模急剧增加,对基础设施的需求提出了前所未有的挑战。 传统的互联网基础设施已难以满足AI技术对高性能计算、大规模数据处理和低延迟网络的需求,从而催生了新一代AI基础设施的诞生。 新一代AI基础设施特点一、计算能力跃升新一代AI基础设施依托于高性能计算技术,广泛采用GPU、TPU等专用硬件加速深度学习和机器学习进程。 与传统互联网基础设施相比,新一代AI基础设施在网络带宽、延迟、可靠性和冗余等方面提出了更高的要求。网络对于AI而言,不仅是重要,而且是必要的。AI大模型的训练和推理过程高度依赖分布式计算和存储。 通过提升计算能力、优化数据处理效率和改进网络性能,新一代AI基础设施AI技术的广泛应用和深度融合提供了坚实基础。未来,随着AI应用场景的不断拓展和深化,对于基础设施的需求也将进一步增加。

    67010编辑于 2024-08-16
  • 来自专栏数据派THU

    干货 | 赵亚雄:大模型、AI经济和AI基础设施

    我希望借助这个机会,把自己这一段时间来思考的有关AI基础设施还有AGI再到大模型等内容,从相对抽象的概念到与大家关系密切的、具体到各个层面的部分内容串联起来。 这两种模式导致两种硬件之上的基础设施和软件会具有完全不同的形态还有生态上下游的表现形式。 我们作为一个软件的基础设施,也同样扮演了一个类似网络中路由器的角色,站在各色各样的硬件厂商还有各种各样的大模型和AI应用中间来解决,通过把共性的能力和需求做匹配的方式来更好提高两者之间的效率。 但是否我们可以通过基础设施的快速跟进,然后模型和应用端的持续投入,让这个泡沫被刺破时造成的负面影响降到最低。这个就是AI基础设施在其中最根本的价值,它价值的核心就是算力。 这就意味着我们在AI基础设施方面的短板有可能在一段时间之内进一步被放大。我们只有发挥自己的优势,才能在关键领域集中资源快速由点到面突破整体AI经济和基础设施的落后局面。 编辑:文婧 校对:林亦霖

    58110编辑于 2023-05-11
  • 来自专栏网络安全技术点滴分享

    Meta基础设施演进与AI技术革命

    Meta基础设施演进与AI时代在过去的21年里,Meta从连接美国少数大学几千人的小型社交网络,发展成为服务全球超过34亿人的多个应用和新型硬件产品。 我们的基础设施经历了显著演进,从几个托管设施中的小型服务器上的少量软件系统,发展成为庞大的全球网络化运营。基础设施堆栈扩展(2004-2010年)早期阶段,我们的工程工作重点在于扩展软件堆栈。 工作负载登场(2020年)GPU的出现我们在2010年代末首次遇到AI引发的基础设施挑战,当时短视频变得非常流行。 加速GPU规模和AI基础设施(2023年)我们设计了一个使用数据中心建筑所有可用电力的集群,这导致我们在2023年底构建了两个各含24k H100的集群,一个使用Infiniband,另一个使用RoCE 我们的下一个AI集群Prometheus将是一个1吉瓦的集群,横跨多个数据中心建筑。构建Prometheus是一项巨大的工程壮举,基础设施横跨单个数据中心区域中的五个或更多数据中心建筑。

    23710编辑于 2025-10-01
  • 来自专栏腾讯开源的专栏

    开源公告|AI-Infra-Guard(AI基础设施安全评估工具) 发布

    项目简介 AI Infra Guard(AI Infrastructure Guard) 是由混元安全团队-朱雀实验室研发的一款高效、轻量、易用的AI基础设施安全评估工具,专为发现和检测AI系统潜在安全风险而设计 功能特性 ● 高效扫描 支持 28 种 AI 框架指纹识别 涵盖 200+ 安全漏洞数据库 快速且无害发现AI基础设施的安全威胁 ● 易于使用 开箱即用,无复杂配置 指纹、漏洞YAML规则定义 灵活的匹配语法 ● 轻量级 核心组件简洁高效 二进制体积小,资源占用低 跨平台支持 适用场景 针对企业内AI基础设施系统的漏洞检测和修复,可用于AI 开发环境安全检测、巡检、运维,DevSecOps 集成等场景。 /ai-infra-guard -file target.txt AI分析 . =` 不等 ● `~=` 正则匹配 ● `&&` 与 ● `||` 或 ● `()` 括号分组 关于腾讯朱雀实验室 朱雀实验室由腾讯安全平台部于2019年成立,聚焦AI与大模型基础设施安全、大模型内生安全与大模型赋能安全等领域的前沿技术研究与业务安全保障

    2.5K10编辑于 2025-02-05
  • 展望AI基础设施的可靠性工程

    然而,随着AI基础设施的兴起,大规模模型训练和推理系统的普及,这一范式正面临根本性的挑战。 下面我们就一起理解下AI基础设施中的可靠性挑战吧! 一、总体框架 如下图所示,AI基础设施的可靠性是一个贯穿硬件、系统、训练过程、模型行为直至用户结果的多层次、跨域耦合问题。 七、展望:AI基础设施的可靠性工程演进方向 综上所述,AI基础设施的可靠性正在从“系统稳定性问题”演进为一个贯穿计算、数据与决策全过程的系统性工程问题。 传统IT基础设施中可靠性目标,已难以覆盖AI系统中由概率计算、分布漂移以及多层耦合带来的复杂失效模式。 展望未来,AI基础设施的可靠性工程将呈现出几个重要发展方向。

    23010编辑于 2026-03-30
  • AMD携手Nutanix打造全栈AI基础设施平台

    双方将共同打造一个“全栈AI基础设施平台”,该平台将利用Nutanix的软件栈,使其所支持的本地、云端及边缘环境能够运行Agentic AI和推理应用。目前,Nutanix仅支持Nvidia的GPU。 Nutanix CEO认为,企业级Agentic AI的采用仍处于“非常早期的阶段”。公司希望通过优化其软件栈,让这类应用能够在客户期望的任何地方运行,从而加速其普及进程。

    9900编辑于 2026-03-09
  • 来自专栏云云众生s

    用于基础设施即代码的生成式AI工具

    基础设施即代码(IaC)帮助DevOps、IT运维和其他工程师在不断扩大、复杂化和多样化的动态IT环境中管理数据、应用程序和基础设施。 虽然有许多令人信服的理由支持采用IaC,但有一项创新使其更具优势:生成式人工智能(AI)。仅仅一年前,人们对于AI生成的代码的准确性存在很多怀疑。 OpenAI一直在领导产业,推出了ChatGPT等生成式AI工具,而Meta的LLAMA等其他强大的大语言模型(LLMs)也具备广泛的生成式AI能力。 代码解释 生成式AI模型可以解析和解释广泛的编程语言编写的代码,这得益于它们在数百万行代码的广泛训练。 你可以用任何东西训练GPT模型,比如政策文件、编码准则或IT基础设施大小计算器,并让聊天机器人使用这些后端模型来回答客户或内部利益相关者的查询(请注意,根据客户数量和使用情况,这些能力是有成本的)。

    62310编辑于 2024-03-28
  • 来自专栏HUMAN3.0

    AI 不是工具升级,而是你的「能力基础设施

    AI 最值得重视的地方,不是它能帮你把某件事做得更快,而是它正在成为一种新的能力基础设施。不是让你在原来的轨道上跑得更快,而是在重修你的轨道。 基础设施是在底层托住你。这就是区别。 03 为什么说 AI 不是工具升级,而是能力基础设施? 因为两者改变的根本不是一个层级。 工具解决的是"动作效率",基础设施解决的是"能力组织方式"。 AI 的价值不只是替你写一段文字,而是帮你减少大量重复性决策,让大脑从低价值消耗中抽离出来,去处理那些真正只有你能做的事。 工具由人驱动。基础设施会反过来塑造人的行为。 你把 AI 当工具,它是你手上一把更锋利的刀;你把 AI基础设施,它会变成你的操作系统、认知底座和生产流水线。这不是程度差别,是物种差别。 当你把 AI 当工具,你得到的是效率。当你把 AI基础设施,你得到的是杠杆。前者让你更快,后者让你更强——而这,才是 AI 时代最值得普通人认真思考的问题。

    11810编辑于 2026-03-17
  • 来自专栏网络安全与可视化

    什么是网络基础设施?网络基础设施与IT基础设施的异同?

    网络基础设施通常包括硬件和软件,并且可以在用户,服务,应用程序和进程之间进行计算和通信。 二、网络基础设施和IT基础设施有何不同? 网络基础设施和IT基础设施相似。 通常,IT基础设施被视为更大,更广泛的术语。IT基础设施(或信息技术基础设施)定义了基于IT服务的信息技术元素的集合。 在更大的IT基础设施定义中,网络基础设施可能被视为较小的类别。完善的网络基础设施支持广泛的IT基础设施的成功。公司需要坚实的IT基础设施和网络基础设施,才能拥有连贯的解决方案并获得持续的成功。 三、为什么网络基础设施是IT基础设施的最重要组成部分? 拥有可靠的IT基础设施和合格的人员很重要,但如果没有构建良好的网络基础设施,这两项都是不够的。 四、网络基础设施面临的主要挑战是什么? 在最佳运行的网络基础设施方面存在许多挑战。前三大网络基础设施挑战是: 1.集中流量。 2.处理重复数据。

    5.9K31发布于 2020-04-24
  • 数据中心争议可能拖慢AI基础设施增长

    报告作者表示,需要建立具有法律约束力的社区效益协议,以防止当地反对意见限制AI基础设施的增长。“数据中心既具争议性,又是支撑数字经济的人工智能技术的关键所在,”报告写道。 该报告发布之际,对计算能力的需求正在上升,AI数据中心在全国范围内扩散。 一位前政府首脑曾宣布了一项由某机构支持的5000亿美元AI基础设施计划,并要求建立长期保障措施,确保社区不会留下带来很少效益的数据中心。 “如果不加以控制,这些社区担忧可能会减缓数据中心的快速建设,削弱AI增长,并减缓AI收入流,所有这些都将限制科技公司和政府官员所承诺的AI益处,”报告称。 多家大型科技公司已宣布了数十亿美元的投资,以扩大数据中心和AI基础设施,加入了包括美国近4000个和全球约10700个数据中心的全球网络。

    16210编辑于 2026-02-03
  • 来自专栏DevOps实践之路

    从“没有CICD团队”进化到“使用CICD基础设施的团队,再到“使用AI基础设施的团队”

    使用 CI/CD 基础设施的团队 项目创建 功能编写 代码提交 [CI工具介入] 功能自测 代码 Review [CI工具介入] 合并发布分支 [CI工具介入] 人工构建 [CI工具介入] 人工部署 [ 使用AI基础设施的团队 工程理念的升维:从“构建”到“培育”(从 “追求确定性”到“拥抱不确定性”) 传统理念核心是构建(Build),像建造大楼一样,根据精确的蓝图(需求规格),用标准化的构件(代码库 AI时代,大模型提供了土壤(知识库)、养分(数据)和引导(Prompt),并持续观察、修剪、调整,使其朝着我们期望的方向“生长”,建立有效的观察和干预机制。

    26411编辑于 2025-11-17
  • 来自专栏云云众生s

    红帽Ansible Lightspeed使用AI自动化基础设施管理

    红帽 Ansible Lightspeed 借助 IBM 的 AI 技术,可以极大地减轻使用 Ansible 作为基础设施即代码相关的许多软件配置和管理任务的负担。 它为 Ansible Automation Platform 提供了 AI 的支持,并通过后处理功能增强了 AI 的响应效果。 这是该解决方案的“AI 核心”。 基础设施即代码组件 基础设施即代码(IaC)在 Playbook 允许用户“创建自动化”的方式中起着“至关重要”的作用,Jones说。 Playbook 始终针对特定目标自定义。 另一方面,基础设施即代码强调组件的可组合性。

    75910编辑于 2024-03-27
  • 构建医疗领域主权AI基础设施的技术合作

    SAP和Fresenius正在为医疗保健领域构建一个主权AI平台,旨在为临床环境带来安全的数据处理。对于医疗领域的数据负责人而言,部署AI需要公共云解决方案通常缺乏的严格治理。 此次合作通过创建一个“受控环境”来弥补这一差距,使AI模型能够在其中运行而不损害数据主权。将AI从试点推向生产该项目旨在构建一个开放和集成的生态系统,使医院能够安全地使用AI。 该基础设施负责任地处理健康数据,这是在患者护理中扩展自动化流程的必要条件。该合作通过SAP的“AnyEMR”策略应对数据碎片化问题,该策略支持整合多样化的医院信息系统。 投资主权AI以推动医疗保健发展两家公司都打算在中期投资“数亿欧元”。资金的目标是使用AI支持的解决方案推动德国和欧洲医疗保健系统的数字化转型。 得益于SAP,Fresenius能够充分利用数字化和AI支持流程的全部潜力,并可持续地改善患者护理。”这笔交易表明,欧洲医疗保健AI的下一阶段将侧重于主权基础设施

    14210编辑于 2026-01-22
  • 来自专栏Python

    Daytona:90ms 启动的 AI 代码沙箱基础设施

    这是专为AI时代设计的代码执行基础设施。 一、解决什么问题AI代码生成场景下,开发者面临三大痛点:1.安全隔离不足AI生成的代码可能包含恶意操作,直接执行风险极高2.启动速度慢传统容器冷启动3-5秒,无法满足实时交互需求3.状态难保留每次执行都要重建环境 ="importjson;print(json.load(open('/app/config.json')))"result=sandbox.process.code_run(code)虚拟文件系统让AI 结尾AI代码生成已成为刚需,但安全执行仍是难题。Daytona通过工程化手段将沙箱启动时间压缩到90ms,为AIAgent提供了生产级基础设施。 GitHub:daytonaio/daytona技术文档:docs.daytona.io大模型Agent开发教程:https://yunpan.plus/t/116标签:#Daytona#Github#AI

    71810编辑于 2025-12-06
  • 来自专栏数据猿

    圆桌论坛:AI大模型+Agent,正推动数据基础设施变革?

    大数据产业创新服务媒体 ——聚焦数据 · 改变商业 大模型与智能体的兴起,对数据提出了根本性的新要求,也推动数据基础设施向更高层次演进。 “当前基础设施下,单条数据可能本身无误,但因多样性不足等原因,无法直接应用于智能场景。 在推动AI落地业务时,应积极构建数据基础设施,打通“用户反馈-场景数据-模型迭代”闭环,真正让数据流动起来、让模型持续进化,最终驱动业务实现可衡量的增长。 若要在业务全闭环中应用模型,数据、治理方式及基础设施均需相应调整,因其服务对象已从传统信息系统转向机器与模型。这是必然的发展趋势。 上海纽约大学信息技术部高级主任 常潘 支撑未来智能 数据基础设施还需要哪些突破?

    18210编辑于 2026-01-27
  • 合规自动化平台构建AI内容生成基础设施

    Haast表示,其正在为生成式AI时代构建缺失的基础设施,提供一个代理型AI平台,能够将组织的风险框架直接嵌入到企业工作流程中。该平台主要聚焦于受生成式AI深刻影响的数字内容领域。 当下,各类组织能够以近乎零成本利用AI生成海量的营销文案、产品描述、博客文章、上市及销售材料,导致此类内容的数量激增了10倍。 该初创公司指出,其代理型平台与各类AI助手的区别在于,它在基础设施层面运行。 其目前的计划是进行全球业务扩张,并力求成为每个打算大规模利用AI生成内容的企业事实上的合规层。 “它正在帮助全球领先品牌释放生成式AI的全部潜力,而无需面临监管摩擦或品牌受损的潜在威胁。”FINISHED

    2000编辑于 2026-04-26
  • 来自专栏网络安全技术点滴分享

    AI驱动的自复制网络攻击:黑客利用大语言模型攻陷AI基础设施

    研究人员警告称,黑客已开始利用大型语言模型编写攻击AI系统的代码,进而利用这些被攻陷的AI系统去攻击其他AI机器。 总部位于以色列的Oligo Security发现了这一现象,标志着在网络世界中AI不断对抗AI的又一个里程碑。该公司发现,针对名为Ray的软件的大规模利用证据。 Ray是一款旨在帮助开发者管理和分配AI项目算力的软件。 据Oligo的AI安全研究员Avi Lumelsky称,Oligo的研究人员能够找到超过23万台Ray服务器在线,尽管该公司已发出警告,这可能使它们面临网络攻击的风险。 Oligo的首席技术官兼联合创始人Gal Elbaz表示,这些Ray服务器还被用来自主搜寻更多攻击目标,将其运作转变为一种自我传播的僵尸网络,这显示出“AI基础设施可能被劫持来攻击自身”。

    14610编辑于 2026-02-25
  • 来自专栏人工智能

    解析AI竞赛背后的基础设施战争

    深度拆解全球AI竞赛背后的“隐形战场”* * * 导言:当算力成为新时代的“石油”2023年ChatGPT的爆发,揭开了AI竞赛的冰山一角:GPT-4训练消耗的算力≈5亿度电,足够支撑一个小国全年用电。 * * * Part 2:基础设施战争的三大核心战场战场1️⃣:芯片——算力的“心脏”技术卡脖子:台积电3nm工艺垄断全球90%产能,EUV光刻机成战略物资替代路径:中国Chiplet技术突围,英伟达用 技术伦理:算力是否应该像水电一样成为公共基础设施?开源生态:Hugging Face等社区如何用共享算力对抗巨头垄断?终极命题:当算力成为权力,技术中立性原则是否会被重新定义? 实时动作捕捉+4K渲染需200TFLOPS算力支撑黑科技:腾讯云实时渲染引擎+5G边缘算力调度效果:百万观众直播场景GPU使用率从95%降至60%* * * 未来行动路线图(2025-2030)阶段1:算力基础设施重构 算力调优师岗位需求年增300%,平均年薪达$25万* * *以下是可落地方案路线架构和战略推演图:%% 可落地方案路线架构gantt title 算力基础设施可落地方案路线图(2025-2030)

    86310编辑于 2025-03-20
领券