搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

张量广播机制【Ai Infra 3.0】
概述[PyTorch Java 硕士研一课程]展开代码语言：TXT自动换行AI代码解释# 理解广播机制当对张量执行逐元素操作（如加法、减法或乘法）时，它们的形状通常需要对齐。 ])println(f"Result c:\n{c}")// 结果 c:// tensor([[11, 12, 13],// [14, 15, 16]])展开代码语言：Java自动换行AI 展开代码语言：TXT自动换行AI代码解释import torch.*// 张量 A: 形状 [2, 3]val a = torch.tensor([[1, 2, 3], 右侧对齐结果如下：代码语言：TXT自动换行AI代码解释张量 A: 2 x 3 张量 B: 3兼容性检查：末尾维度：3 等于 3。兼容。结果维度大小为 3。代码语言：TXT自动换行AI代码解释import torch.
17310编辑于 2026-03-13
大数据基建如何迈向 AI Infra？（上）
但如果视角再往上走一层，站在数据部门负责人、Data Infra 架构师、数据平台 Owner 的位置，这个问题就变了。这篇不讲个人如何从 SQL Boy 升级成 AI 数据工程师。那是另一个层面的话题。这篇只讲数据部门和 Data Infra 负责人应该如何提前准备结构化数据方向的下一代基建。我先把范围收窄。没有这些基础，企业连稳定取数都做不到，更谈不上 AI。但从 AI 经营管理的角度看，过去的数据基建有一个天然边界：它主要围绕“数据如何生产和被人消费”来设计。二、AI 经营管理需要的基座，和传统 BI 基座不完全相同很多企业会把 AI 数据应用自然理解成 ChatBI。用户问一句话，系统返回一个数、一张图、一段解释。数仓是事实底座，OLAP 是执行底座，本体化语义层是 AI 理解企业经营世界的语义底座。这个分工如果想清楚，团队就不会陷入“有了 AI 还要不要数仓”这种假问题。
7110编辑于 2026-06-09
来自专栏老张的求知思考世界
AI Agent Infra领域的工具图谱
无论是IT技术领域，还是AI领域，基础技术设施建设一直是很重要的一部分。软件生态要想发展得足够庞大，需要底层硬件和基础设施的支撑。在AI领域，这个逻辑同样适用。过去三年，大模型(LLMs)领域的建设已经有了长足的进步，目前已经进入了阶段性的能力瓶颈期；智能体从23年初步探索到现在的大规模落地应用，也许很快我们会迎来AI First应用爆发点；未来几年AI的发展方向则是向因此我才会在前面介绍智能体基础架构的文章中断言道：Agent Infra是Agent落地的关键！因为它涵盖了Agent从开发到部署的完整生命周期。目前在Agent Infra层面，可以大致划分为这四个赛道：Environment、Context、Tools、Agent Security。下面是我查阅很多资料后整理的Agent Infra工具图谱，供大家参考。
1.2K10编辑于 2025-06-25
来自专栏GiantPandaCV
AI Infra论文阅读之LIGHTSEQ（LLM长文本训练的Infra工作）
介于篇幅原因，这篇文章只读一下这篇paper，把握一下核心的Infra相关的idea。这篇paper应该还没有中会议，处于openreview阶段。
78110编辑于 2024-02-22
大数据基建如何迈向 AI Infra？（下）
第二篇如约而至～本篇基于大数据基建如何迈向 AI Infra？（上）的问题延拓，来针对性的提出落地时的有效价值方案。如果企业只能沉淀 SQL 样例，AI 会越来越像一个会写 SQL 的外包；如果企业能沉淀经营问题集，AI 才有机会进入经营分析工作流。 5. 三、Data Infra 团队的角色会被重新定义 AI 对数据部门的影响，不会只停留在工具层。它会改变 Data Infra 团队在企业里的角色。过去数据平台团队常常被看成支撑部门。下一阶段 Data Infra 的价值，不只在于把数据算出来，还在于把企业经营世界建成 Agent 可以理解、验证和治理的结构。数据负责人如果能提前把这层业务世界建起来，AI 对数据部门带来的冲击，就不只是岗位压力。它会变成 Data Infra 团队重新定义自身价值的一次机会。
7110编辑于 2026-06-09
来自专栏AI
拥抱 AI 范式革新：如何成为 AI Infra 核心专家
在大模型、多模态与智能体技术爆发的今天，AI Infra 正从 “支撑算力供给” 的幕后角色，走向 “定义智能生产方式” 的核心舞台。一、AI Infra 的范式革新：从 “算力供给” 到 “智能生产”过去，AI Infra 的核心目标是 “让模型训得更快”。智能生产平台化：AI Infra 不再是零散的工具集，而是整合了数据、训练、推理、监控的一体化平台，让 AI 应用的开发和部署像使用水电一样便捷。二、AI Infra 核心专家的全栈技术栈要成为 AI Infra 核心专家，必须构建覆盖 “硬件 - 分布式 - 框架 - 工程化 - 架构设计” 的全栈能力。1. 行业标准：参与制定 AI Infra 标准、开源贡献、技术布道。业务赋能：理解业务场景，设计最优 AI Infra 方案，支撑智能体、多模态、世界模型等新应用。
1.4K12编辑于 2026-02-13
来自专栏机器之心
大模型最难的AI Infra，用Vibe Coding搞定
然而，当我们目光转向实际的系统，特别是 AI Infra 这种复杂系统时，Vibe Coding 就会常常会陷入「水土不服」的困境。总结下来，主要有这三个方面的问题。而这些问题背后的根源在于：AI Infra 到底还是个复杂系统，动辄数万行代码、成百上千个相互关联的决策点，而当前的对话式编程缺乏持久化、结构化的决策管理机制。换句话说，Vibe 本身是模糊且不稳定的，无法支撑严肃复杂的 Infra。不过 Vibe Coding 的发展不可逆，其广泛应用的潜力不应就此止步。要让 Vibe Coding 真正适用于 AI Infra 开发，我们实践了文本驱动的 Vibe Coding 方法：通过设计文档将所有关键决策体系化、持久化。 AI Infra 中的资源调度系统，尤其是面向 Agentic RL，正是这样一个理想试验场。该系统是数万行代码的分布式训练系统，面临 GPU 利用率优化的复杂挑战，涉及核心调度逻辑改动。
39010编辑于 2026-01-12
来自专栏存储公众号：王知鱼
【企业级AI infra】IBM Vela系统：AI计算的革新之路
全文概览随着AI模型规模的指数级增长，企业面临计算与存储的双重挑战。IBM通过Vela系统和Granite系列模型，重新定义了AI基础设施的标准。获取AI基础设施设计原则：从硬件配置到自动化运维，构建可扩展的AI平台。关于作者职业生涯的经验幻灯片描述了演讲者在20多年职业生涯中的关键阶段和经历。 AI工作负载对 Infra 的要求幻灯片描述了AI工作负载的不同阶段（数据准备、分布式训练、模型调优、推理）以及每个阶段所需的基础设施类型和时间要求。，尤其是大规模AI模型的计算集群。所以更希望提供轻量化的软件定义能力，可以预想到的是：随着AI与业务系统的深度整合，软件定义的AI能力也将促成厚重的软件层技术栈。
89610编辑于 2025-03-10
腾讯云发布AI infra品牌“腾讯云智算”
9月5日，在腾讯全球数字生态大会上，腾讯云正式发布AI infra品牌“腾讯云智算”。据介绍，腾讯云智算是一个集算存网一体的高性能智算底座，整合了腾讯云高性能计算HCC、高性能网络IHN星脉、高性能云存储、加速框架、容器、向量数据库、智算套件等腾讯云优势产品，能够为AI创新输出性能领先、
2.8K10编辑于 2024-09-05
来自专栏腾讯开源的专栏
开源公告｜AI-Infra-Guard(AI基础设施安全评估工具) 发布
项目简介 AI Infra Guard(AI Infrastructure Guard) 是由混元安全团队-朱雀实验室研发的一款高效、轻量、易用的AI基础设施安全评估工具，专为发现和检测AI系统潜在安全风险而设计安装与使用 ● 安装下载地址: https://github.com/Tencent/AI-Infra-Guard/releases ● 使用单个目标 . /ai-infra-guard -target [IP/域名] 多个目标 ./ai-infra-guard -target [IP/域名] -target [IP/域名] 从文件读取 . /ai-infra-guard -file target.txt AI分析 . /ai-infra-guard -target [IP/域名] -ai -token [混元token] 指纹匹配规则 AI Infra Guard 基于WEB指纹识别组件，指纹规则在data/fingerprints
2.7K10编辑于 2025-02-05
来自专栏GiantPandaCV
AI Infra论文阅读之《在LLM训练中减少激活值内存》
0x4.2.3 Pipline并行 GPipe->1F1B Pipline并行可以读我之前写的这篇paper解读：AI Infra论文阅读之将流水线并行气泡几乎降到零（附基于Meagtron-LM的ZB-H1
1.8K10编辑于 2024-03-26
腾讯混元AI Infra核心技术重磅开源：推理吞吐提升30%
腾讯混元AI Infra团队正式推出开源生产级高性能LLM推理核心算子库 HPC-Ops。 GitHub项目地址：https://github.com/Tencent/hpc-ops在大模型时代，计算效率已成为 AI 应用及发展的关键瓶颈。现有主流算子库主要存在以下痛点：1、使用成本高：主流算子库设计复杂，核心 Kernel 封装深，在其上修改适配成本非常高，除了对代码非常熟悉的开发者，普通的AI 研究者很难在其上适配修改。目前，HPC-Ops 已在 github 开放源码供开发者下载使用，同时腾讯混元infra团队也表示，欢迎行业内的技术实践者提交高价值 PR，参与算子边缘场景优化、教程案例打磨等精准化贡献，共同推动大模型推理技术的边界拓展
75910编辑于 2026-02-07
来自专栏深度学习与python
Agent规模化落地前夜，AI Infra的难题全都暴露了
AI Infra 的能力框架、落地路径与未来趋势。 InfoQ 特别邀请 IDC 高级研究经理张犁、智诊科技产品总监罗龙生、腾讯云异构计算高级产品经理黄阳，解析 AI Infra 的六大核心能力、Agent 规模化的结构性难题、AI Infra 价值闭环衡量标准重估 AI Infra 价值随着 AI 应用进入规模化落地阶段，Agent 也逐步快速渗透到各个行业。 AI Infra 的风险和成本控制明确了衡量 AI Infra 能力的宏观框架，实际落地过程中，企业还需要用可量化的方式，判断 AI Infra 在具体业务场景的价值。 AI Infra 下一阶段的竞争逻辑随着 Agent 在行业中加速落地，AI Infra 的竞争开始从“比技术”走向“比业务价值”。
70110编辑于 2025-11-26
来自专栏vpp开发与应用
VPP 测试框架之infra基础库测试
该系列文章有4篇：VPP 测试框架之官方文档解读VPP 测试框架之使用示例及参数说明VPP Bond单元测试源码分析Vpp 测试框架之infra基础库测试（本文）本文已同步至：个人博客：itwakeup.com 微信公众号：vpp与dpdk研习社（vpp_dpdk_lab）1. infra单元测试在src/vppinfra/test/目录下，有许多通过REGISTER_TEST注册的单元测试，用于对vppinfra 编译 test_infra执行make build生成可执行文件test_infra1.2. 运行参数说明test_infra运行参数说明：perf：携带该参数将运行性能测试，默认为功能测试。 /build-root/build-vpp_debug-native/vpp/bin/test_infra filter toeplitzMultiarch Variant: default------ /build-root/build-vpp_debug-native/vpp/bin/test_infra perfWarming up...Multiarch Variant: default----
47610编辑于 2025-09-14
腾讯云Agent Infra解决方案概要
一、产品定位与核心亮点技术定义：Agent Infra（智能体基础设施）解决方案，核心为Agent Runtime，集成AI运行时（执行引擎）、云沙箱、安全可观测等核心模块。商业差异化卖点：为智能体提供稳定、安全、可弹性伸缩的运行环境，将开发团队从复杂底层基础设施（Infra）问题中解放，专注Agent本身创新。二、产品应用场景受众：开发团队（构建AI Agent）。场景：四大典型场景——Coding Agent、Deep Research、GUI Agent、RL强化学习。
36020编辑于 2026-04-06
腾讯云AI原生云：加速Agent落地的Infra解决方案与量化成效
具体瓶颈包括对AI Infra的三重要求：更快模型推理（模型推理速度、服务启动速度）、更灵活工具集成（工具链适配）、更可靠系统守护（主动发现、故障自愈），传统Infra难以支撑Agent规模化落地。构建贴近Agent的AI原生云Infra 腾讯云推出Agent Infra解决方案，以“更贴近Agent的AI原生云”为核心，包含六大能力模块： Agent运行引擎：会话隔离、Serverless架构量化Agent Infra应用的业务成效方案落地后实现关键指标优化（数据来源：腾讯全球数字生态大会）：模型推理效率：TACO-DIT推理效率提升122%；TKE&qGPU使GPU使用率提升80% 典型客户实践验证方案价值方案获多行业头部客户采用，包括美团、小红书、快手、拼多多、MINIMAX、百川智能（BAICHUAN AI）、XVERSE元象、Sogou搜狗、作业帮、猿辅导、TAL好未来等（原生远程终端（支持脚本生成、命令纠错）；权威认证：获Gartner Generative AI Specialized Cloud Infrastructure亚太第一评级；2024年Frost
44930编辑于 2026-04-19
来自专栏pytorch on java
【Java深度学习】PyTorch On Java 系列课程第五章 10 ：数据集【AI Infra 3.0】
__getitem__ 接受一个索引 idx，获取对应的特征和标签，将它们转换为 PyTorch 张量，并以元组形式返回。这种转换为张量的操作在 __getitem__ 中很常见。
14310编辑于 2026-03-13
AI Infra安全体系构建：应对大模型时代五大核心风险的纵深防御实践
剖析行业战略困境与核心瓶颈 AI技术变革推动2026年金融行业全面迈入大模型应用阶段，传统IT基础设施向AI Infra演进，攻击面急剧扩大。 undefined数据来源：腾讯全球数字生态大会城市峰会主讲人：腾讯云安全解决方案架构师张华构建分层协同的AI安全体系治理体系：MLSecOps驱动全周期管理建立AI安全运营团队（MLSecOps ），统一管理模型训练与部署风险，制定AI攻防演练标准（模拟红蓝对抗场景）；推动行业共享威胁情报，建立AI攻击特征库（如OWASPLM风险Top 10、腾讯AI ATT&CK攻击矩阵）。合规与伦理体系：顶层设计与责任落地依中国《生成式人工智能服务管理暂行办法》、欧盟《人工智能法案》建立风险控制框架与审计标准，定期风险评估；倡导“负责任AI”开发准则，建立AI伦理审查委员会，限制恶意应用、沙箱运行、动态脱敏（静态/动态）构建宿主层、Runtime层、网络层纵深防御，集成科恩三重检测引擎（静态+动态+AI）。
1.3K20编辑于 2026-04-03
腾讯云 Agent Infra 解决方案技术概要
一、产品定位与核心亮点腾讯云 Agent Infra（智能体基础设施）解决方案——Agent Runtime，是为AI智能体（Agent）提供的专用运行环境。其核心是通过集成AI运行时（执行引擎）、云沙箱、安全可观测等模块，构建稳定、安全、可弹性伸缩的智能体基础设施，旨在解决传统云计算环境对AI Agent高自主、长会话、突发负载等特性的不适配问题。 Research 研究型机构、数据分析师需长期记忆管理、复杂上下文关联与检索上下文服务 GUI Agent 自动化操作类应用开发者图形界面交互需求高、环境隔离与权限控制难云沙箱、安全网关 RL强化学习 AI 训练周期长、成本控制难执行引擎、弹性资源调度三、应用框架和功能介绍功能框架 Agent Runtime 包含以下核心模块：云沙箱：提供会话隔离与Serverless运行环境；执行引擎：负责AI
52030编辑于 2026-04-06
来自专栏深度学习与python
AI Infra 工程师们如何应对大模型流水线里的“暗涌”？
那么，Infra 工程师在日常工作中会遇到哪些真实需求与故障类型？开源 Infra 和国产卡适配训练推进过程中，又会遇到哪些难点和挑战呢？充分利用异构硬件特性、实现跨类型资源的智能调度与混部，已成为 AI 基础设施演进的重要方向。在 6 月 27-28 日将于北京举办的 AICon全球人工智能开发与应用大会上，我们特别设置了【AI 基础设施与生态构建】专题。该专题将聚焦 AI 软硬件及生态系统的建设，讨论如何打造高效的 AI 开发与应用环境。综合来看，充分利用异构硬件特性、实现跨类型资源的智能调度与混部，已成为 AI 基础设施演进的重要方向。观众：尹老师选择 SGLang 而非 vLLM 的原因是什么？
63910编辑于 2025-06-26

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

张量广播机制【Ai Infra 3.0】

大数据基建如何迈向 AI Infra？（上）

AI Agent Infra领域的工具图谱

AI Infra论文阅读之LIGHTSEQ（LLM长文本训练的Infra工作）

大数据基建如何迈向 AI Infra？（下）

拥抱 AI 范式革新：如何成为 AI Infra 核心专家

大模型最难的AI Infra，用Vibe Coding搞定

【企业级AI infra】IBM Vela系统：AI计算的革新之路

腾讯云发布AI infra品牌“腾讯云智算”

开源公告｜AI-Infra-Guard(AI基础设施安全评估工具) 发布

AI Infra论文阅读之《在LLM训练中减少激活值内存》

腾讯混元AI Infra核心技术重磅开源：推理吞吐提升30%

Agent规模化落地前夜，AI Infra的难题全都暴露了

VPP 测试框架之infra基础库测试

腾讯云Agent Infra解决方案概要

腾讯云AI原生云：加速Agent落地的Infra解决方案与量化成效

【Java深度学习】PyTorch On Java 系列课程第五章 10 ：数据集【AI Infra 3.0】

AI Infra安全体系构建：应对大模型时代五大核心风险的纵深防御实践

腾讯云 Agent Infra 解决方案技术概要

AI Infra 工程师们如何应对大模型流水线里的“暗涌”？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

张量广播机制【Ai Infra 3.0】

大数据基建如何迈向 AI Infra？（上）

AI Agent Infra领域的工具图谱

AI Infra论文阅读之LIGHTSEQ（LLM长文本训练的Infra工作）

大数据基建如何迈向 AI Infra？（下）

拥抱 AI 范式革新：如何成为 AI Infra 核心专家

大模型最难的AI Infra，用Vibe Coding搞定

【企业级AI infra】IBM Vela系统：AI计算的革新之路

腾讯云发布AI infra品牌“腾讯云智算”

开源公告｜AI-Infra-Guard(AI基础设施安全评估工具) 发布

AI Infra论文阅读之《在LLM训练中减少激活值内存》

腾讯混元AI Infra核心技术重磅开源：推理吞吐提升30%

Agent规模化落地前夜，AI Infra的难题全都暴露了

VPP 测试框架之infra基础库测试

腾讯云Agent Infra解决方案概要

腾讯云AI原生云：加速Agent落地的Infra解决方案与量化成效

【Java深度学习】PyTorch On Java 系列课程 第五章 10 ：数据集【AI Infra 3.0】

AI Infra安全体系构建：应对大模型时代五大核心风险的纵深防御实践

腾讯云 Agent Infra 解决方案技术概要

AI Infra 工程师们如何应对大模型流水线里的“暗涌”？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

【Java深度学习】PyTorch On Java 系列课程第五章 10 ：数据集【AI Infra 3.0】