本周人工智能科技简报（2026年3月10日 - 3月17日）

机器学习之禅

发布于 2026-04-09 17:31:14

2900

如果你感觉最近 AI 圈有点“看不过来”，
那不是你的问题，而是变化真的太快了。
模型在升级，Agent 在进化，
开源生态和产业边界正在重新排列。

我们只做一件事：
替你筛掉 90% 的无效信息，只留下真正值得你花时间理解的那 10%。

过去一周（3 月 3 日至 3 月 10 日），人工智能与科技领域继续快速发展。从大模型升级、最新论文到热门开源项目与新工具，以下简报摘录了值得关注的动态。

过去一周，全球大模型厂商、研究机构和机器人公司密集发布产品、论文与开源项目。以下为你梳理各方向的亮点动态。

1️⃣ 大模型最新动态

【标题】：LeCun 新创公司 AMI 募得 10.3 亿美元，聚焦世界模型

内容简介：前 Meta 首席 AI 科学家 Yann LeCun 成立的新公司 Advanced Machine Intelligence（AMI）完成 10.3 亿美元融资，投后估值 35 亿美元，致力于开发基于“世界模型”的类人 AI 系统，强调推理与常识。

亮点分析：LeCun 指出当前 LLM 缺乏长期规划能力，AMI 的模型通过构建对环境的内部表示来实现推理与规划，首批应用将针对制造、航空及生物医疗等复杂行业。

【标题】：Meta 延迟发布 Avocado 模型并考虑临时授权 Gemini

内容简介：知情人士称 Meta 原定 3 月发布的 Avocado 模型推迟至 5 月以后。该模型性能介于谷歌 Gemini 2.5 与 3.0 之间，表现未达预期；公司正考虑短期使用谷歌 Gemini 模型支持自家 AI 产品。

亮点分析：Avocado 被视为 Llama 系列的升级，延期显示 Meta 在通用智能竞赛中仍面临硬件和算法挑战，同时与竞争对手合作可能加快应用落地。

【标题】：微软发布 Copilot Cowork：面向企业的任务代理能力

内容简介：微软在 3 月初推出 Copilot Cowork 功能，赋予 Microsoft 365 Copilot 长时“代理”能力。用户将任务交给 Cowork 后，系统会读取 Outlook、Teams 等“Work IQ”信号制定计划，后台运行并在关键节点要求用户批准。Cowork 能自动整理会议议程、清理日程、生成市场调研报告等。

亮点分析：Cowork 把 LLM 与工作流结合，强调安全合规和隐私，体现企业 AI 向真正自动协作迈进。功能目前处于预览阶段，将于 3 月底通过 Frontier 计划开放更多用户。

【标题】：Anthropic 推出 Claude Marketplace，为企业引入生态

内容简介：Anthropic 于 3 月初上线 Claude Marketplace，为企业提供围绕 Claude 系列模型的第三方软件商店。初期合作伙伴包括 Snowflake、GitLab、Harvey AI 等，企业可用现有 Anthropic 支出购买这些服务，Anthropic 不收取交易佣金。

亮点分析：Marketplace 降低了大型模型生态的采购与集成门槛，鼓励更多 ISV 在 Claude 平台上开发工具，增强企业模型的垂直能力。

【标题】：NVIDIA GTC 2026：发布 Vera Rubin 平台与 Feynman 架构

内容简介：在 3 月 16 日的 GTC 2026 大会，英伟达 CEO 黄仁勋宣布面向“代理式 AI”推出 Vera Rubin 平台，包括 7 款芯片与 5 个机柜级系统，以及超级计算机，可用于部署自主代理。黄仁勋还预告下一代 Feynman 架构及 Rosa CPU、LP40 LPU 等组件，并宣布支持开源 OpenClaw 项目与新运行时 OpenShell 。

亮点分析：硬件和系统的迭代为大型模型提供更高吞吐量和更低延迟，同时强调开放生态和“代理电脑”理念，标志着芯片巨头开始为自主代理设计专用平台。

【标题】：OpenAI 内部计划缩减边缘项目，聚焦代码和企业用户

内容简介：华尔街日报报道称，OpenAI 高层正制定战略调整，计划削减边缘项目，集中资源服务编码及企业客户。应用主管 Fidji Simo 在员工大会上透露，CEO Sam Altman 和研究负责人 Mark Chen 正审视需要削减的领域，相关通知将在未来几周内发出。

亮点分析：这一动向表明 OpenAI 正从追求产品多元化转向盈利模式明确的“企业软件”赛道，或将影响其实验性应用的推进速度。

2️⃣ 最新论文速递

【标题】：Humanity’s Last Exam：一套超难 AI 基准测试

研究机构/作者：近千名学者合作

创新点：论文提出 2,500 道覆盖多个专业领域的问题，避免现有模型可轻松解决，利用极少样本作为评估基准。早期测试显示 GPT‑4o 平均得分仅 2.7%，Claude 3.5 Sonnet 约 4.1%，最强模型 Gemini 3.1 Pro 和 Claude Opus 4.6 也仅达 40~50% 。

应用价值：HLE 提供长期有效的高难度测试，可衡量模型真实知识与推理水平并指导未来模型训练。

【标题】：LiveIdeaBench：评估 LLM 科研创新思维能力

研究机构/作者：Nature Communications 预印本

创新点：该基准以单个关键词触发模型生成科研创意，评价原创性、可行性、流畅性、灵活度和清晰度，涵盖 22 个领域共 1,180 个关键词。研究发现创意能力与现有通用智能分数不相关，一些小模型的创意表现接近大型模型。

应用价值：LiveIdeaBench 可用于培养模型的创新思维，帮助科研人员筛选具潜力的学术创意并评估模型在特定领域的发散思考能力。

【标题】：MARL‑RAGDoc：多模态检索增强问答的层级多智能体框架

研究机构/作者：华中科技大学等团队

创新点：该框架引入顶层协调代理动态设定检索权重和深度，底层文本、图像、表格代理分别执行证据选择。实验表明在工业文档多模态问答任务上，该模型检索准确率与推理能力优于传统方法。

应用价值：为需要处理复杂工业文档的企业提供高效可靠的检索与问答方案，可推广至制造及能源领域的技术文档分析。

【标题】：ManuRAG：制造行业多模态检索生成框架

研究机构/作者：同济大学等

创新点：ManuRAG 在文本、图像、公式及表格等多模态资料上统一检索，结合检索结果生成可信、可解释的答案，在 1,515 对制造问答数据集上大幅提升准确率。

应用价值：为制造领域专家提供跨模态知识检索工具，提升技术支持与培训效率。

【标题】：BO‑MoE：基于贝叶斯优化的混合专家模型用于短期交通预测

研究机构/作者：上海交通大学等

创新点：提出混合专家架构并利用贝叶斯优化调整各子模型超参数，在多个交通流数据集上相较 TCN 等基线模型显著降低预测误差。

应用价值：为城市交通管理提供更精确的流量预测，尤其适用于智能交通系统与调度优化。

3️⃣ 热门开源项目推荐

【项目名称】：OpenClaw v2026.1.30

核心功能：社区维护的本地 AI 助理框架。本次更新提供 Bash/Zsh/Powershell 自动补全，免费接入 Kimi K2.5 与 Kimi Coding 模型，修复 Telegram 插件并强调安全性。

推荐理由：无需 API 调用即可运行本地 agent，支持自定义技能与多模态模型，是开发者和个人用户探索本地 AI 助理的理想选择。

【项目名称】：DuClaw（零部署版 OpenClaw 服务）

核心功能：百度智能云推出的网页版 OpenClaw，无需部署服务器即可使用。内置百度搜索、百科、学术等服务，支持 DeepSeek、Kimi‑K2.5、GLM‑5、MiniMax‑M2.5 等模型切换。

推荐理由：大幅降低个人和中小企业使用 AI 助理的门槛，结合百度生态提供稳定的信息检索与工具调用。

【项目名称】：OpenJarvis

核心功能：斯坦福 Scaling Intelligence Lab 发布的本地优先 AI 代理框架，以 Intelligence（模型层）、Engine（推理运行时）、Agents（行为层）、Tools & Memory、Learning 五个原语组织，实现端侧模型推理与工具调用。

推荐理由：强调边缘计算与隐私，具有模块化和基准评测体系，对希望在本地训练和运行个人助理的开发者极具参考价值。

【项目名称】：MiroFish

核心功能：北京高校学生开发的开源群体智能引擎，可生成数千个具有独立人格的代理并观察其群体行为，被用于构建数字人交易机器人并取得盈利。

推荐理由：突破了传统任务管控型 agent 的思路，以自组织机制模拟社会行为，激发了投资者 410 万美元的孵化计划，适合研究复杂系统和自适应经济模型。

【项目名称】：PostHog Prompt Playground

核心功能：开发者工具，允许团队在不修改生产代码的情况下同时比较不同模型、系统提示和用户消息，帮助评估提示效果并估算 token 成本。

推荐理由：使产品和运营团队能快速迭代提示并监控模型表现，是构建 A/B 测试与成本评估的重要工具。

【项目名称】：Perplexity Computer iOS 版

核心功能：Perplexity 推出的 iOS 版 Computer 助理，使用户在手机与桌面之间同步任务，可在移动端启动问题调研并在桌面续写，同时针对小屏幕优化交互体验。

推荐理由：跨设备无缝衔接彰显“持续任务”设计，对重度信息收集者和研究人员颇具吸引力。

【项目名称】：Notion Task Triager Agent

核心功能：Notion 面向企业推出的自动任务分派 Agent，可根据预设规则对新任务自动标记、优先级排序并分配给适当员工，与 Notion 数据库无缝集成。

推荐理由：帮助团队解决工作流管理瓶颈，确保任务在领导离线时仍能顺利推进，是轻量级的企业 AI 助理。

4️⃣ AI 工具新品与升级

【工具名称】：Copilot Cowork

用途场景：内嵌于 Microsoft 365 的智能助理，代理执行日程清理、会议准备、市场调研、文档生成等任务。

主要亮点：利用“Work IQ”信号分析用户行为形成计划，具备后台持续运行及用户审阅机制，实现企业级安全保障。

【工具名称】：PostHog Prompt Playground

用途场景：为产品经理和开发团队提供多模型、多提示对比测试环境，不需改动生产代码即可查看输出差异。

主要亮点：集成 token 费用估算和提示观察仪表盘，支持快速迭代和决策。

【工具名称】：Perplexity Computer iOS 版

用途场景：移动端持续知识助手，支持跨设备同步任务，在 iPhone 上启动搜索或文档撰写，并在桌面继续处理。

主要亮点：任务持久化和小屏幕优化让用户随时调用复杂研究工具，形成完整的知识工作流程。

【工具名称】：Notion Task Triager Agent

用途场景：自动分派团队任务，适用于初创公司、项目组等需要高效协调的场景。

主要亮点：依托 Notion 平台进行标记、优先级和分派，确保任务在管理者缺席时顺利流转。

【工具名称】：OpenClaw v2026.1.30

用途场景：个人或开发者本地运行 AI 助理，支持在终端调用多种大模型和工具。

主要亮点：新增 shell 补全与免费模型接入，降低使用门槛；修复通信插件，强调安全性。

5️⃣ Agent 技术与框架进展

【内容标题】：WorkBuddy —— 腾讯推出的本地企业级 AI 助理

应用案例 / 技术升级：WorkBuddy 是腾讯面向办公场景推出的桌面端 AI 代理，可直接安装本地运行。它支持超过 20 种技能包和 Model Context Protocol（MCP），可切换鸿雁、DeepSeek、GLM、Kimi、MiniMax 等大模型，完成信息检索、报告生成、邮件编写等任务。

价值点评：WorkBuddy 不依赖云端，强调数据安全与私有部署，适合需要保密的企业场景。兼容 OpenClaw 技能生态，为国产 agent 架构提供更多选择。

【内容标题】：腾讯云成为 OpenClaw 社区赞助商，提供一键部署

应用案例 / 技术升级：OpenClaw 创始人宣布腾讯云与腾讯 AI 成为社区赞助商。双方此前因爬虫争议发生摩擦，此次合作意味着矛盾化解。腾讯云将提供轻量级应用服务器和 17 座城市的免费安装计划，并提供企业级安全沙箱和权限管理。

价值点评：该合作降低了 OpenClaw 在企业与个人端的部署成本，强化商业生态，也表明大型云厂商开始支持开源 agent 项目。

【内容标题】：OpenJarvis 框架推进本地化智能代理

应用案例 / 技术升级：OpenJarvis 由斯坦福团队推出，架构包括模型层（Intelligence）、推理引擎、行为代理和学习模块。作者强调端侧模型满足 88.7% 聊天与推理任务，体系支持自定义工具和记忆管理。

价值点评：该框架为个人助理的本地部署提供了清晰架构和评测基准，引导开发者关注隐私与持续学习。

6️⃣ 自动驾驶 / 机器人动态

【事件/产品】：特斯拉第三代人形机器人在 AWE 2026 亮相

核心内容：AWE 2026 在上海开幕，特斯拉展示了即将量产的第三代人形机器人。这是公司第一款针对大规模生产设计的模型，计划 2026 年底开始量产，长期产能目标达百万台，单价控制在 2 万美元以内。机器人使用与自动驾驶同源的视觉神经网络技术，可通过观察人类学习复杂任务。

行业意义：特斯拉将制造经验与机器人领域结合，推动通用机器人产业化，为未来家庭与工业自动化奠定基础。

【事件/产品】：人形机器人半程马拉松测试在北京举行

核心内容：北京将于 4 月 19 日举办 2026 人形机器人半程马拉松。为测试赛道与系统，组织方于 3 月 14 日晚至 15 日凌晨进行了试跑，来自企业与高校的 20 余支队伍参加。

行业意义：全球首个人形机器人半程马拉松展示机器人稳定性和续航能力，助推人机协作及机器人运动控制研究。

【事件/产品】：特斯拉 Optimus 机器人展示与自复制愿景

核心内容：Teslarati 报道指出，特斯拉在上海 AWE 展上演示了 Optimus 机器人，其灵活的手部动作引人注目。公司计划年底在弗里蒙特工厂试产，年产百万台，并在德州超级工厂扩产至千万台；埃隆·马斯克曾提出让机器人实现自我复制以构建太空文明。

行业意义：量产机器人并面向自复制的远景构想，显示特斯拉试图将机器人推向大众市场并打造“范·诺依曼”式自繁殖系统，对未来制造与探索意义重大。

以上为过去一周人工智能科技领域的重点动态，涵盖大模型发布与升级、学术论文、开源项目、工具新品、Agent 框架案例以及边缘 AI 应用。希望本期简报能为 AI 爱好者、科技从业者与产品经理提供有价值的参考。

点个【在看】，
或把它转给那个也在研究 AI 的朋友，
我们下期继续。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-03-18，如有侵权请联系 cloudcommunity@tencent.com 删除

工具

本文分享自机器学习之禅微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度