首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器之心

    GPT-5、Grok 4、o3 Pro都零分,史上最难AI评测基准换它了

    在深层难度上,Grok 4、Gemini-Pro、o3-Pro、Opus-4 等模型最多只能解出 1/100 的题目;GPT-5 Pro 表现相对更好,但也只解出了 4/100。

    41810编辑于 2025-08-24
  • Multi-Agent系统Harness Engineering架构的思考与实践

    从2025年下半年gpt-5,opus-4系列开始,前沿模型迭代加速,agentic能力成为了模型发布时重点突出的一等公民。

    4.2K42编辑于 2026-03-13
领券