首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 每周AI论文速递(260209-260213)

    该模型通过交错的3:1滑动窗口/全注意力机制以及多令牌预测 (Multi-Token Prediction, MTP-3) 进行优化,旨在降低多轮智能体交互的延迟和成本。

    21110编辑于 2026-03-02
领券