首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 我让10个大模型又参加了完整版数学高考,第一名居然是它。。。

    那我想,不如再把模型补上,加上全缺失的智谱Z1、Kimi1.5、文心X1,(不带Claude 4,封号斗罗,我恨他),再做一个,完整的满血版的数学高考,让大家最直观的,感受一下这些模型的数学能力水平。

    20300编辑于 2025-06-11
  • 来自专栏大模型系列

    万字长文详解Kimi:月之暗面的超长上下文AI引擎Moonshot

    1.3持续进化的推理能力从早期的Kimi1.5到最新的Kimi2.5,其逻辑推理、数学计算和代码生成能力得到了显著增强。

    51410编辑于 2026-05-10
  • 来自专栏前端专精

    DeepSeek:全栈开发者视角下的AI革命者

    当GitHub上突然涌现出基于DeepSeek-MoE架构的Kimi1.5蒸馏模型时,整个社区意识到:这次的技术民主化浪潮不同以往。

    47710编辑于 2025-02-05
  • 来自专栏小七的各种胡思乱想

    ​解密prompt系列48. DeepSeek R1 & Kimi 1.5长思维链 - RL Scaling

    春节前DeepSeek R1和Kimi1.5炸翻天了,之前大家推测的O1的实现路径,多数都集中在MCTS推理优化,以及STaR等样本自优化方案等等,结果DeepSeek和Kiim直接出手揭示了reasoning

    1.6K21编辑于 2025-02-07
  • 来自专栏NLP/KG

    LLM推理:如何通过PRMs和MCTS提升大型语言模型的推理能力

    这可能也是 DeepSeek-R1 和 Kimi1.5 等新一代推理模型没有采用 PRM 的原因。 2. PRM 和 MCTS 的缺点 这方面 DeepSeek-R1 和 kimi1.5 的论文已经说得很情况了。

    97110编辑于 2025-04-26
  • 来自专栏周末程序猿

    机器学习|从0开发大模型之复现DeepSeek的aha moment

    基于答案的长度做余弦,分为正确答案最大长度,正确答案最小长度,错误答案最大长度,错误答案最小长度 repetition_penalty_reward:计算 N-gram 重复奖励 length_reward:参考kimi1.5

    92300编辑于 2025-02-27
领券