搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

我让10个大模型又参加了完整版数学高考，第一名居然是它。。。
那我想，不如再把模型补上，加上全缺失的智谱Z1、Kimi1.5、文心X1，（不带Claude 4，封号斗罗，我恨他），再做一个，完整的满血版的数学高考，让大家最直观的，感受一下这些模型的数学能力水平。
20300编辑于 2025-06-11
来自专栏大模型系列
万字长文详解Kimi：月之暗面的超长上下文AI引擎Moonshot
1.3持续进化的推理能力从早期的Kimi1.5到最新的Kimi2.5，其逻辑推理、数学计算和代码生成能力得到了显著增强。
51410编辑于 2026-05-10
来自专栏前端专精
DeepSeek：全栈开发者视角下的AI革命者
当GitHub上突然涌现出基于DeepSeek-MoE架构的Kimi1.5蒸馏模型时，整个社区意识到：这次的技术民主化浪潮不同以往。
47710编辑于 2025-02-05
来自专栏小七的各种胡思乱想
解密prompt系列48. DeepSeek R1 & Kimi 1.5长思维链 - RL Scaling
春节前DeepSeek R1和Kimi1.5炸翻天了，之前大家推测的O1的实现路径，多数都集中在MCTS推理优化，以及STaR等样本自优化方案等等，结果DeepSeek和Kiim直接出手揭示了reasoning
1.6K21编辑于 2025-02-07
来自专栏NLP/KG
LLM推理：如何通过PRMs和MCTS提升大型语言模型的推理能力
这可能也是 DeepSeek-R1 和 Kimi1.5 等新一代推理模型没有采用 PRM 的原因。 2. PRM 和 MCTS 的缺点这方面 DeepSeek-R1 和 kimi1.5 的论文已经说得很情况了。
97110编辑于 2025-04-26
来自专栏周末程序猿
机器学习|从0开发大模型之复现DeepSeek的aha moment
基于答案的长度做余弦，分为正确答案最大长度，正确答案最小长度，错误答案最大长度，错误答案最小长度 repetition_penalty_reward：计算 N-gram 重复奖励 length_reward：参考kimi1.5
92300编辑于 2025-02-27

我让10个大模型又参加了完整版数学高考，第一名居然是它。。。

万字长文详解Kimi：月之暗面的超长上下文AI引擎Moonshot

DeepSeek：全栈开发者视角下的AI革命者

解密prompt系列48. DeepSeek R1 & Kimi 1.5长思维链 - RL Scaling

LLM推理：如何通过PRMs和MCTS提升大型语言模型的推理能力

机器学习|从0开发大模型之复现DeepSeek的aha moment

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

我让10个大模型又参加了完整版数学高考，第一名居然是它。。。

万字长文详解Kimi：月之暗面的超长上下文AI引擎Moonshot

DeepSeek：全栈开发者视角下的AI革命者

​解密prompt系列48. DeepSeek R1 & Kimi 1.5长思维链 - RL Scaling

LLM推理：如何通过PRMs和MCTS提升大型语言模型的推理能力

机器学习|从0开发大模型之复现DeepSeek的aha moment

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

解密prompt系列48. DeepSeek R1 & Kimi 1.5长思维链 - RL Scaling