首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏算法一只狗

    国内AI推理大模型可用吗?

    KIMI推出的数学推理模型k0-math KIMI推出的数学推理模型k0-math,可以直接去到官网体验 在 Kimi 网页版中,选择侧边栏的“眼镜”图标,即可使用基于 k0-math 模型的 Kimi 在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。 说实话,就算我自己打字也觉得这个假期太复杂了,简直像是念咒语一样 那时候中国网友就为了这个调休到底最后休了多少天而计算起来 既然这么难,恰好可以丢给大模型进行问答,看看具备了数学推理能力的k0-math 说实话,就算我自己打字也觉得这个假期太复杂了,简直像是念咒语一样 那时候中国网友就为了这个调休到底最后休了多少天而计算起来 既然这么难,恰好可以丢给大模型进行问答,看看具备了数学推理能力的k0-math 说实话,就算我自己打字也觉得这个假期太复杂了,简直像是念咒语一样 那时候中国网友就为了这个调休到底最后休了多少天而计算起来 既然这么难,恰好可以丢给大模型进行问答,看看具备了数学推理能力的k0-math

    40610编辑于 2025-01-10
  • 来自专栏AIGC新知

    kimi数学版 | k0-math用公式勾勒了一个新的数学世界

    本期将为你带来的是kimi最新的k0-math数学模型能力的使用体验。 实际效果怎么样,一起来体验一下吧。 k0-math的数学能力 第一回合:北京市中考数学真题试卷 首先来一道2024年北京中考数学真题,涉及平面直角坐标系的求解。 k0-math在求解这种复杂的数学问题。 k0-math求解这种复杂的数学问题。 突发奇想,让k0-math帮我证明哥德巴赫猜想。

    1K10编辑于 2024-11-27
  • 来自专栏算法一只狗

    国内AI推理大模型怎么样?

    Kimi的k0-math模型Kimi推出了专注于数学推理的模型k0-math,旨在提升AI在数学领域的推理和解题能力。在一些数学基准测试中,该模型的表现已接近OpenAI的o1-mini模型。 KIMI推出的数学推理模型k0-mathKIMI推出的数学推理模型k0-math,可以直接去到官网体验在 Kimi 网页版中,选择侧边栏的“眼镜”图标,即可使用基于 k0-math 模型的 Kimi 数学版 在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。

    74910编辑于 2025-01-02
  • 来自专栏算法一只狗

    实测一手KIMI推出的数学推理模型k0-math

    KIMI推出的数学推理模型k0-math,终于上线了,可以直接去到官网体验在 Kimi 网页版中,选择侧边栏的“眼镜”图标,即可使用基于 k0-math 模型的 Kimi 数学版,官方称后续会推出手机版 在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。那么它的能力到底怎样呢? 但是很遗憾的是,其他c的取值也还是错的,导致最后得出了错误的答案~不过从上面可以看到,kimi的k0-math模型在数学推理能力上还是很不错。 那我们再来看看o1大模型对这个题目的解答:o1模型和k0-math一样,在前面两个步骤上都答对了,且能得出 |||+−2|<=3 这个答案了,但是和k0-math一样,在穷举法的时候也计算错误了,在计算三个值满足条件的时候 不像o1大模型输出思维链隐藏起来一样,k0-math反而更加显性的输出自己的思考思维链,这更能说明其具有独特的思考个性。以前的大模型就像一个搜索器,你问啥它就搜啥。

    79420编辑于 2024-11-29
  • 来自专栏AIGC新知

    Kimi 发布视觉思考模型 k1,并且悄悄上线了两大语音通话场景能力

    从kimi发布k0-math,到今天发布视觉思考模型k1,kimi逐渐专精于基础科学领域的模型能力提升(AI For Science)。 kimi数学版 | k0-math用公式勾勒了一个新的数学世界 当时的k0-math数学模型能力评估在多个数学基准评测中位居前列。 在中考ZHONGKAO、高考GAOKAO、考研KAOYAN以及包含入门级别竞赛题的 MATH 等数学基准测试中,k0-math 超过了 o1-mini 和 o1-preview,位居榜首。 从文本题到几何图形题解题能力的飞跃提升 前不久更新的k0-math数学模型,只支持latex文本输入,无法输入几何数学题目,应对几何图像题目毫无头绪。

    1K10编辑于 2024-12-20
  • 来自专栏AIGC新知

    Kimi一周年 | 盘点kimi一年内做了那些事

    六、Kimi发布最新数学模型k0-math Kimi的最新数学模型k0-math,对标全球领先的OpenAI o1系列模型,主打深入思考能力。 以AIME竞赛题目为例,k0-math通过多次探索和试错后,最终得出正确结果。

    98810编辑于 2024-11-18
  • 来自专栏算法一只狗

    国内热门推理大模型指南

    KIMI推出的数学推理模型k0-mathKIMI推出的数学推理模型k0-math,终于上线了,可以直接去到官网体验在 Kimi 网页版中,选择侧边栏的“眼镜”图标,即可使用基于 k0-math 模型的 在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。那么它的能力到底怎样呢? 但是很遗憾的是,其他c的取值也还是错的,导致最后得出了错误的答案~不过从上面可以看到,kimi的k0-math模型在数学推理能力上还是很不错。 那我们再来看看o1大模型对这个题目的解答:o1模型和k0-math一样,在前面两个步骤上都答对了,且能得出 |+−2|<=3 这个答案了,但是和k0-math一样,在穷举法的时候也计算错误了,在计算三个值满足条件的时候 不像o1大模型输出思维链隐藏起来一样,k0-math反而更加显性的输出自己的思考思维链,这更能说明其具有独特的思考个性。以前的大模型就像一个搜索器,你问啥它就搜啥。

    82710编辑于 2024-12-24
  • 来自专栏AIGC新知

    扣子AI应用初体验 | 我用扣子搭建了一个全学科作业批改助手

    模型的数学推理能力是否足够强大,是gpt-4o还是k0-math? 大厂都在卷AI教育应用(比如字节的豆包爱学),我们应不应该做AI教育应用?

    2.8K11编辑于 2024-12-20
  • 来自专栏算法一只狗

    o1推理大模型到底有多强?

    的六个小球,不放回的抽三次,m表示前两次号码的平均值,n表示前三次号码的平均值,则m和n的差值不超过0.5的概率是多少先来看看正确的答案是:7/15这道题目,其实我测试过很多推理大模型,比如KIMI最新的K0

    22610编辑于 2024-12-27
  • 来自专栏算法一只狗

    OpenAI 最强推理模型 o3 发布,对哪个领域最有用?

    例如,Kimi 最新推出的 k0-math,其在 AIME 考试中的得分仅为 50,而 o3 已经将这一成绩提升至 96.7,几乎接近满分的状态。这种对比无疑突显了 o3 在数学推理领域的卓越性能。

    49310编辑于 2024-12-31
  • 人工智能太卷了!o3模型让99.9%程序员汗颜,未来谁还能幸存?

    我们先来对比国内的推理大模型,比如Kimi最新推出的k0-math,可以发现它在AIME考试上也仅仅得分50,o3已经把它干到了96.7,接近满分的状态了。

    30500编辑于 2025-01-20
  • 来自专栏好事花生~

    Python系列(六):Python 的数据结构

    好事发生今天推荐的文章【实测一手KIMI推出的数学推理模型k0-math】,作者【算法一只狗】,二话不说上链接:https://cloud.tencent.com/developer/article/2470895

    27600编辑于 2024-11-29
  • OpenAI o1不太行?国产模型 PK OpenAI o1,高难度数学和算法竞赛能力究竟谁更胜一筹?

    分析最新发布的推理类模型之间的差异以及它们各自的优势所在,其中包括OpenAI的o1、上海人工智能实验室的InternThinker-Alpha、DeepSeek的DeepSeek-R1-Lite、月之暗面 k0 例如,DeepSeek-R1-Lite在完成中文试题时,推理部分会存在中英夹杂的情况,K0-math会出现中文试题全英回答。

    46010编辑于 2025-03-21
  • 来自专栏算法一只狗

    OpenAI的o1大模型满血版终于发布,其效果如何?

    的六个小球,不放回的抽三次,m表示前两次号码的平均值,n表示前三次号码的平均值,则m和n的差值不超过0.5的概率是多少 先来看看正确的答案是:7/15 这道题目,其实我测试过很多推理大模型,比如KIMI最新的K0

    43710编辑于 2024-12-07
  • 来自专栏算法一只狗

    当你以为OpenAI要跌落神坛时,他们发布了最强推理大模型o3

    我们先来对比国内的推理大模型,比如Kimi最新推出的k0-math,可以发现它在AIME考试上也仅仅得分50,o3已经把它干到了96.7,接近满分的状态了。

    73310编辑于 2024-12-22
  • 来自专栏新智元

    OpenAI最大秘密,竟被中国研究者破解?复旦等惊人揭秘o1路线图

    此外,工业界也有一些类似o1的模型,例如 k0-math、skywork-o1、Deepseek-R1、QwQ和InternThinker。 g1:这项研究可能是最早尝试重新实现o1的项目。

    18000编辑于 2025-02-15
领券