首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器之心

    Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理

    自那之后已过去数十年,AI 的中心已经从符号方法转移到了机器学习,并出现了一个新领域:用于数学的统计式人工智能(AI4Math)。 这是一个非常吸引人的领域。 另外,数学在定量学科中起着基础性作用,因此 AI4Math 有可能给科学、工程和其他领域的人工智能带来革新。 AI4Math 的重要性吸引了大量研究者,他们开始使用来自自然语言处理(NLP)领域的技术来开发数学 LLM。 AI4Math 与形式化数学推理 数学推理是 AI 领域的前沿研究方向。本节首先将介绍 AI4Math 的非形式化方法及其局限性。 然后将介绍在推进 AI4Math 方面,形式化数学推理是一条有希望的道路。这一节涵盖的内容包括: 当前最佳的数学 LLM 以及它们的局限性,目前的难题包括数据稀缺、缺乏验证正确性的手段。

    44510编辑于 2025-02-15
  • 来自专栏新智元

    推理正确率下降65.5%!斯坦福、MIT等用「不等式」拷问AI逻辑极限

    论文链接:https://arxiv.org/abs/2506.07927 官方网站:ineqmath.github.io 数据集链接:https://huggingface.co/datasets/AI4Math /IneqMath 代码链接:https://github.com/lupantech/ineqmath 在线排行榜:https://huggingface.co/spaces/AI4Math/IneqMath-Leaderboard 排行榜链接:https://huggingface.co/spaces/AI4Math/IneqMath-Leaderboard 排行榜提供多种筛选功能,让您轻松挑选感兴趣的模型类别;只需点击表头,即可按照任意字段自定义排序

    23110编辑于 2025-06-24
  • 来自专栏机器之心

    大模型为何难成为「数学家」?斯坦福等揭示严谨证明中的结构性弱点

    arxiv.org/abs/2506.07927 ️ 代码库:https://github.com/lupantech/ineqmath 数据集:https://huggingface.co/datasets/AI4Math /IneqMath 排行榜:https://huggingface.co/spaces/AI4Math/IneqMath-Leaderboard 数据集可视化展示:https://ineqmath.github.io 欢迎访问:https://huggingface.co/spaces/AI4Math/IneqMath-Leaderboard 了解详情,并提交你的挑战结果!

    28710编辑于 2025-06-23
  • 人工智能学习路线图

    结合经典牛顿力学,理论力学,分析力学(最小作用量原理,最速下降线),还有就是要有玩游戏特别是类似“黑神话悟空”和STEAM的经验,最好是了解CVPR论文)AI4S (适合物理,化学,材料,生物,医学背景的学生去搞,AI4math

    19210编辑于 2026-02-26
  • 来自专栏机器之心

    华为诺亚方舟实验室招聘|2023届毕业生,与我们一起成为AI时代的航海家!

    基于机器学习的建模与仿真技术 AI基础理论研究方向 AI基础理论,包括OOD泛化理论、深度学习理论、自监督学习理论 AI前沿技术,包括生成式AI、数据压缩、语义通信 可信AI,包括公平性、可解释性和隐私保护 优化理论,AI4Math ,AI4Science AI基础理论,包括OOD泛化理论、深度学习理论、自监督学习理论 AI前沿技术,包括生成式AI、数据压缩、语义通信 可信AI,包括公平性、可解释性和隐私保护 优化理论,AI4Math

    4.1K20编辑于 2022-06-17
  • 来自专栏CreateAMind

    人工智能在数学领域的应用:进展、挑战与展望

    在本综述中,我们对 AI4Math 提供了系统性的概述,强调其主要目标是开发人工智能模型以支持数学研究。 这一融合催生了跨学科领域“人工智能用于数学”(AI for Mathematics,简称 AI4Math)。 尽管这些计算方面的进展构成了更广泛 AI4Math 图景中的重要支柱,但本综述将聚焦于数学推理——包括数学发现、形式化与证明。 对 AI4Math 计算方面感兴趣的读者可参考其他综合性综述文献[6, 17, 21, 38, 70, 130]。 本文对 AI4Math 的进展、挑战与前景提供系统性概述。 从启发式到专家常规流程:尽管独立的 LLM 是强大的推理引擎,但 AI4Math 的未来在于设计能模拟专业数学家复杂工作流的智能体系统。

    8610编辑于 2026-03-11
  • 来自专栏机器之心

    MLLM真能看懂数学吗?MathVerse来了次摸底测评,放出当天登热榜

    mathverse-cuhk.github.io/ 代码:https://github.com/ZrrSkywalker/MathVerse 数据集:https://huggingface.co/datasets/AI4Math

    36510编辑于 2024-04-19
  • 来自专栏机器之心

    7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!

    随着 DeepSeek-R1 的流行与 AI4Math 研究的深入,大模型在辅助形式化证明写作方面的需求日益增长。

    48610编辑于 2025-03-10
  • 来自专栏量子位

    大模型版“5年高考3年模拟”来了!6141道数学题,还是多模态的那种|微软&UCLA&UW联合出品

    ://arxiv.org/abs/2310.02255 项目地址:https://mathvista.github.io/ HF数据集:https://huggingface.co/datasets/AI4Math

    52910编辑于 2023-12-05
  • 来自专栏机器之心

    GPT-4V数学推理如何?微软发布MathVista基准,评测报告长达112页

    //arxiv.org/abs/2310.02255 项目地址:https://mathvista.github.io/ HF 数据集:https://huggingface.co/datasets/AI4Math

    58430编辑于 2023-11-14
领券